近期,YouTube 知名頻道 Compusemble 對英偉達 RTX 神經紋理壓縮(NTC)技術進行了深入基準測試,揭示了該技術在3D工作負載中的卓越表現。測試數據表明,與傳統紋理壓縮技術相比,RTX NTC 能夠將紋理內存大小驚人地降低96%,展現了其革命性的壓縮效率。
在測試中,Compusemble 使用了 RTX 4090 顯卡,并針對1440p和4K兩種分辨率進行了對比。測試包含兩種模式:“NTC 轉碼為 BCn”和“樣本推理”。前者在加載時將紋理轉換為 BCn 格式,后者則僅對渲染特定視圖所需的單個紋理元素進行解壓縮,從而進一步縮減內存占用。
在1440p分辨率下,當啟用 DLSS 超分辨率功能時,“NTC 轉碼為 BCn”模式成功將測試應用的紋理內存占用從272MB削減至98MB,降幅達64%。而“樣本推理”模式更是將紋理大小壓縮至僅11.37MB,與非神經壓縮技術相比,內存占用減少了95.8%,與先前的神經壓縮模式相比也減少了88%。
盡管 RTX NTC 技術帶來了顯著的內存節省,但其對性能的影響也不容忽視。特別是在“樣本推理”模式下,性能下降較為明顯。然而,值得注意的是,測試使用的是上一代 RTX 4090 顯卡,隨著新一代 RTX 5090 顯卡的推出,性能損失可能會有所緩解。
在“NTC 轉碼為 BCn”模式下,平均幀率與未啟用 NTC 時幾乎持平。但在“樣本推理”模式下,性能下降顯著,FPS 從1600多幀的中等水平降至1500多幀,1%低幀率更是降至840幀左右。不過,當使用 TAA 抗鋸齒而非 DLSS 超分辨率時,雖然內存減少情況相同,但 GPU 性能表現卻有所不同,三種模式下的運行速度均明顯快于 DLSS,FPS接近2000幀。
將分辨率提升至4K后,性能下降更為顯著。在啟用 DLSS 的情況下,“NTC 轉碼為 BCn”模式的平均 FPS 約為1100幀,“樣本推理”模式則略低于1000幀,兩種模式的1%低幀率均在500幀左右。而關閉 DLSS,改用原生分辨率搭配 TAA 抗鋸齒時,“NTC 轉碼為 BCn”模式的平均 FPS 提升至約1700幀,“樣本推理”模式則約為1500幀。
Compusemble 還在4K分辨率下,針對“樣本推理”模式測試了協同向量功能。啟用協同向量時,平均幀率保持在1500幀左右;而關閉協同向量時,平均 FPS 急劇下降至略低于650幀。1%低幀率在啟用協同向量時也明顯高于關閉時的表現。
RTX 神經紋理壓縮技術作為英偉達近年來開發的新技術,利用現代 GPU 中的張量核心進行紋理壓縮,徹底顛覆了自1990年代以來一直沿用的傳統塊截斷編碼技術。RTX NTC 能夠支持比當前 GPU 運行的紋理分辨率高出四倍的紋理,為3D應用和游戲帶來了全新的可能。
盡管 RTX NTC 技術目前仍處于測試階段,尚未確定發布日期,但其前景已備受矚目。英偉達官方確認,該技術的最低 GPU 要求為 RTX 20 系列顯卡,并且已在 GTX 10 系列顯卡、AMD Radeon RX 6000 系列顯卡以及 Arc A 系列顯卡上得到驗證。這意味著未來 RTX NTC 技術有望在非 RTX 顯卡甚至游戲主機上得到廣泛應用,為玩家和開發者帶來更加高效的紋理處理體驗。