
面對記憶體供應如此嚴峻的大環境,NVIDIA 執行長黃仁勳於 COMPUTEX 2026 期間 GTC Taipei 2026 主題演講會後向媒體解釋,GeForce GPU 與新發表的 RTX Spark 超級晶片,都透過演算法最佳化,降低對實體記憶體的依賴。
黃仁勳解釋道,改善記憶體用量的最佳方法之一,就是使用極低精確度的算法。
以 RTX Spark 為例,NVIDIA 推出了一種名為 NVFP4 的新格式,它不僅僅是 4 位元浮點數,更是一個完整的張量/數學結構,能夠以低至 4-bit 的精確度進行處理,也能視情況在 4-bit、8-bit、16-bit 甚至 32-bit 間動態切換,並盡可能地使用 4-bit,藉此有效壓縮放入記憶體的神經網路。
結果就是,在只有 128GB 的環境下,依舊能讓參數容量翻倍。因此精度降低的 Tensor Core 確實成為改善記憶體用量最佳策略。
另一方面,GeForce GPU 大家熟知的 DLSS 技術,就是先透過降低原生渲染解析度,以降低記憶體使用量,再透過 AI 演算法擴張成高解度畫面。
黃仁勳還提到,NVIDIA 運用神經網路紋理壓縮取代傳統區塊壓縮,讓記憶體占用量縮減至 8 分之 1,變相讓使用效率提升 8 倍。
總結來說,NVIDIA 運用 AI、低精確度算法與超解系度技術,降低運算對實體記憶體/緩衝區的依賴。