?

規格縮水？顯存問題？NVIDIA GTX970風波始末

2015-05-30 10:48小戴

電腦迷 2015年8期

關鍵詞：內存規格架構

小戴

作為NVIDIA革命性第二代Maxwell架構的次旗艦產品，GTX970憑借強勁的性能和合理的功耗帶來了非常優秀的能耗比，自上市起就成為了大家關注的焦點，一度被視為極為完美的顯卡?？墒呛镁安婚L，前不久圍繞GTX970的麻煩可不少，因為很多玩家發現其4GB顯存只有3.5GB可以被充分利用，剩下的0.5GB似乎被忽略了。這一下在玩家圈中炸開了鍋，玩家們紛紛懷疑，這是遇到了質量問題？還是產品設計缺陷？抑或是驅動對新顯卡的支持度不夠好呢？下面跟小編一起來看看這起“顯存門”風波的始末。

顯存問題掀起風波

NVIDIA GTX970的風波要從年初說起。二代Maxwell架構的GTX 980和970牢牢占據了單芯顯卡性能前兩名的寶座，自然是玩家們最關注的焦點。而細心的國外玩家在論壇指出，自己購買的GTX970似乎只能使用最多3.5GB的顯存，剩下的0.5GB容量看上去似乎被忽略浪費掉了。并給出了GPU-Z的截圖，圖中顯示該卡的顯存占用一直在3.5GB。而通過overlock開發的一款測試程序發現，GTX970其實可以完全利用全部的4GB顯存，但是最后0.5GB的性能會出現大幅度下滑。根據NVIDIA最早給出的技術文檔，GTX970和GTX980的差別僅在于CUDA流處理器、紋理單元和核心頻率，屏蔽了三組SMM單元以降低功耗，而顯存位寬、顯存大小、顯存頻率、L2緩存等均沒有任何區別，一切都變得撲朔迷離起來。

官方回應竟是規格縮水

隨著顯卡問題的發酵，NVIDIA也坐不住了，對此進行了官方回應，稱：“雖然架構上GTX 970和GTX 980是完全一致的，GTX 970配備了4GB獨立顯存，但是它的SM配置與GTX 980不同，交叉開關（crossbar）資源也更少。為了優化此結構下的顯存管理，我們將其分成了3.5GB、0.5GB兩個部分。GPU會優先訪問3.5GB部分。如果游戲需要的顯存少于3.5GB，就只會訪問第一部分，所以有些第三方工具顯示顯存占用量的時候就只會給出3.5GB，而在GTX 980上會顯示更多。如果游戲需要的顯存超過3.5GB，我們就會同時使用兩部分。我們知道大家擔心這0.5GB顯存的性能，而最好的測試就是看看實際游戲性能?！?/p>

雖然語焉不詳語意模糊，但還是在一定程度上解釋了GTX970出現的顯存問題，但是對喜歡刨根問底的技術宅同學來說，這個答案顯然不能讓他們滿意，含糊不清的回應并沒有解釋到底哪里出現了問題，因為以前沒遇到過這樣的問題。

NVIDIA GTX 980/970使用的都是GM204核心，顯存規格完全一致，都是256bit位寬，4GB GDDR5容量，7GHz頻率，由四組ROP/顯存管理器負責，從這一點來看不會有什么不同。唯一的不同，就是GTX 970屏蔽了三組SMM陣列，但是這會和顯存有關嗎？以前的顯卡也都是這么做的，并沒有觀察到類似的現象??？

要解釋這個問題，就需要徹底的了解GTX970底層構架的基本規格，隨著調查的進一步深入，NVIDIA很意外的告訴大家：“我們以前宣傳的時候把GTX970的規格搞錯了！”GTX970的錯誤在于，它的實際ROP單元只有56個，L2緩存也不是最初的和GTX980一樣的2MB，而是1.75MB，減少了1/8，不過顯存控制器沒有變化，的確是256bit位寬，4GB顯存。對于為什么會出現這樣的錯誤，NVIDIA解釋說技術銷售團隊在制作評測指南時并沒有意識到Maxwell架構具備上具備部分禁用ROP/顯存主控的功能，而這是Maxwell架構上才有的新功能，他們知道GTX 970是有256bit位寬的，但不知道可以獨立禁止ROP單元及2MB L2緩存，所以他們制作的文檔中的錯誤就在NVIDIA各部門流傳開了，并通過媒體傳播開了。這個問題在過去的4個月中都沒有被發現，直到本月初NVIDIA開始調查GTX 970顯存尋址的問題時才被注意到。PPT團隊再一次背黑鍋了。

而由于GPU-Z、AIDA64這樣知名的工具也因為對第二代Maxwell架構了解不夠深入，而未能發現問題，GTX 970檢測中都標注著64個ROP單元。不過其實也有跡象的，比如說NVIDIA自己的DeviceQuery CUDA開發工具，一直都準確報告了GTX 970只有1.75MB的二級緩存，但是除了相關軟硬件開發者，普通玩家和評測人員顯然不會注意到這個問題，或許在不久的將來，大家可以在各大評測內容中看到這一項。

深度解析Maxwell架構顯存架構限制問題

NVIDIA的高級VP Jonah Alben對這個問題做了詳細解釋。GTX970有13個SMM，每個SMM有128個SP，總計1664個SP。SMM通過Crossbar與L2連接，然后L2再連接顯存控制器，GTX980有8個L2（共計2048KB）與MC連接（每個連接32bit），但GTX970只有7個L2（共計1792KB）與MC連接，最后2個MC共用一個L2。GTX980 每個L2 ROP模塊有專門對應的32bit帶寬的512MB區域，但GTX970由于少組L2，這樣，最后一部分的512MB顯存和MC就需要和前面一組512MB顯存和MC共用L2，此時最后一組L2的請求數量就是前面其他L2的兩倍，性能就會減半，這樣就導致最后一組的512MB顯存的利用率和使用效率會出現問題。

為了解決這個問題，NVIDIA將內存分成兩個區域，前面的七個DRAM 3.5GB一個主區域，最后第八個DRAM 0.5GB一個區域。顯存訪問時系統會依照1-2-3-4-5-6-7-1-2-3-4-5-6-7的順序優先使用，這樣可以使得帶寬能夠更為均衡地使用。這樣的解決方案在3.5GB以下使用情況完美，但在3.5GB以上就會出現問題。通過Nai benchmark浮點測試表明，最后0.5GB顯存的速度僅有前面3.5GB的1/7，從正常的150GB/s下降到22.35GB/s。OS將顯存分為三個區域，PCI-E訪問前面的3.5GB主區域性能是后面的0.5GB的4倍，NVIDIA會讓OS優先使用前面的3.5GB，最后的0.5GB到迫不得已不夠用才會不情愿地使用。

這就是為什么GTX 970顯卡的224GB/s帶寬是技術上正確的，因為3.5GB部分顯存的帶寬是196GB/s（7GHz×7port×32bit），而0.5GB那部分讀取速度是28GB/s，但這二者不是同時讀取的，這實際上是一個XOR（異或）的情況。進一步來講，由于0.5GB顯存那部分不能跟3.5GB那部分同時讀取，這又進一步導致顯卡的等效帶寬太低了，使用的0.5GB部分顯存越多，3.5GB部分顯存的等效帶寬就會越低。

最終的結果就是GTX 970擁有獨一無二的顯存布局，需要操作系統及NVIDIA的驅動優化，因為3.5GB部分的顯存相比另外的0.5GB部分更大、更快、更好。這0.5GB部分的顯存邏輯上來看相當于VRAM與系統內存之間的緩存，它的速度比3.5GB部分更慢，不過依然是PCI-E總線到內存的帶寬的2倍。

往大的方面說，取決于你如何定義GTX 970的顯存容量，它可以說是3.5GB顯存的，也可以說是4GB顯存的，其中只有前面的3.5GB是全速的，這也是軟件最想用的那部分。不過512MB那部分分區也是有意義的，雖然性能比3.5GB部分低，但它依然比PCI-E到主內存的帶寬更高，GTX 970依然可以使用完整的4GB顯存。

寫在最后：GTX 970到底有問題嗎？

上面分析了這么多，那么GTX970到底有問題嗎？所幸的是，通過多家國內外媒體的測試，GTX970確實可以使用全部的4GB顯存，3.5-4GB中間部分的顯存是可以被游戲利用起來的。與GTX 980的性能進行對比，無論是在3.5GB-4GB之間占用還是在4GB顯存占用時，性能下降均處于較為相當的水平。在測試中，無論顯存占用情況如何，GTX 970和GTX 980的性能差距始終在15%左右，爆顯存的事情并沒有發生。如果之前的GTX970顯存問題的傳言準確，那應該會看到GTX970相對于GTX980性能有較大幅度的下降才對，而這樣的事情并沒有在測試中出現。絕大多數熱門游戲大作在4K及以下分辨率的時候，即使畫質全部手動調至最高，顯存占用率也不會超過3.5GB。

小編認為，這次可能真的如NVIDIA說的那樣，他們是疏忽了，而不是故意隱瞞。首先，因為ROP單元、二級緩存的參數對普通用戶來說確實意義不大，NVIDIA故意夸大它們的規格撈不到任何好處，被發現了反而是嚴重的打臉，沒必要這樣冒險。其次，無論之前的傳言如何，以及顯存分配到底是怎樣的，GTX 970的性能都在那擺著的，而且二代Maxwell架構優秀的功耗比也給大家帶來了深刻的印象，我們再在顯存上糾結似乎完全沒有必要。

猜你喜歡

內存規格架構

基于FPGA的RNN硬件加速架構

成都信息工程大學學報(2022年4期)2022-11-18

近3成苗企難以維持！規格越大越虧，2022如何讓泥鰍賺錢？

當代水產(2022年6期)2022-06-29

寶藏(2021年6期)2021-07-20

外部高速緩存與非易失內存結合的混合內存體系結構特性評測

高技術通訊(2021年5期)2021-07-16

功能架構在電子電氣架構開發中的應用和實踐

汽車工程(2021年12期)2021-03-08

“春夏秋冬”的內存

當代陜西(2019年13期)2019-08-20

山鋼日鋼1.2mm極限薄規格帶鋼的生產實踐

山東冶金(2019年1期)2019-03-30

LSN DCI EVPN VxLAN組網架構研究及實現

電信科學(2017年6期)2017-07-01

一種基于FPGA+ARM架構的μPMU實現

電測與儀表(2015年22期)2015-04-09

基于內存的地理信息訪問技術

測繪科學與工程(2014年5期)2014-02-27

電腦迷2015年8期

電腦迷的其它文章: 有錢，請不要任性; 敢不敢快點？三網互訪就要疾如閃電; 從頭再來關于微信的注銷; 穹頂之下 APP能幫我們做點什么; 唯美食與愛不可辜負; 萌萌噠的機器人

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合