?

更精彩的視界深入了解ARM Mail—G51和Mail—V61

2017-06-26 08:41李實
微型計算機 2017年5期
關鍵詞:編解碼處理器架構

李實

最近本刊連續介紹7ARM家族的多款產品,包括最新的Cortex-A73架構和全新的Mali-G71。不過,這類產品都是面向高性能和頂級用戶的,對入門級用戶和主流用戶來說,ARM又有怎樣的新產品呢?今天,我們就向大家介紹ARM面向入門級和主流用戶的產品——Mali-G51。除此之外,ARM在發布Mali-G51的同時也更新了視頻處理器,這個型號為Mali-V61的全新視頻處理器又有哪些特性呢?同樣,本文也將為你帶來它的最新信息。

在之前的文章中,我們介紹過ARM已經推出的Bifrest家族GPU的架構設計以及相應的產品Mali-G71。從架構來看,Bifrest的最大變化在于改用了全新的線程級并行。相比之前的指令集并行,線程級并行的優勢在于幾乎能夠做到對著色器核心接近100%高效率的應用,并且能夠帶來相對于指令集并行能效比方面的顯著優勢,這也是Mali-G71推出的最重要原因之一。不過Mali-G71過于龐大,定位也偏重高端領域,對入門級和主流用戶來說有點太“大”。于是經過一段時間的研發后,ARM推出了面向入門級和主流用戶的Mali-G51圖形處理核心。

請注意,本文在這里并沒有說Mali-G51是GPU核心,而只是圖形處理核心。在這里先來澄清一個觀點:和我們一般意義上認為Mali-G71這類核心就是GPU有所不同的是,ARM更樂意稱Mali的各個部分為Mali MultimediaSuite,也就是Mali多媒體套件。從產品的角度來說,ARM現在推出的Mali-G系列實際上只能完成GPU的計算和渲染部分,圖形顯示和視頻編解碼則由Mali-DP和Mali-V來完成。之所以這樣做,是因為ARM作為一個IP提供商,需要為SoC廠商提供不同的搭配方案才能保證它們擁有足夠的商業靈活性——因為不同廠商的需求是完全不一樣的,目標客戶更在意的是產品的競爭力,而不是最新的技術,這就要求IP的靈活搭配。所以ARM允許Mali的各部分在一定的范圍內自由進行搭配。

另外,ARM在本次更新GPU計算核心(最受關注)的同時,還同步更新了Mali的其他部分。比如隨著Mali的計算核心部分更新之后,ARM又在201 6年中旬更新了一個全新的視頻處理器——代號為“Egil”,產品型號為Mali-V61,替換目前正被廣泛使用的Mali--V550。下面我們就正式開始對Mali-G51和Mali-V61這兩款產品進行詳細介紹。

Mali-G51:高效能的入門級產品

一般來說,Mali-G71被認為是Mali-T880的繼承者,相對應的,Mali-G51就是Mali-T820和Mali-T830的繼承者——后者被用在很多注重性價比的產品上,比如三星自行設計的Exynos 7870,用于主打性價比的Galaxy A系列手機。對這類產品而言,性能反而不是其最重要的考量因素,如何在極其有限的空間、成本內實現盡可能高的每平方毫米性能和每美元性能才是最重要的。

從技術角度來看,Mali-G51的設計是很有趣的。它并不是Mali-G71的簡單縮減版本,而是在架構上進行了全新的調整以適應其所需要針對的市場。目前ARM的Mali-G系列采用不間斷的連續開發周期,和桌面GPU先開發頂級產品再削減規格推出中低端產品有所不同的是,Mali-G系列的每一款都有可能是正在設計中的Mali架構產品的分支。這意味著有可能較晚推出的、面向入門級市場的產品反而可能會擁有比較早推出面向頂級市場的產品更多的功能。

這一點在Mali-G51上表現得非常明顯。相比較早之前推出的Mali-G71,Mali-G51的最大變化在于每個核心鐘ALU、紋理單元和像素單元之間的配比情況。簡而言之,Mali-G51從之前Mali-G71的“單像素”設計轉成了“雙像素”設計。從架構角度來看,Mali-G71的每個著色器核心在執行24FLOPs(12個FMA操作時),其紋理單元和混和單元可以處理1個紋理數據和1個像素數據。相比之下,Mali-G51在相同的操作時可以處理2個紋理和2個像素數據。與此類似的事情發生在Midgard時代,ARM在高端GPU上調整了ALU的數量,這是因為對高級圖形效果而言,著色計算的需求是遠遠高出像素計算的,因此更多的ALU能夠加強計算能力,更快速完成處理操作。對入門級SoC應用更多的UI操作等輕工作負載而言,像素計算重要性更高。

雖然雙像素核心是Mali-G51的最大變化,但并不是唯一變化。由于Mali-G51使用的是最新的Bifrost架構,還帶來了一些架構上的細微調整。比如加入了全新的指令幀緩沖壓縮技術得到了改進,AFBC版本升級到了1.2版并進行了一些優化,更高的存儲效率,對恒定色塊的一些技術改進等。

總而言之,ARM宣稱Mali-G51相比之前的Mali-T830帶來了性能、密度和能量效率等多方面的顯著改進,在相同的節點和條件下,Mali-G51比Mali-T830面積小了30%,每平方毫米性能提高了60%,每瓦特性能也提高了60%??紤]到Mali-G51的面積、效能以及市場目標,這樣的設計結果是非常令人滿意的。

不僅如此,ARM還宣稱Mali-G51對如今火熱的VR能提供出色的使用體驗和性能,對一些簡單負載的應用來說,Mali-G51或許已經足夠。上市方面,Mali-G51應該在2018年才會出現在終端設備中,到時候肯定有大量的入門級移動設備“盯上”這款物美價廉的核心。

Mali-V61:為10bit時代做準備

在一般用戶的眼中,視頻單元是一個最容易受到忽視的部分。實際上對于今天我們正在使用的SoC來說,面對海量的視頻資源和極為復雜多樣的用戶需求,如果不能對編解碼部分做出很好的處理,就很可能會流失相當大一部分用戶。之前ARM就非常重視SoC上的編解碼部分,并于2014年10月推出了名為Mali-V550視頻處理器,用于搭配Mali-T800系列使用,組成完整的圖形處理部分。Mali-V550的優點在于引入了基本的HEVC支持,不過不足也是顯而易見的,那就是部分編碼格式在今天看起來不夠齊全。因此如今在Mali-V550的基礎上,ARM又推出了代號為“Egil”的新視頻處理器,商品名為Mali-V61。

所謂視頻處理器,顧名思義它多用在視頻的解碼和編碼中,既然需要支持視頻編解碼(甚至圖像的編解碼),那么支持的規格就要盡可能的豐富。這一點Mali-V61絕對夠格,它支持HEVC Main 10 High Tier、HEVC Lite、VP9、H.264、H.263、MPEG 4、MPEG 2、VC1、Real 8/9/10、JPEG等門乎目前所有主流的視頻和圖像編解碼技術。當然,除了HEVE和VP9外,其余的編解碼技術都很成熟了,下面本文重點說說HEVC和VP9。

在HEVC的編碼方面,前一代Mali-V550B經實現了HEVE的基本功能支持,而Mali-V61則在此基礎之上做出了進一步加強。比如可以支持HEVC Lite,這種編碼器相比H.264實際上改善的地方非常有限,且缺少對HEVE B幀的支持,畫質和壓縮水平沒有完整的HEVC編碼器那樣有顯著優勢。因此,Mali-V61在HEVE上進行了徹底的加強,使其可以提供對HEVE完整編碼的支持。更值得一提的是,Mali-V61不但能夠支持傳統8bit的HEVC編碼,還可以提供對Main10配置文件的10bit支持。解碼方面,Mali-V550對于HEVE的解碼就支持得很不錯,到了Mali-V61上自然也一并集成了。

除了HEVC之外,VP9的應用也非常廣泛。Mali-V550并不支持它,而在Mali-V61上則開始全面支持VP9的編解碼,雖然目前VP9應用還不夠多,但是考慮到谷歌對其支持不遺余力,并且VP9不收費——HEVE可是要收專利費的,這對很多個人和小型組織來說可不是那么友好,因此在未來網絡視頻和共享視頻等將有可能大規模采用VP9壓縮算法。Mali-V61目前可以提供對VP9 Profile 0(8bit)和Profile 2(10bit)的支持,同時支持編碼和解碼,功能一次性到位。

除了支持上述重要的新一代視頻壓縮編解碼算法外,ARM還特別提到了Mali-V61對VP9的參考幀縮放功能的編碼支持。所謂參考幀縮放功能,是指VP9在發現參考幀和當前幀尺寸不一致時,可以使用縮放因子進行縮放,再進行亞像素內插值等操作。參考幀是利用前后畫面(幀)的差值進行編碼的技術,應用得當可以大幅度提升視頻壓縮比。比如VP9可以在8個已存儲的參考幀中動態選擇其中3個進行幀間預測和對比。一般來說,參考幀縮放往往需要較高性能、功耗的模塊才能完成,Mali-V61的優勢在于在低功耗硬件編碼器中實現了這個功能,值得贊賞。

除了上述功能之外,Mali-V61從應用角度來看可以配置最多八個核心,實現Mali-V61MP8的方案,最少可以使用一個Mali-V61核心來實現基本的視頻編解碼功能。功耗方面,ARM表示TSMC 16nm FinFET工藝下800MHz的Mali-V61單核就可以滿足1080p@80fp s的編解碼,如果使用Mali-V61MP6的話,能夠實現4K@120fps的編解碼。因此一般來說,Mali-V61在移動設備上使用單核就夠了1只有對4K電視機、4K高速攝影機等設備來說,120Hz的4K編解碼能力才是必須的。當然,其中需要考慮功耗、性能的平衡,這就需要廠商根據用途仔細衡量70最后在商業化方面,和之前介紹的Mali-G51一樣,Mali-V61商業化的速度也不會太快,大概在2018年左右到來,考慮到超清視頻的市場爆發情況,這個速度也算相當不錯了。

寫在最后

縱觀此次ARM公布的兩款新品,其中的Mali-G51是面向入門級和主流用戶,它依靠非常出色的能耗比和較小的面積,肯定會得到諸多廠商的青睞,相信也將是未來常見的入門級移動產品的主要圖形處理核心。Mali-V61的定位和Mali-G51則完全不同,它是為下一代4K高清時代應用而準備的產品,本身設計和功能都足夠強大,顯然將成為市場主流,肯定有廠商用Mali-V61搭配Mali-G71來使用,以支持更多的解碼格式,進一步提升SoC的性能和功能。這樣一來,Mali-G51和Mali-V61,憑借出色的設計、強悍的功能以及一出生就合著金鑰匙的特殊地位,獲得成功只是時間問題罷了。

猜你喜歡
編解碼處理器架構
基于FPGA的RNN硬件加速架構
功能架構在電子電氣架構開發中的應用和實踐
1553B總線控制器編解碼設計
大型民機試飛遙測視頻編解碼方法研究
基于H.265編解碼的高清視頻傳輸系統研究
LSN DCI EVPN VxLAN組網架構研究及實現
一種基于FPGA+ARM架構的μPMU實現
Imagination的ClearCallTM VoIP應用現可支持Cavium的OCTEON? Ⅲ多核處理器
ADI推出新一代SigmaDSP處理器
主流視頻編解碼軟件的硬件性能分析與設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合