?

SHARC處理器的起源和演進

2009-01-20 02:08PaulWheeler
中國集成電路 2009年10期
關鍵詞:外設內核總線

Paul Wheeler

1引言

說到要求超高性能的前沿應用,就不得不提起ADI公司的SHARC處理器。隨著更高動態范圍、更高性能和更低成本等市場壓力的與日俱增,各種應用對浮點處理器的需求也在不斷增加。本文將介紹第一款SHARC處理器背后的歷史,并討論其架構的創新,這使得這款處理器在18年的數字信號處理歷史中一直處于領先的地位。

2SHARC處理器的歷史

“SHARC”是超級哈佛架構(Super Harvard ARChitecture)的縮寫,是ADI公司為他們的浮點處理器起的名字。SHARC處理器在標準哈佛架構基礎上作了改進,不僅方便了PM(程序存儲器)總線上的數據傳送,并通過增加一個指令緩存優化了基于緊密循環的計算過程的吞吐性能。改進后的架構能夠同時存取數據和系數,并同時從指令緩存執行所選的指令,從而高效地實現了處理器的三總線操作模式。

大家知道,SHARC處理器最早起源于ADSP-21020。這個浮點單指令單數據(SISD)DSP實際上是一個不帶嵌入式存儲器或外設的獨立計算內核。PM和DM(數據存儲器)存儲空間是通過連接到SRAM芯片的外部總線進行訪問的,通過JTAG接口對處理器進行編程和調試。

ADSP-21020可以在33MHz時鐘頻率下工作,執行單周期指令。ADSP-21020可以利用80位累加器完成32位或40位浮點和32位定點運算,是ADI公司在1991年推向市場的突破性產品。這種內核技術是ADI公司對浮點性能和創新做出承諾的起始點。

3集成與創新:SHARC的誕生

第一款真正的SHARC處理器是ADSP-21060。ADI公司在ADSP-21020內核產品的基礎上開發出了一個完全集成的處理器,其中包括了用于控制集成外設的DMA流量的片上SRAM和I/O處理器。

ADSP-21060浮點處理器是1994年進入市場的,當時被認為是DSP性能和創新方面的頂尖水平。

SHARC內核能夠在一個周期內以高達40MHz的速度執行計算,并且增加了I/O處理器,能夠在不增加任何內核開銷的條件下,在外設和雙端口4Mb SRAM存儲器之間高速傳輸數據。

為了進一步提高最終用戶的系統性能和可擴展性,ADI設計團隊著手創建允許多處理器系統能共享數據并且開銷很小的機制。在外部端口邏輯中增加了一個簇總線控制器,可以無縫地進行處理器間的并行數據通信,每個簇最多可以有6個處理器。這種突破性技術允許系統架構師以高達240MBps的帶寬從主處理器向指定從處理器的內存直接傳送大量數據,或使用廣播模式向簇中的所有從器件直接發送數據。

使用ADI的鏈路端口專利技術還能實現處理器間的高速通信。每個ADSP-21060集成了6個獨立的鏈路端口用于點到點通信,因此可以實現額外的240MBps的I/O帶寬。

由于具有這種真正平衡的架構和擴展功能,SHARC處理器被廣泛用于運算強度大的應用,如醫療成像、軍事雷達和電子游戲機。

也許讓人不敢相信,具有這種功能的處理器在15年前就推向市場了,但令人更加驚奇的是,這種處理器目前還在繼續為用戶所用!這是SHARC架構性能的良好擴展性以及ADI公司對質量和用戶滿意做出承諾的最好證明。

4第二代SHARC處理器

第二代SHARC處理器將處理性能提升到了新的層次,它將內核架構擴展為單指令多數據(SIMD)系統,并將內核時鐘頻率提高到100MHz。ADSP-2116x系列處理器保持了與ADSP-2106x SISD處理器的源代碼的完全兼容性,而且經過少量代碼修改就能讓用戶發揮新增加的并行運算單元(寄存器文件+乘法器+ALU+桶式移位器)的作用,與上一代SHARC相比可以將周期性能指標提高一倍。

為了在不降低周期性能的條件下方便到這個新增加的運算單元的數據傳送,內部的PM和DM數據總線寬度都增加到了64位,同時在ADSP-21161上集成了48位寬100MHz SDRAM控制器來增加I/O數據傳送帶寬,從而能夠實現高達600MBps帶寬的數據傳送能力。

就像上一代SISD SHARC一樣,第二代SHARC保留了支持簇總線系統架構的多處理器無膠合連接,以及通過鏈路端口的點到點連接,使性能升級路線圖更加簡單清晰。

就像上一代SISD SHARC一樣,第二代SHARC系列器件被醫療、工業和軍事應用所廣泛采用,而且由于額外集成了支持時分復用(TDM)和I2S格式的串行端口(SPORT),專業音響和高端消費/汽車音響設備很快地利用到了該處理器的浮點運算提供的大動態范圍優勢。

5第三代SHARC處理器

第三代SHARC處理器開始跳出多處理器應用空間,主動迎接新的挑戰。由于在音頻應用中具有明顯的浮點處理優勢,SHARC技術開發的重點開始轉向以最低系統成本努力增加片上處理功能。

以這個目標開發并推向市場的第一批處理器是ADSP-2126x系列。就像ADSP-2116x一樣,ADSP-2126x采用SIMD架構使運算性能最大化。除了將內核性能翻倍達到200MHz外,ADSP-21266處理器還是SHARC系列中首個內置片上掩膜ROM的產品。集成4Mb ROM降低了系統復雜性和成本,將曾經給人們留下“高成本”印象的浮點型DSP推向了消費類音頻領域。

為了進一步降低硬件系統設計的復雜性,ADI公司開發出了名為“數字應用接口”(DAI)的創新性外設。與以前的SHARC和同類競爭性產品將引腳功能固定下來不同,DAI允許用戶將任何外設功能分配到他們想要的任意一個外部引腳。對于音頻系統來說,這意味著當系統輸入輸出要求發生改變時,音頻時鐘域可以隨時通過軟件分配到引腳并路由到串行端口。這種靈活性可以顯著減少為了支持特殊系統規范所需的外部引腳數量,有助于硬件設計的簡化,幫助用戶進一步降低成本。

ADSP-2136x繼承了ADSP-2126x節省成本的優點,并增加了先進的音頻信號鏈集成方法。內核性能提高了60%以上,達到333MHz,內部SRAM可增加到3Mb。另外還集成了許多針對音頻的外設,如高性能異步采樣率轉換器(ASRC)、SPDIF收發器和DTCP加密引擎,從而進一步優化了可編程性能和音頻系統BOM成本,鞏固了ADI在音頻市場中的領導地位。在這一系列的高性能產品中還集成了工作頻率高達166MHz的32位SDRAM接口,以增加I/O帶寬,同時有利于數據密集應用使用批量生產的存儲器。

基于這種突破性的音頻系統集成和性價比領先優勢,第三代SHARC系列不僅在專業音頻領域,而且在消費音頻應用(如家庭影院系統、AV放大器)中得到了廣泛應用,為新一代高清音頻標準(DTS Master Audio和Dolby Tru-HD)推向市場發揮了重要作用。

6第四代SHARC系列——ADSP-2146x

第三代SHARC處理器在優化性價比方面取得了成功,推動浮點處理器進入了對成本敏感的消費類應用,而這類應用曾被人們認為是不可能使用昂貴的浮點處理器的。

ADI公司現在面臨著一個有意思的挑戰:如何進一步改進具備優異性價比的浮點處理器?

在定義第四代處理器時,產品開發團隊注重的是核心價值正是它們使得SHARC一直處于浮點DSP技術的前沿:

猜你喜歡
外設內核總線
人民情懷:柳青為文為人的內核(評論)
關于CAN總線的地鐵屏蔽門控制思路論述
初春
微軟發布新Edge瀏覽器預覽版下載換裝Chrome內核
Q&A熱線
外設天地行情
PCI9030及其PCI總線接口電路設計
外設天地行情
外設天地行情
外設天地行情
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合