以ChatGPT為代表的生成式AI讓人們看到了智能世界的無限可能,指數(shù)級增長的多元化數(shù)據(jù)為千行百業(yè)的AI場景化奠定了基礎(chǔ),而如何有效地采集、存儲、傳輸、處理數(shù)據(jù)和模型則成為實現(xiàn)高質(zhì)量AI的關(guān)鍵。在Rambus大中華區(qū)總經(jīng)理蘇雷看來,AI大流行的時代,訓練和推理都需要海量的數(shù)據(jù)支持,對于內(nèi)存產(chǎn)品來說,首先是滿足高帶寬的要求,其次就是要考慮成本和復雜性,“GDDR技術(shù)在帶寬、成本和方案復雜性的各因素之間,提供了一種完美的折中技術(shù)方案?!?/span>
Rambus大中華區(qū)總經(jīng)理蘇雷
作為一家領(lǐng)先的芯片和半導體IP供應(yīng)商,Rambus致力于使數(shù)據(jù)傳輸更快更安全,關(guān)注產(chǎn)品的產(chǎn)品和方案的易用性,通過一站式的解決方案以及完善的服務(wù)機制,使產(chǎn)品方案變得更容易在客戶端集成使用。產(chǎn)品方面,Rambus的內(nèi)存接口芯片不斷提高數(shù)據(jù)中心內(nèi)存模塊的速度和容量,數(shù)據(jù)安全方面,Rambus有著豐富的安全IP產(chǎn)品線,對用于靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)安全保護都有專門的產(chǎn)品方案,包括安全信任和MACsec和Ipsec等等,整體來說,Rambus的產(chǎn)品應(yīng)用領(lǐng)域聚焦于服務(wù)器、主內(nèi)存、智能網(wǎng)卡、網(wǎng)絡(luò)服務(wù)和交換機,以及面向未來的內(nèi)存擴展和池化等市場。
【資料圖】
AI技術(shù)的深入應(yīng)用推動了場景化智能的快速發(fā)展,數(shù)以千億計的參數(shù)模型越來越多,對處理器和帶寬提出了更高的要求,很多企業(yè)都開始研發(fā)定制化的處理器產(chǎn)品,以更好地滿足神經(jīng)網(wǎng)絡(luò)和特定應(yīng)用。然而,算力的顯著增長并未帶來帶寬的同步改善,很多GPU資源沒有得到充分的使用。把多樣化的數(shù)據(jù)進行分析、導入模型訓練之后,會在應(yīng)用場景端進行推理,NLP、數(shù)據(jù)庫管理等應(yīng)用越來越多的出現(xiàn)在邊緣環(huán)境中,數(shù)據(jù)傳輸量和響應(yīng)延遲大幅下降。
“隨著AI推理的應(yīng)用不斷向邊緣端遷移,我們會把已經(jīng)訓練過的系統(tǒng)實現(xiàn)更快的處理方式,處理速度的提高是非常大的遷移到邊緣端的優(yōu)勢。正是在這個變化的趨勢過程中,GDDR6也開始發(fā)揮作用?!盧ambus IP核產(chǎn)品營銷高級總監(jiān)Frank Ferro談到,“作為更加理想的方案,GDDR6有著高帶寬和低時延的特性,能夠幫助邊緣端更好地處理數(shù)據(jù)?!?/span>
Rambus IP核產(chǎn)品營銷高級總監(jiān)Frank Ferro
如今,GDDR在AI/ML場景(如AI推理等)中有著廣泛的使用,還會應(yīng)用于圖形計算、網(wǎng)絡(luò)等場景。與DDR相比,GDDR在帶寬、速度、功耗等方面有著顯著優(yōu)勢,吸引了更多的客戶將其結(jié)合到各類先進設(shè)計中。通過Rambus GDDR6 PHY,客戶可以獲得24Gb/s的數(shù)據(jù)傳輸速率,為每個GDDR6內(nèi)存設(shè)備帶來96GB/s的帶寬。作為系統(tǒng)級解決方案的一部分,Rambus GDDR6可以為AI/ML、圖形和網(wǎng)絡(luò)應(yīng)用提供高效益、高帶寬、低延遲的內(nèi)存接口解決方案。同時,RambusGDDR6 PHY還有著更優(yōu)的功耗管理表現(xiàn)。
Rambus的產(chǎn)品實現(xiàn)了PHY和控制器的完整集成,其內(nèi)存接口系統(tǒng)包括PHY物理層、控制器、DRAM和客戶端ASIC,其中,PHY的物理層與DRAM直接相連,接口由兩個16位插槽組成,共32位,另一側(cè)的DFI接口與內(nèi)存控制器連接,控制器會直接接入整個系統(tǒng)的邏輯控制。Rambus會提供下圖中的藍色部分——即完整的子系統(tǒng)(與Rambus GDDR6數(shù)字控制器IP相結(jié)合),使得客戶可以根據(jù)場景所需進行定制化使用。此外,Rambus可以保障良好的系統(tǒng)級信號完整性和電源完整性(SI/PI),并且支持LabStation開發(fā)環(huán)境,能夠快速建立系統(tǒng),進行特性分析和調(diào)試。
GDDR6內(nèi)存接口子系統(tǒng)(控制器+PHY)
在GDDR6時代,有更多的產(chǎn)品開始采用16位雙讀寫通道,可以顯著增加數(shù)據(jù)的傳輸速度和效率,使得GDDR6內(nèi)存中的8個雙讀寫通道能夠?qū)崿F(xiàn)256位的數(shù)據(jù)傳輸寬度,進一步提升了系統(tǒng)層的效率、優(yōu)化了功耗,還可以在邊緣環(huán)境中大幅降低設(shè)備對DDR數(shù)量的要求。在AI推理場景中,通常的帶寬需求在200-500Gb/s之間來,每個GDDR6設(shè)備的帶寬可以達到96Gb/s,通過將4-5個GDDR6設(shè)備進行組合,就能輕松滿足500Gb/s及以下的帶寬需求。
如果是在云端進行AI訓練,對成本因素不敏感的話,也可以選擇更大帶寬的HBM,如果是邊緣端則使用GDDR6效益更好,原因在于,HBM3設(shè)備能提供接近800Gb/s的帶寬,遠超AI推理所需的500Gb/s,考慮到其內(nèi)存設(shè)計和制造難度較高,以及高度集成性(會使用一些中間插入層來處理和傳輸數(shù)據(jù)),并且可能需要更多的板卡空間,會導致成本會提升數(shù)倍。
除此之外,Rambus還有著更多的特性,包括clamshell模式,即每個信道可以支持兩個GDDR6的設(shè)備,相當于該模式下整個容量翻倍。GDDR6支持先進的FinFET工藝節(jié)點,并且會針對PCB和封裝提供相關(guān)的參考設(shè)計。在開發(fā)GDDR6子系統(tǒng)的時候,首先會對數(shù)據(jù)流進行模擬和建模,這一過程要確保最佳的數(shù)據(jù)輸出量和吞吐量,控制器、優(yōu)化器會進一步管理內(nèi)存數(shù)據(jù),利用Look-Ahead技術(shù),可以更好地通過數(shù)據(jù)順序內(nèi)存位置進行精準預(yù)測,提供更優(yōu)的數(shù)據(jù)路徑規(guī)劃,提前了解下一批進入DRAM的數(shù)據(jù)類型,優(yōu)化應(yīng)對機制。
Rambus能夠提供靈活的解決方案和一站式服務(wù),包括PHY和控制器集成解決方案,以及全套的測試軟件用于快速啟動、校準和調(diào)試,使用交鑰匙的方式把集成測試好的子系統(tǒng)交付給客戶,加速芯片產(chǎn)品上市時間。如果客戶已經(jīng)擁有控制器IP,只需要PHY IP授權(quán),Rambus也可以單獨授權(quán),并會提供后續(xù)相關(guān)的集成支持。今年夏季,Rambus GDDR6預(yù)計會推出完整的最終硅片,并計劃在2025-2026年有廠商會上市使用GDDR6 IP的芯片?!癎DDR會應(yīng)用在圖形處理器、自動駕駛、AI、5G基礎(chǔ)架構(gòu)等場景中。Rambus24Gbps GDDR方案的推出,將這些應(yīng)用提供更高級別的性能和更多的選擇。”蘇雷說。
關(guān)鍵詞:
關(guān)于我們 廣告服務(wù) 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com