在智能時代,數(shù)據(jù)的價值已經(jīng)被重新定義。無論是千行百業(yè)的數(shù)字化轉(zhuǎn)型,還是元宇宙、XR背后的虛擬世界,都離不開龐大數(shù)據(jù)量的采集和處理,多元化的應(yīng)用場景使得傳統(tǒng)的加速計算方式難以滿足復(fù)雜需求。在德國漢堡舉行的ISC 2023國際超算大會上,NVIDIA發(fā)布了一系列關(guān)于高效節(jié)能超級計算和量子計算的最新進展,包括一臺由NVIDIA CPU加速的新超級計算機“Isambard 3”,以及與羅爾斯·羅伊斯公司噴氣發(fā)動機設(shè)計組合作的量子計算突破。
【資料圖】
如今,有越來越多的超級計算機采用了Arm架構(gòu)的處理器,甚至闖入了TOP500的前列。部署在英國布里斯托和巴斯科學園的Isambard 3,是英國GW4科研聯(lián)盟的一部分,該項目由布里斯托大學、巴斯大學、卡迪夫大學和??巳卮髮W牽頭。Isambard 3搭載了384顆基于Arm架構(gòu)的NVIDIA Grace CPU超級芯片,用于推動醫(yī)學和科學研究,其性能和能效預(yù)計將達到Isambard 2的六倍,使其成為歐洲最節(jié)能的系統(tǒng)之一。該超算的FP64峰值性能達到約2.7 petaflops,功耗低于270千瓦,躋身世界三大最環(huán)保的非加速超級計算機之列。
NVIDIA Grace CPU由兩個CPU芯片組成,它們之間通過NVLink-C2C互連,NVLink-C2C是一種新型的高速、低延遲、芯片到芯片的互連技術(shù)。Grace CPU是由CPU-GPU集成的“Grace Hopper超級芯片”的模塊,與基于NVIDIA Hopper架構(gòu)的GPU一同應(yīng)用于大型HPC和AI應(yīng)用。該芯片專為提供最高的性能而打造,能夠在單個插座(socket)中容納144個Arm核心。根據(jù)NVIDIA實驗室使用同類編譯器估算,這一結(jié)果較當前DGX A100搭載的雙CPU相比高1.5倍以上。Grace CPU還提供了能效和內(nèi)存帶寬,其依托帶有糾錯碼的LPDDR5x內(nèi)存組成的創(chuàng)新的內(nèi)存子系統(tǒng),可實現(xiàn)速度和功耗的最佳平衡。LPDDR5x內(nèi)存子系統(tǒng)提供兩倍于傳統(tǒng)DDR5設(shè)計的帶寬,可達到每秒1TB ,功耗大幅降低 ,CPU加內(nèi)存整體功耗僅500瓦。
英國科研聯(lián)盟GW4打造能效提升6倍的超級計算機,用于氣候科學、醫(yī)學研究等領(lǐng)域
NVIDIA超大規(guī)模與高性能計算副總裁Ian Buck表示:“隨著氣候變化成為一個日益嚴峻的問題,計算機采用節(jié)能技術(shù)至關(guān)重要。NVIDIA正在與Arm Neoverse生態(tài)系統(tǒng)合作,為打造更節(jié)能的超級計算中心鋪平道路,推動科學和工業(yè)研究取得重大突破?!庇蒆PE建設(shè)的Isambard 3將助力歐洲科研界在人工智能、生命科學、醫(yī)學、天體物理學和生物技術(shù)方面取得突破,其能夠創(chuàng)建風電場和聚變反應(yīng)堆等超復(fù)雜結(jié)構(gòu)的詳細模型,幫助科研人員在清潔能源和綠色能源方面取得新進展。
Arm高級副總裁兼基礎(chǔ)設(shè)施總經(jīng)理Mohamed Awad表示:“從氣候變化到醫(yī)學,超級計算已經(jīng)使學術(shù)和行業(yè)領(lǐng)導(dǎo)者能夠應(yīng)對世界上一些最重大的挑戰(zhàn)。在重要的研究領(lǐng)域進行拓展需要Arm Neoverse獨特的性能和能效。通過與NVIDIA合作,我們?yōu)槟軌蛟贗sambard 3超級計算機中滿足這種需求而感到自豪?!?/p>
NVIDIA基于Arm架構(gòu)的由NVIDIA Grace驅(qū)動的系統(tǒng)將延續(xù)Isambard 2的分子機制模擬工作,以更好地了解帕金森病,并為骨質(zhì)疏松癥和COVID-19尋找新的治療方法。這些計算密集型應(yīng)用受益于Grace超級芯片中提供的最高性能的核心、最高的內(nèi)存帶寬和最優(yōu)的單核內(nèi)存容量。
Isambard項目首席研究員、布里斯托大學高性能計算教授Simon McIntosh-Smith表示:“Isambard 3的應(yīng)用性能效率高達其前代的6倍,媲美全球超級計算機500強中排名前50的超級計算機,將為科學家提供革命性的全新超級計算平臺,以推進科研工作取得突破?;贏rm架構(gòu)的NVIDIA Grace CPU具有突破性的能效,能夠突破科學發(fā)現(xiàn)的界限,從而解決人類面臨的一些最困難挑戰(zhàn)?!?/p>
據(jù)了解,Isambard 3在2024年春季投入使用后,布里斯托大學預(yù)計注冊用戶數(shù)量將大幅超過當前的800人。另有消息稱,瑞士國家超算中心和美國洛斯阿拉莫斯國家實驗室正在建造配備GPU的超級計算機。
瑞士國家超算中心的超級計算機
美國洛斯阿拉莫斯國家實驗室的超級計算機
在量子計算領(lǐng)域,NVIDIA、羅爾斯羅伊斯和量子軟件公司Classiq公布了一項新突破,進一步提升了噴氣發(fā)動機的效率。通過采用NVIDIA的量子計算平臺,兩家公司設(shè)計并模擬了世界上最大的計算流體力學(CFD)量子計算電路,該電路測量深度為1000萬層,有39個量子位。羅爾斯羅伊斯正在使用GPU為量子未來做準備,盡管當今的量子計算機僅能支持只有幾層的電路深度。羅爾斯羅伊斯致力于建造最先進的噴氣發(fā)動機,以更加可持續(xù)的航空設(shè)備推動能源轉(zhuǎn)型。該公司計劃使用新的電路發(fā)揮量子在CFD中的優(yōu)勢,同時使用經(jīng)典和量子計算方法來模擬噴氣發(fā)動機設(shè)計的性能。
全球最大的工業(yè)模擬量子電路將推動航空領(lǐng)域量子計算的發(fā)展
羅爾斯羅伊斯及其合作伙伴——以色列公司Classiq先是使用Classiq的合成引擎設(shè)計了該電路,然后使用NVIDIA A100 TensorCore GPU對其進行模擬,而NVIDIA cuQuantum——一個包含經(jīng)過優(yōu)化、用于加快量子計算流程的庫和工具軟件開發(fā)工具套件保證了該流程的速度和規(guī)模。
自20世紀八十年代以來,量子計算就不斷受到關(guān)注,相關(guān)數(shù)據(jù)顯示,開發(fā)量子軟件的大型組織數(shù)量從2018年的1%增長至2021年的30%,預(yù)計未來幾年的商業(yè)成熟度會更繼續(xù)提升,到2024年全球70%的大公司將開發(fā)量子計算機軟件。創(chuàng)立于2020年的Classiq是一家位于以色列的量子算法設(shè)計平臺提供商,此前曾獲得了超過千萬美元的融資。Classiq提供的量子算法設(shè)計平臺,允許開發(fā)人員使用功能模型設(shè)計量子電路,可以在該平臺搜索包含數(shù)百萬個電路配置的解決方案空間,以找到符合資源要求、設(shè)計者提供的目標硬件平臺。
NVIDIA提供了一個加快各學科量子研究和開發(fā)突破的統(tǒng)一計算平臺,Grace Hopper超級芯片集NVIDIA Hopper架構(gòu)GPU的性能與NVIDIA Grace CPU的多功能性于一身,可以滿足超大規(guī)模量子模擬工作負載。此外,高速、低延遲的NVIDIA NVLink-C2C互連技術(shù)優(yōu)化了使用該超級芯片構(gòu)建的經(jīng)典系統(tǒng)與量子處理器或QPU的連接。Grace Hopper每個節(jié)點共有600GB快速訪問內(nèi)存,使得量子生態(tài)系統(tǒng)能夠進一步擴大這些模擬的規(guī)模。
GPU加速量子計算系統(tǒng)DGX Quantum的背后,就是Grace Hopper提供了有力的支撐,同時,NVIDIA還為開發(fā)者提供了一個連接GPU和QPU的強大開源編程模型——NVIDIA CUDA Quantum。集成CUDA Quantum的最新QPU制造商ORCA Computing正在將其光子量子計算機與用于機器學習的GPU相結(jié)合。兩個熱門量子機器學習框架TensorFlow Quantum和TorchQuantum現(xiàn)在也集成了cuQuantum。除此之外,NVIDIA GPU之上的“量子故事”,還在持續(xù)上演。
歐洲最大的量子計算設(shè)施之——于利希超級計算中心也在ISC上宣布,計劃與NVIDIA共同建立一座量子計算實驗室,該實驗室將將與慕尼黑的ParTec AG一起在NVIDIA量子計算平臺的基礎(chǔ)上開發(fā)一臺經(jīng)典-量子超級計算機,使用CUDA Quantum等工具幫助開發(fā)者推動了量子計算領(lǐng)域的發(fā)展。
這項重大合作將推動在NVIDIA 加速的系統(tǒng)上運行高性能計算和量子計算工作負載的研究
該實驗室將由歐洲最大的跨學科研究中心之一——德國于利希研究中心(FZJ)運營,并作為于利希量子計算用戶基礎(chǔ)設(shè)施(JUNIQ)的一部分,運行高性能、低延遲的量子-經(jīng)典計算工作負載。JUNIQ正在使用搭載3744顆NVIDIA A100 Tensor Core GPU的JUWELS加速系統(tǒng)進行量子計算模擬。
JSC量子信息處理部主管Kristel Michielsen表示:“混合量子-經(jīng)典系統(tǒng)正在使量子計算更接近現(xiàn)實,以解決單靠經(jīng)典計算無法解決的復(fù)雜問題。通過與NVIDIA合作建立這座模塊化量子計算實驗室,JSC的研究人員可以在化學和材料科學領(lǐng)域取得前所未有的進步,推動各個科學學科和行業(yè)實現(xiàn)更加廣泛的變革性進展。”
NVIDIA量子計算平臺通過開源CUDA Quantum編程模型實現(xiàn)了量子與經(jīng)典計算的緊密集成,并通過NVIDIA cuQuantum軟件開發(fā)套件實現(xiàn)了一流的模擬。JSC計劃采用分階段的方式測試該系統(tǒng),使用NVIDIA CUDA量子編程模型對量子處理器進行編程并將其集成到于利希超大規(guī)模模塊化超級計算架構(gòu)中。
ParTec AG首席執(zhí)行官Bernhard Frohwitter表示:“ParTec長期以來一直在推動模塊化超級計算架構(gòu)的開發(fā),并通過領(lǐng)先的ParaStation Modulo軟件實現(xiàn)了混合模塊化計算。量子計算機將成為未來任何異構(gòu)超級計算機必不可少的組成部分。此次合作將帶來新的可能性。”
關(guān)鍵詞:
關(guān)于我們 廣告服務(wù) 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com