NVIDIA今日宣布推出第四代NVIDIA DGX系統(tǒng),這是全球首個基于全新NVIDIA H100 Tensor Core GPU的AI平臺。
NVIDIA DGX H100 Systems
DGX H100系統(tǒng)能夠滿足大型語言模型、推薦系統(tǒng)、醫(yī)療健康研究和氣候科學(xué)的大規(guī)模計算需求。每個DGX H100系統(tǒng)配備八塊NVIDIA H100 GPU,并由 NVIDIA NVLink連接,能夠在新的FP8精度下達到32 Petaflop的AI性能,比上一代系統(tǒng)性能高6倍。
DGX H100系統(tǒng)是新一代NVIDIA DGX POD和NVIDIA DGX SuperPOD AI基礎(chǔ)設(shè)施平臺的構(gòu)建模塊。新的DGX SuperPOD架構(gòu)采用了一個全新的NVIDIA NVLink Switch系統(tǒng),通過這一系統(tǒng)最多可連接32個節(jié)點,總計256塊H100 GPU。
新一代DGX SuperPOD提供1 Exaflops的FP8 AI性能,比上一代產(chǎn)品性能高6倍,能夠運行具有數(shù)萬億參數(shù)的龐大LLM工作負載,從而推動AI的前沿發(fā)展。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI已經(jīng)從根本上改變了軟件的功能和產(chǎn)出方式。利用AI來革新自身所處行業(yè)的公司也意識到了自身AI基礎(chǔ)設(shè)施的重要性。NVIDIA全新DGX H100系統(tǒng)將賦能企業(yè)AI工廠,助力其從數(shù)據(jù)中提煉出我們最具價值的資源,即‘智能’。"
全球運行速度最快的AI超級計算機——NVIDIA Eos
NVIDIA將率先使用突破性的新型AI架構(gòu)來構(gòu)建DGX SuperPOD,賦能NVIDIA研究人員的研究工作,推動氣候科學(xué)、數(shù)字生物學(xué)和AI未來的發(fā)展。
“Eos”超級計算機將于今年晚些時候開始運行,共配備576臺DGX H100系統(tǒng),共計 4608塊DGX H100 GPU,有望成為全球運行速度最快的AI系統(tǒng)。
NVIDIA Eos預(yù)計將提供18.4 Exaflops的AI計算性能,比日本的Fugaku超級計算機快4倍,后者是目前運行速度最快的系統(tǒng)。在傳統(tǒng)的科學(xué)計算方面,Eos預(yù)計將提供275 Petaflop 的性能。
對于NVIDIA及其OEM和云計算合作伙伴,Eos將成為其先進AI基礎(chǔ)設(shè)施的藍圖。
借助DGX H100系統(tǒng)、DGX POD和DGX SuperPOD,輕松擴展企業(yè)級AI
在企業(yè)從初始項目發(fā)展到廣泛部署的過程中,DGX H100系統(tǒng)能夠?qū)崿F(xiàn)輕松擴展,滿足企業(yè)的AI需求。
除了八塊H100 GPU以及總計6400億個晶體管之外,每個DGX H100系統(tǒng)還包含兩個NVIDIA BlueField-3 DPU,以用于卸載、加速和隔離高級網(wǎng)絡(luò)、存儲及安全服務(wù)。
八個NVIDIA ConnectX-7 Quantum-2 InfiniBand網(wǎng)卡能夠提供400 GB/s的吞吐量,可用于連接計算和存儲,這一速度比上一代系統(tǒng)提升了一倍。第四代NVLink與NVSwitch相結(jié)合,能夠在每個DGX H100系統(tǒng)中的各個GPU之間實現(xiàn)900 GB/s的連接速度,是上一代系統(tǒng)的1.5倍。
DGX H100系統(tǒng)使用雙x86 CPU,能夠與NVIDIA網(wǎng)絡(luò)和NVIDIA合作伙伴提供的存儲設(shè)備相結(jié)合,使DGX POD能夠靈活用于各種規(guī)模的AI計算。
借助 DGX H100 系統(tǒng),DGX SuperPOD可成為具有可擴展性的卓越的企業(yè)級AI中心。DGX SuperPOD中的DGX H100節(jié)點和H100 GPU由NVLink Switch系統(tǒng)和NVIDIA Quantum-2 InfiniBand連接,帶寬速度可達70 TB/s,比上一代產(chǎn)品高11倍。NVIDIA合作伙伴提供的存儲設(shè)備將經(jīng)過測試和認證,以滿足DGX SuperPOD AI計算的需求。
多個DGX SuperPOD單元可組合使用,為汽車、醫(yī)療健康、制造、通信、零售等行業(yè)提供開發(fā)大型模型所需的AI性能。
NVIDIA DGX Foundry托管的開發(fā)解決方案正在全球擴展,使DGX SuperPOD客戶能夠在他們的系統(tǒng)安裝期間,立即獲取先進的計算基礎(chǔ)設(shè)施。北美、歐洲和亞洲的新增地點支持遠程訪問DGX SuperPOD(或其中部分)。
DGX Foundry中包含NVIDIA Base Command軟件,后者能夠使客戶基于DGX SuperPOD基礎(chǔ)設(shè)施,輕松管理端到端AI開發(fā)生命周期。
通過在全球各地的Equinix IBX(International Business Exchange)數(shù)據(jù)中心托管的NVIDIA LaunchPad實驗室,符合資格的企業(yè)可以免費體驗NVIDIA Base Command和DGX系統(tǒng)。
企業(yè)級AI軟件MLOps助力客戶提高AI采用率
為支持正在進行AI開發(fā)的DGX客戶,NVIDIA DGX-Ready軟件合作伙伴(包括Domino Data Lab、Run:ai和Weights&Biases等)提供的MLOps解決方案將加入“NVIDIA AI加速”計劃。
參與活動的合作伙伴提供的MLOps應(yīng)用程序?qū)⒔?jīng)過驗證,為DGX客戶提供企業(yè)級工作流以及集群管理、調(diào)度與編排解決方案。
此外,NVIDIA DGX系統(tǒng)現(xiàn)在包含NVIDIA AI Enterprise軟件套件,該套件新增了對裸金屬基礎(chǔ)設(shè)施的支持。DGX客戶可使用軟件套件中包含的預(yù)訓(xùn)練NVIDIA AI平臺模型、工具包和框架(例如NVIDIA RAPIDS、NVIDIA TAO工具套件、NVIDIA Triton推理服務(wù)器等)來加快工作速度。
DGX-Ready托管服務(wù)計劃能夠簡化AI部署
隨著企業(yè)AI采用率不斷提高,客戶正在尋求更多選擇,以便添加實現(xiàn)業(yè)務(wù)轉(zhuǎn)型所需的基礎(chǔ)設(shè)施。NVIDIA推出新的DGX-Ready托管服務(wù)計劃,能夠為希望與服務(wù)提供商開展合作來監(jiān)督其基礎(chǔ)設(shè)施的客戶提供支持。
德勤是率先與NVIDIA合作開展此計劃的全球提供商,并將經(jīng)過認證,可與區(qū)域供應(yīng)商(CGit、ePlus、Insight Enterprises和PTC System)一起,為歐洲、北美和亞洲的客戶提供支持。
德勤咨詢首席合伙人兼AI與數(shù)據(jù)運營服務(wù)負責(zé)人Jim Rowan表示:“只有企業(yè)能夠?qū)⒓夹g(shù)集成到運營中時,AI才可能助推業(yè)務(wù)實現(xiàn)突破。借助新的DGX-Ready托管服務(wù)計劃,客戶可以輕松采用先進的AI技術(shù)以及由德勤全球?qū)<夜芾淼腘VIDIA DGX系統(tǒng)和軟件。”
DGX-Ready生命周期管理計劃助力實現(xiàn)輕松升級
現(xiàn)在,客戶可以通過新的DGX-Ready生命周期管理計劃,借助新的NVIDIA DGX平臺升級其現(xiàn)有DGX系統(tǒng)。
參加DGX-Ready生命周期管理計劃的NVIDIA渠道合作伙伴將可以更新上一代DGX系統(tǒng),以供新客戶進行購買,并擴展用于AI基礎(chǔ)設(shè)施的全球通用系統(tǒng)的獲取途徑。
供貨信息
從第三季度起,NVIDIA的全球合作伙伴將開始供應(yīng)NVIDIA DGX H100系統(tǒng)、DGX POD 和DGX SuperPOD。
客戶還可以選擇在由Cyxtera、Digital Realty和Equinix IBX數(shù)據(jù)中心等NVIDIA DGX-Ready數(shù)據(jù)中心合作伙伴運營的托管設(shè)施中部署DGX系統(tǒng)。
七彩虹iGame GeForce RTX 3060 Ti Ultra W OC LHR
進入購買
微星(MSI)萬圖師 GeForce RTX 3060 Ti VENTUS 3X 8G OC LHR 超頻版 三風(fēng)扇 次旗艦 電競游戲設(shè)計電腦顯卡
進入購買
麗臺Quadro P1000
進入購買
關(guān)于我們 廣告服務(wù) 手機版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:39 60 2 914 2@qq.com