借助NVIDIA DGX SuperPOD,京東探索研究院訓練了參數(shù)量近五十億的Vega-MT模型,在2022年第17屆國際機器翻譯大賽(WMT)上大放異彩。Vega-MT在中文-英語(BLEU 33.5, chrF 0.611)、英文-中文(BLEU 49.7, chrF 0.446)、德語-英語(BLEU 33.7, chrF 0.585)、英語-德語(BLEU 37.8, chrF 0.643)、捷克語-英語(BLEU 54.9, chrF 0.744)、英語-捷克語(BLEU 41.4, chrF 0.651)和英語-俄羅斯語(BLEU 32.7, chrF 0.584)在七個翻譯賽道上榮獲冠軍。
(資料圖)
模型訓練任務縮短到兩周內(nèi)完成,且在算力和擴展性上都有倍數(shù)提升
作為大規(guī)模AI基礎架構,NVIDIA DGX SuperPOD具備完整、先進的基礎架構。相較于原來的V100集群,DGX SuperPOD除了在單卡算力上取得了接近兩倍的提升外,在算力擴展性方面也呈線性增長,即擴展性方面相較于從前也取得了兩倍的提升。在多節(jié)點的情況下總計獲得了約4倍的提升。因此,原本需要數(shù)月才能完成類似模型(相當規(guī)模、相當復雜度)的訓練任務縮短到了兩周,研究人員也有了更充裕的時間針對模型優(yōu)化。
客戶簡介及應用背景
京東作為以供應鏈為基礎的技術與服務企業(yè)。京東探索研究院(JD Explore Academy)秉承“以技術為本,致力于更高效和可持續(xù)的世界”的集團使命,是以京東集團以各事業(yè)群與業(yè)務單元的技術發(fā)展為基礎,集合全集團資源和能力,成立的專注前沿科技探索的研發(fā)部門,是實現(xiàn)研究和協(xié)同創(chuàng)新的生態(tài)平臺。探索研究院深耕泛人工智能3大領域,包括“量子機器學習”、“可信人工智能”、“超級深度學習”,從基礎理論層面實現(xiàn)顛覆式創(chuàng)新,助力數(shù)智化產(chǎn)業(yè)發(fā)展及社會變革,以原創(chuàng)性科技賦能京東集團零售、物流、健康、科技等全產(chǎn)業(yè)鏈場景,打造源頭性科技高地,實現(xiàn)從量變到質(zhì)變的跨越式發(fā)展,引領行業(yè)砥礪前行。
國際機器翻譯大賽(WMT)是全球?qū)W術界公認的國際頂級機器翻譯比賽,由國際計算語言學協(xié)會(ACL)舉辦,是協(xié)會旗下的頂尖賽事。自2006年至今,WMT 的每次比賽都是全球各大高校、科技公司與學術機構展示自身機器翻譯實力的平臺,更見證了機器翻譯技術的不斷進步。
京東探索研究院在WMT大賽上這一重大成就進一步驗證了自然語言處理大模型在理解、生成、跨語種建模上的優(yōu)越性。
客戶挑戰(zhàn)
機器翻譯面臨諸多挑戰(zhàn):常見的幾個語種使用廣泛數(shù)據(jù)資源豐富,小語種在跨境電商中非常必要但數(shù)據(jù)不充分,小數(shù)據(jù)集的訓練面臨挑戰(zhàn);同時,挖掘語種與語種的聯(lián)系也是難點之一,因為語言生成的復雜性、多義性,表達的多樣性、文化背景,語種之間的差異等都是機器翻譯比賽中繞不開的難題。
從2018年的GPT-1的1.1億參數(shù),到現(xiàn)今大規(guī)模語言模型擁有萬億參數(shù),大模型在多種語言任務上準確率的顯著提高,有助于我們構建對自然語言有著更加豐富理解的智能系統(tǒng)。
Vega-MT采用了諸多先進技術,包括多方向預訓練(multidirectional pre-training)、超大模型(Extremely Large Transformer)、循環(huán)翻譯(cycle translation)和雙向自訓練(bidirectional self-training),來充分挖掘雙語數(shù)據(jù)、單語數(shù)據(jù)的知識。此外,還使用了噪聲信道重排序和泛化性微調(diào)等策略來增強 Vega-MT 系統(tǒng)的魯棒性和譯文的信達雅水平。
但是,在訓練大模型時,我們依然會面臨諸多困難。在此之前對于一般任務一張GPU即可勝任模型的訓練,但是在大模型場景,需要多節(jié)點協(xié)同才能完成最終的訓練任務,這也對現(xiàn)有的GPU計算集群提出了新的挑戰(zhàn)。以知名的GPT-3為例,它使用了45TB的訓練數(shù)據(jù),最高達到1750億的模型參數(shù)量;在采用混合精度時,它共占用約2.8TB的顯存,需要超過35張GPU才能將模型全部放下。
因此,訓練的挑戰(zhàn)集中在單卡算力和多卡多節(jié)點通信上,訓練也會跨越多個節(jié)點。此時數(shù)據(jù)傳輸、任務調(diào)度、并行優(yōu)化、資源利用率等方面就顯得尤為重要。
應用方案
在構建 AI 基礎架構時,我們會面臨來自方方面面的挑戰(zhàn),例如計算資源,網(wǎng)絡,存儲,乃至最上層用來進行任務調(diào)度的軟件等,而這些方面并非獨立,需要綜合考量。
京東探索研究院采用的NVIDIA DGX SuperPOD就是一套綜合完整的高性能解決方案。SuperPOD AI集群,基于DGX服務器,HDR InfiniBand 200G網(wǎng)卡以及NVIDIA Quantum QM8790交換機,計算網(wǎng)絡和儲存網(wǎng)絡隔離,既保證了最優(yōu)的算力,又可以確保節(jié)點和卡之間的高效互聯(lián),最大程度提升分布式訓練的效率。
算力層面,單節(jié)點算力高達2.4 PFLOPS,采用單節(jié)點進行訓練,BERT只需17分鐘即可完成訓練,Mask R-CNN 38分鐘,RetinaNet也只需83分鐘。而針對于Transformer XL Base,181分鐘即可完成訓練。同時,依托于多實例GPU(Multi-Instance GPU, MIG)技術,可以將 GPU 分割成多個實例,每個實例都有其獨立的顯存,緩存以及流式多處理器,彼此之間故障隔離。這樣一來可以進一步提升GPU的利用率,同時滿足需要不同算力的任務。
網(wǎng)絡層面,通過Scalable Hierarchical Aggregation and Reduction Protocol(SHARP)技術,可以讓聚合計算從CPU遷移到交換機網(wǎng)絡,消除了節(jié)點之間多次發(fā)送數(shù)據(jù)的需求,大幅縮減了到達聚合節(jié)點的網(wǎng)絡流量,從而顯著減少執(zhí)行MPI的時間,同時讓通信效率與節(jié)點數(shù)目不再直接相關,進一步保障了算力的可擴展性。除此之外,將CPU從處理通信的任務中解脫出來,讓寶貴的CPU資源聚焦于計算上,進一步提升了整體集群處理任務的能力。
儲存層面,在訓練模型時,往往需要從存儲中多次讀取訓練數(shù)據(jù),而讀取操作的耗時也會在一定程度上影響訓練的時效。DGX SuperPOD使用了高性能的多層級儲存架構,以平衡性能、容量和成本的需求。而借助于GPU Direct RDMA技術,可以繞過CPU直接連通GPU,儲存和網(wǎng)絡設備,從而進行高速低時延的數(shù)據(jù)傳輸。
軟件層面,為了構建集群以及保障集群的持久化平穩(wěn)運行,上層的監(jiān)控調(diào)度管理軟件不可或缺。Base Command Manager是一個集群管理系統(tǒng),它可以對集群進行一系列的配置,管理用戶訪問,資源監(jiān)控,記錄日志,以及通過slurm進行作業(yè)任務調(diào)度。同時,NGC上涵蓋了大量AI、HPC、數(shù)據(jù)科學相關的資源,用戶可以輕松獲取到功能強大的軟件,容器鏡像,以及各類預訓練模型。
與此同時,探索研究院團隊對集群進行了7x24小時的監(jiān)控管理,確保訓練任務長時間的平穩(wěn)運行。監(jiān)控資源利用率,也確保了每個節(jié)點上的計算資源能被充分地利用了起來。在完善的調(diào)度監(jiān)控工作和 DGX SuperPOD 高可靠性的質(zhì)量保證下,所有被使用到的訓練節(jié)點在模型訓練的20天(2 周 pre-training + 5天 fine-tuning)內(nèi),沒有出現(xiàn)任何問題,訓練最終圓滿完成。
使用效果及影響
Vega-MT被成功應用在了京東國慶期間對外發(fā)布的Omni-Force AIGC小程序中。小程序的應用是用戶輸入文字生成對應的圖片,在Vega-MT的加持下,小程序可以支持多個語種的文字輸入,譬如中文、英文、西班牙文等等。
京東探索研究院表示: “通過NVIDIA DGX SuperPOD的加持,京東探索研究院可以快速迭代模型,幫助高準確度的模型快速落地,進一步提升用戶體驗,降低成本,提升效果和業(yè)務收益。此次NVIDIA DGX SuperPOD支持我們能在WMT比賽中拔得頭籌,不僅提高了企業(yè)的知名度,也助力了京東成為更受用戶信賴的品牌”。
值得一提的是,除了Vega-MT外,NVIDIA DGX SuperPOD也在探索研究院的其他大模型訓練上發(fā)揮了不可或缺的作用,譬如ViTAE、織女模型等。
瓏京英偉達NVIDIA Tesla V100 32G 深度學習全新架構計算4U服務器專業(yè)顯卡
進入購買
英偉達(NVIDIA)RTX30系列公版單渦輪雙寬深度學習訓練顯卡AI運算GPU NVIDIA RTX3090 24G公版盒裝
進入購買
關鍵詞:
關于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網(wǎng) 版權所有 聯(lián)系網(wǎng)站:435 226 40@qq.com