算力改變世界,算力讓世界更美好。
這幅懸掛在聯(lián)泰集群(北京)科技有限責(zé)任公司(以下簡稱:聯(lián)泰集群)辦公區(qū)的標(biāo)語讓人印象深刻?!拔覀兂闪⒊蹙吞峁└咝阅苡?jì)算集群產(chǎn)品與服務(wù)”,聯(lián)泰集群軟件產(chǎn)品中心總監(jiān)孫建軍介紹說?!安贿^伴隨著近些年算力崛起和多種應(yīng)用需求的迭代,如今的聯(lián)泰集群也提供了包括大數(shù)據(jù)、深度學(xué)習(xí)、人工智能、云計(jì)算等眾多領(lǐng)域的算力產(chǎn)品”。
聯(lián)泰集群軟件體系
當(dāng)筆者問到“聯(lián)泰集群的軟件也是服務(wù)于這些產(chǎn)品嗎?孫建軍笑著說:“可以這么理解,不過從廣義來說,高性能計(jì)算集群服務(wù)本身就是軟硬件一體的模式,聯(lián)泰集群輸出的也是整體化的、軟硬件協(xié)同的解決能力。特別是伴隨著AI應(yīng)用的興起,如今我們的軟件產(chǎn)品和服務(wù)也更為豐富;在很多專業(yè)的豎直應(yīng)用領(lǐng)域我們的軟件產(chǎn)品有著很深的經(jīng)驗(yàn)積累”。
的確,高性能計(jì)算本身就是軟硬件結(jié)合的學(xué)科。與許多人印象中冷冰冰的機(jī)器不同,高性能計(jì)算一方面需要強(qiáng)大的硬件基礎(chǔ)設(shè)施支持,但另一方面也需要配套的軟件調(diào)度支持;而軟件層面的算力優(yōu)化和優(yōu)良的運(yùn)維交互能力,同樣會(huì)體現(xiàn)出不同品牌的差異化價(jià)值。就好比我們每個(gè)人用的手機(jī),即便是相同的處理器規(guī)格、相同的運(yùn)存容量,不同的操作系統(tǒng)創(chuàng)造了不同的應(yīng)用環(huán)境,也帶給了用戶不同的體驗(yàn),這一點(diǎn)許多人都有感受——即便是同一部手機(jī),在安裝不同的操作系統(tǒng)后,性能和體驗(yàn)表現(xiàn)也會(huì)不同。
這也正是孫建軍所在中心的價(jià)值體現(xiàn)。近些年,我國在高性能計(jì)算領(lǐng)域成績斐然,我們?cè)谟布I(lǐng)域的實(shí)力已經(jīng)得到驗(yàn)證,但是在軟件適配性上,我們依然有很長的路要走。從這個(gè)角度來說,要想實(shí)現(xiàn)中國從“高性能計(jì)算大國”到“高性能計(jì)算強(qiáng)國”的轉(zhuǎn)變,硬件與軟件應(yīng)用缺一不可,這也同樣需要包括產(chǎn)學(xué)研用在內(nèi)各方面的共同努力。而聯(lián)泰集群作為中國高性能計(jì)算領(lǐng)域的“應(yīng)用先鋒”,這一點(diǎn)也是責(zé)無旁貸。
“先鋒”一詞這并非是對(duì)聯(lián)泰集群的刻意夸獎(jiǎng)。早在2019年的HPCChina全國高性能計(jì)算學(xué)術(shù)年會(huì)上,聯(lián)泰集群便榮獲了“推動(dòng)高性能集群應(yīng)用普及先鋒獎(jiǎng)”,而在隨后的2020年和2021年中國超級(jí)算力大會(huì)(ChinaSC)上,聯(lián)泰集群同樣憑借出色的性能在AIPerf500人工智能性能排行榜中排名靠前,展現(xiàn)了強(qiáng)大的整體實(shí)力。能夠在競(jìng)爭(zhēng)激烈的高性能計(jì)算市場(chǎng)獲得這樣的成就已經(jīng)難能可貴,也證明聯(lián)泰集群是一家深耕技術(shù)與應(yīng)用的公司。
“我們服務(wù)過很多的客戶,我們把相應(yīng)的服務(wù)技術(shù)能力和服務(wù)經(jīng)驗(yàn)固化為最佳實(shí)踐,最終通過聯(lián)泰集群軟硬件一體化的形式交付給客戶”,孫建軍介紹說。相對(duì)于其他高性能解決方案提供商來說,聯(lián)泰集群最特別的就是有10余年的高性能計(jì)算豎直應(yīng)用領(lǐng)域的行業(yè)積淀;同時(shí)不斷用工匠精神打磨優(yōu)化軟件產(chǎn)品。眾所周知,科研領(lǐng)域一直是高性能計(jì)算應(yīng)用的重點(diǎn),而包括流體力學(xué)、分子動(dòng)力學(xué)等專業(yè)中聯(lián)泰集群都有豐富的解決能力與技術(shù)經(jīng)驗(yàn)的沉淀,可以為客戶提供包括計(jì)算、調(diào)度與綜合管理等功能的軟件在內(nèi)的整套解決方案?!笆褂寐?lián)泰集群的軟件產(chǎn)品,不論客戶是做高性能科學(xué)計(jì)算,還是私有云、深度學(xué)習(xí)等方面的應(yīng)用,平臺(tái)級(jí)的優(yōu)化與軟件支持我們已經(jīng)幫客戶解決掉了,客戶只需專注于自己的作業(yè)代碼編寫、業(yè)務(wù)模型、算法本身的優(yōu)化等工作就可以了,這樣大大提升了客戶的算力效率”。
在深度學(xué)習(xí)方面,聯(lián)泰集群提供一站式的LtAI異構(gòu)資源管理平臺(tái);在云計(jì)算方面,聯(lián)泰集群提供LtCloud云資源管理平臺(tái),在高性能HPC應(yīng)用方面,聯(lián)泰集群提供LtHCS高性能計(jì)算集群系統(tǒng)。各個(gè)軟件都從算力效率與用戶體驗(yàn)輸出最佳實(shí)踐。在我們提到的LtHCS高性能計(jì)算集群系統(tǒng)中,產(chǎn)品采用了可視化的方式,可以讓用戶通過易用的Web圖形操作界面,高效的使用HPC計(jì)算集群中的各種計(jì)算資源。相對(duì)于傳統(tǒng)的代碼管理來說,這種圖形界面的好處就在于簡化使用者的應(yīng)用難度,降低了操作的繁瑣性,也提升了用戶團(tuán)隊(duì)的管理效率。與此同時(shí),該系統(tǒng)還可以針對(duì)計(jì)算資源提供核心指標(biāo)的監(jiān)控統(tǒng)計(jì)數(shù)據(jù),以方便用戶進(jìn)一步優(yōu)化作業(yè)任務(wù)、高效的調(diào)度計(jì)算資源。
結(jié)合當(dāng)下行業(yè)自動(dòng)化運(yùn)維、智能運(yùn)維等應(yīng)用特性,這套系統(tǒng)也提供了許多智能化的管理功能。比如,自動(dòng)化作業(yè)管理功能可以幫助用戶自動(dòng)將作業(yè)腳本分發(fā)到特定分區(qū)的計(jì)算節(jié)點(diǎn),按約定時(shí)間啟動(dòng)作業(yè)任務(wù)。使用者直接在管理平臺(tái)就可以查看實(shí)時(shí)的作業(yè)計(jì)算結(jié)果,并隨時(shí)查看作業(yè)的運(yùn)行狀態(tài);節(jié)點(diǎn)自動(dòng)SSH管理功能可以幫助管理員直接通過Web端連接到具體的計(jì)算節(jié)點(diǎn)做節(jié)點(diǎn)運(yùn)維,不需輸入計(jì)算節(jié)點(diǎn)服務(wù)器的帳號(hào)數(shù)據(jù)。對(duì)于大型的集群環(huán)境來說也能極大的提升了運(yùn)維效率等等。
除了智能化之外,異構(gòu)適配也是當(dāng)下高性能計(jì)算平臺(tái)架構(gòu)的重要發(fā)展方向,比如GPU計(jì)算、FPGA加速等等,再比如對(duì)于ARM、RISC-V等平臺(tái)的支持。以往,高性能計(jì)算大多使用的是x86架構(gòu),而要進(jìn)行這種異構(gòu)支撐則需要進(jìn)行代碼遷移,這是一項(xiàng)耗時(shí)耗力的工作,也會(huì)因此延誤客戶的應(yīng)用進(jìn)度,進(jìn)而影響作業(yè)項(xiàng)目的交付周期。
為了解決這一問題,聯(lián)泰集群的軟件團(tuán)隊(duì)經(jīng)過技術(shù)攻關(guān),提供了一種類似于“樂高積木”的混搭方案。在最初規(guī)劃階段,就設(shè)計(jì)了異構(gòu)平臺(tái)復(fù)用架構(gòu),并實(shí)現(xiàn)了代碼不同應(yīng)用層的“解耦”。這樣一來,針對(duì)不同的硬件架構(gòu)的適配調(diào)優(yōu)就會(huì)變得簡單,而上層代碼就可以無縫遷移,大大提升了效率,縮短了開發(fā)周期?!拔覀?cè)谠O(shè)計(jì)的時(shí)候就考慮到了復(fù)用和重構(gòu)的問題,留有充足的空間”。
如今,聯(lián)泰集群已經(jīng)深入科研、企業(yè)、互聯(lián)網(wǎng)等多個(gè)領(lǐng)域當(dāng)中,我們熟悉的清華大學(xué)、北京大學(xué)、北京航空航天大學(xué)等諸多名校都是聯(lián)泰集群的優(yōu)質(zhì)客戶。不僅如此,在于這些客戶合作的過程中,聯(lián)泰集群還開發(fā)出一種“產(chǎn)學(xué)研聯(lián)動(dòng)”的服務(wù)模式,與高校的科研力量進(jìn)行合作技術(shù)開發(fā),并攜手清華大學(xué)、中科院、英偉達(dá)、北京協(xié)同創(chuàng)新研究院等多家單位共同推動(dòng)高性能計(jì)算應(yīng)用的發(fā)展。
當(dāng)然聯(lián)泰集群的未來之路還遠(yuǎn)不止如此。伴隨著當(dāng)下企業(yè)級(jí)市場(chǎng)云應(yīng)用的大趨勢(shì),聯(lián)泰集群也在積極探索算力云應(yīng)用的新方式,也計(jì)劃攜手合作伙伴提供開放的云算力平臺(tái),實(shí)現(xiàn)私有云與公有云的雙重服務(wù)體系。在談到2022年發(fā)展的時(shí)候,孫建軍表示伴隨著算力需求的不斷提升,伴隨著人工智能應(yīng)用的逐漸繁榮,未來聯(lián)泰集群也將幫助更多的客戶解決更多的實(shí)際問題,推動(dòng)產(chǎn)業(yè)的快速發(fā)展;聯(lián)泰集群也將一如既往,協(xié)助各位合作伙伴們提升算力能力,為算力賦能。
正如聯(lián)泰集群墻上的標(biāo)語那樣:“做最好的聯(lián)泰(集群),做最好的自己”。
關(guān)鍵詞: 聯(lián)泰集群
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:39 60 2 914 2@qq.com