人工智能作為新一代產業(yè)變革的核心驅動力之一,其發(fā)展已經從“大煉模型”逐步邁向“煉大模型”的階段。通過設計先進的算法,整合盡可能多的數據,匯聚大量算力,集約化地訓練大模型,從而服務更多的企業(yè),正在成為人工智能發(fā)展的新趨勢。
機器人“小科”亮相國家“十三五”科技創(chuàng)新成就展、“冬奧手語播報數字人”在北京電視臺上崗。
盡管公眾對大模型的概念和它背后的技術突破還一知半解,卻已對悟道2.0大規(guī)模智能模型驅動下的這些應用不再陌生。
2021年,北京智源人工智能研究院(以下簡稱智源研究院)發(fā)布悟道大模型,連創(chuàng)“中國首個”“世界最大”紀錄。
以此為標志,越來越多的研究機構、企業(yè)加入到“煉大模型”和推動智能普惠的隊伍中,在世界人工智能技術發(fā)展和應用中貢獻中國智慧和力量。
“開閘放電”普惠社會
2021年6月1日,由智源研究院、清華大學等多個單位聯(lián)合打造的悟道2.0發(fā)布。其參數規(guī)模達1.75萬億,打破了之前由國外預訓練模型創(chuàng)造的1.6萬億的參數紀錄,成為中國首個、全球最大的萬億級預訓練模型。
智源研究院學術副院長、清華大學教授唐杰介紹,完全基于國產超算GPU平臺打造的悟道2.0取得了多項世界級的創(chuàng)新突破,在預訓練模型架構、微調算法、高效預訓練框架方面實現了原始理論創(chuàng)新,在世界公認的人工智能能力排名榜單上,取得9項能力的領先地位。
為提升大規(guī)模預訓練模型的產業(yè)普適性和易用性,悟道團隊搭建的高效預訓練框架,實現了全鏈路的原創(chuàng)突破或迭代優(yōu)化,預訓練效率大幅提升。
“需求多樣化與場景碎片化是AI落地普遍存在的難點。悟道開放平臺在快捷易用的同時,更注重解決規(guī)?;?、產業(yè)化AI應用問題。”唐杰表示,悟道大模型具備“低門檻+高效率+高情商”的特點,能夠滿足不同行業(yè)和企業(yè)實現規(guī)模化、產業(yè)化的應用需求。任何企業(yè)、開發(fā)者拿到完全開源的悟道2.0預訓練框架后,都可以快速部署并應用于實際業(yè)務中。
OPPO旗下開放式對話虛擬語音助手小布,基于悟道大模型開啟的“生成式回答系統(tǒng)”,一舉解決了行業(yè)共通性的長尾問題,單條回答建設成本降低99%。
高效的機器翻譯、智能的對話客服和語音播報在電商、媒體、教育、智能硬件等領域已經表現出極大的發(fā)展空間,驗證了大模型鋪就的邁向通用人工智能的路徑極富潛力。
智源研究院理事長張宏江指出:“未來,大模型會形成類似電網的智能基礎平臺,像發(fā)電廠一樣為全社會源源不斷供應‘智力源’,高效普惠各行各業(yè)。”
悟道2.0超大規(guī)模智能模型訓練技術體系,為我國人工智能應用構建的基礎設施,已開始為傳統(tǒng)行業(yè)智能化改造和升級“開閘放電”。
打造新型研發(fā)機制
悟道大模型實現了我國在超大規(guī)模智能模型技術的自主可控及前沿引領。智源研究院院長黃鐵軍從三個角度對于研發(fā)機制給予了解釋。
一方面,是新時代“集中力量辦大事”的科研組織模式,即保持對重大科學問題的敏銳眼光,以需求導向和問題導向布局重大科研任務,建立大任務快速論證啟動機制,組建跨機構、大協(xié)同、高強度的科研團隊,解決大問題。另一方面,以人才為中心,鼓勵自由探索,堅持求真務實、不論資排輩的人才發(fā)展模式,堅持以“代表作”和“小同行評價”遴選人才,讓想干事、能干事的青年人才“挑大梁當主角”。
“智源研究院立志要做‘永遠年輕的研究院’,注重對青年學者的吸引,期待與青年學者共同創(chuàng)造科研新范式。”張宏江說,“智源推崇‘代表作文化’,不問出身,不看論文數,只看是否取得標桿性成就,有沒有成為標桿的潛力。”
唐杰表示,未來智源研究院將繼續(xù)推進機制創(chuàng)新,既要“頂天”,也要“立地”。在吸引更多學者加入,創(chuàng)造出更多類似悟道大模型的科研“代表作”,推動北京率先成為國際領先的人工智能創(chuàng)新中心的同時,打造生態(tài),連接技術與產業(yè),推動人工智能產業(yè)發(fā)展和深度應用。
產學研相繼入場
站在“新三年計劃”的起點,悟道將圍繞提智能、降門檻、建生態(tài)多個角度,進一步向“更好用”邁進。
隨著越來越多的研究機構和技術公司入場,以虛擬數字人為典型代表的,基于大模型應用的技術創(chuàng)新和產業(yè)成果在我國全面開花。
2021年7月9日,中國科學院自動化研究所發(fā)布跨模態(tài)通用人工智能平臺“紫東太初”,基于這個全棧國產化平臺,以多模態(tài)大模型為核心打造的虛擬人“小初”,圖片、文字、語音都能理解,真實呈現了圖片、文字、語音三種模態(tài)的關聯(lián)與協(xié)同能力,再次縮短了人工智能與人類想象力的距離。
2021年9月28日,浪潮人工智能研究院發(fā)布人工智能巨量模型——源1.0,它發(fā)布時,已幾乎讀完了近5年的中文互聯(lián)網浩瀚內容。
浪潮信息副總裁劉軍表示,巨量化的一個核心特征就是模型參數多、訓練數據量大。源1.0參數量高達2457億,訓練數據集規(guī)模達到5000GB。
如中國工程院院士王恩東所言,讓機器像人類一樣具有邏輯、意識和推理等認知能力,一直是計算機科學探索、研究的重要方向。在較好解決“感知智能”問題后,這輪人工智能的發(fā)展,已經進入通過各種創(chuàng)新解決更復雜的“認知智能”問題的發(fā)展階段。
黃鐵軍說:“人工智能是新一代產業(yè)變革的核心驅動力,它的發(fā)展已經從‘大煉模型’逐步邁向‘煉大模型’。通過設計先進的算法,整合盡可能多的數據,匯聚大量算力,集約化地訓練大模型,供大量企業(yè)使用,是必然趨勢。”(劉艷 付麗麗)
關鍵詞: AI大模型 產業(yè)智能化升級 人工智能 世界人工智能技術
關于我們 廣告服務 手機版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網 版權所有 聯(lián)系網站:39 60 2 914 2@qq.com