【資料圖】
2023世界人工智能大會(huì)“科技與人文——共筑無障礙智能社會(huì)”論壇8日在上海世博中心召開。
北京大學(xué)智能學(xué)院、跨媒體通用人工智能全國(guó)重點(diǎn)實(shí)驗(yàn)室研究員,超級(jí)自動(dòng)化聯(lián)合實(shí)驗(yàn)室主任馬修軍博士在論壇上作題為《跨越AIGC大模型的鴻溝:視覺語言大模型推動(dòng)泛在的具身智能》的主旨演講,從多模態(tài)通用模型角度,洞觀AIGC(生成式人工智能)的下一熱點(diǎn)——具身智能的發(fā)展以及大模型創(chuàng)新鏈與產(chǎn)業(yè)鏈深度融合。
人工智能已經(jīng)邁入AIGC時(shí)代,全球產(chǎn)業(yè)界都在競(jìng)爭(zhēng)具有泛化能力的語言大模型,大模型產(chǎn)業(yè)鏈與生態(tài)鏈日益完善,國(guó)際巨頭不斷推高大語音模型能力,國(guó)內(nèi)百度、華為,騰訊、阿里等也在加速布局語言大模型。
馬修軍介紹道,當(dāng)前,基于語言大模型的工具鏈和生態(tài)不斷涌現(xiàn),大模型應(yīng)用重點(diǎn)轉(zhuǎn)向行動(dòng)導(dǎo)向,調(diào)用和操作外部系統(tǒng)和工具,即大模型從知識(shí)、推理轉(zhuǎn)向行動(dòng)驅(qū)動(dòng)?!暗Z言大模型的普及仍存在三大鴻溝:一是幻覺問題,二是記憶和個(gè)性化問題,三是多模態(tài)與物理世界交互問題?!彼J(rèn)為,AIGC大模型下一個(gè)熱點(diǎn)是多模態(tài)和具身智能。
所謂“具身智能”,是指能夠理解、推理并與物理世界交互的通用智能體,具有多模態(tài)感知認(rèn)知能力和自主多任務(wù)機(jī)制。視覺語言大模型是多模態(tài)通用模型的核心。
視覺也是一種語言,語言的載體是文字?!爸袊?guó)象形文字天然具有多模態(tài)表征和明文通信的編碼能力,看一個(gè)字就知道什么意思。借助象形文字的編碼思想,我們可以為人工智能表征世界設(shè)計(jì)一種多模態(tài)特征編碼,進(jìn)而發(fā)展多模態(tài)通用語言大模型?!瘪R修軍說。
據(jù)介紹,視覺語言大模型基于對(duì)現(xiàn)實(shí)世界表征預(yù)測(cè)的類象形文字的特征編碼,使得人工智能擁有了自己的文字,可以理解像素、聽懂語音序列并感知世界,真正擁有具身智能的核心能力,并且這種多模態(tài)文字編碼可用于具身智能之間的通訊交互,構(gòu)建一個(gè)泛在的機(jī)器智能社會(huì)。
馬修軍認(rèn)為,多模態(tài)通用模型與具身智能是未來產(chǎn)業(yè)發(fā)展的基石,需要貫通學(xué)研產(chǎn)用全鏈條,推動(dòng)大模型創(chuàng)新鏈與產(chǎn)業(yè)鏈深度融合。通信運(yùn)營(yíng)商算網(wǎng)融合,需要為多模態(tài)具身智能的通信重塑再造一種新型基礎(chǔ)設(shè)施,包括面向機(jī)器通信的編碼、消息格式及網(wǎng)元算力等。例如,面向機(jī)器的視覺編碼VCM與5G消息以及大模型的融合創(chuàng)新。
“在AIGC時(shí)代,全球產(chǎn)業(yè)界都在競(jìng)爭(zhēng)通用人工智能的基礎(chǔ)模型,這是人工智能產(chǎn)業(yè)的皇冠,是未來智能社會(huì)的底座,并且它的演進(jìn)速度非???。”馬修軍表示,以大模型為基座的人工智能通用能力不會(huì)曇花一現(xiàn),多模態(tài)通用模型與具身智能將重塑未來社會(huì)的產(chǎn)業(yè)鏈和產(chǎn)業(yè)生態(tài),產(chǎn)生像互聯(lián)網(wǎng)一樣的影響力。
據(jù)悉,本次論壇由世界人工智能大會(huì)組委會(huì)辦公室指導(dǎo),中國(guó)新聞社上海分社、上海市楊浦區(qū)人民政府聯(lián)合主辦,上海中新傳媒文化咨詢有限公司、上海市楊浦區(qū)科委承辦,上海市現(xiàn)代服務(wù)業(yè)聯(lián)合會(huì)、上海市海外經(jīng)濟(jì)技術(shù)促進(jìn)會(huì)、上海市長(zhǎng)寧區(qū)北新涇街道辦事處、上海新之海數(shù)據(jù)信息有限公司協(xié)辦,中新社國(guó)際傳播集團(tuán)上海分公司、上海市人工智能行業(yè)協(xié)會(huì)支持。(完)
關(guān)鍵詞:
推薦閱讀
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com