◎本報記者 吳長鋒
通用認知智能大模型評測體系根據底層認知智能能力的智能涌現對通用認知智能大模型的能力進行分析,從而制定通用認知智能大模型的評測標準與評測方法,更科學地衡量通用認知智能大模型各個方面的能力和水平。
王士進 認知智能全國重點實驗室副主任
(資料圖)
6月3日,以“AI大模型時代的長三角數字化之路”為主題的長三角企業(yè)家聯(lián)盟產業(yè)數字化峰會在安徽合肥舉行。會上,認知智能全國重點實驗室、中國科學院人工智能產學研創(chuàng)新聯(lián)盟和長三角人工智能產業(yè)鏈聯(lián)盟共同發(fā)布了通用認知智能大模型評測體系,旨在形成一套覆蓋多任務的大模型能力客觀評測體系,引導中國認知智能大模型技術和產業(yè)健康發(fā)展。
認知智能大模型或迎爆發(fā)式增長
伴隨著人工智能技術的進步,認知智能大模型或成為實現通用人工智能的“曙光”。
未來幾年,隨著業(yè)界長期系統(tǒng)性推進人工智能的技術研發(fā),認知智能大模型或將迎來爆發(fā)式增長,傳統(tǒng)的內容生產及傳播方式或被改寫,人機協(xié)作將進一步改變人們的生產生活方式,甚至將改寫現有的產業(yè)生態(tài)格局——一些傳統(tǒng)產業(yè)將“被迫”進行轉型升級,認知智能技術將創(chuàng)造出新的職業(yè)、崗位,為整個信息產業(yè)和數字經濟帶來新的發(fā)展契機。
5月6日,科大訊飛股份有限公司(以下簡稱科大訊飛)正式發(fā)布訊飛星火認知大模型。僅一個月后,科大訊飛宣布,星火認知大模型“牽手”工業(yè)互聯(lián)網平臺,實現在“產、供、銷、服、管”等各流程的知識學習與人工智能賦能,有效助力企業(yè)降本增效。
從各大互聯(lián)網企業(yè)的發(fā)展路徑可以看出,工業(yè)互聯(lián)網建設和企業(yè)數字化轉型等或是實現認知智能大模型規(guī)模化落地應用的重要切入口。
然而,如何提前研判認知智能大模型給各行各業(yè)帶來的顛覆性改變和創(chuàng)新性發(fā)展機遇,使得企業(yè)能夠及時且有針對性地作出相應的調整?這就需要一套科學、系統(tǒng)的客觀評測體系,既可以綜合判斷現階段的技術進展,還能夠明確認知智能大模型多維度的發(fā)展路徑。認知智能大模型領域“百花齊放”,效果度量和評價成為重點,覆蓋多維度、多任務的客觀評測成為驗證認知智能大模型能力的重要手段。
科學研判通用認知智能大模型
針對現實需求,認知智能全國重點實驗室牽頭設計,與中國科學院人工智能產學研創(chuàng)新聯(lián)盟、長三角人工智能產業(yè)鏈聯(lián)盟一起,從產學研源頭技術創(chuàng)新和產業(yè)鏈應用落地兩方面出發(fā),組織多輪評測標準研討會議,邀請中國科學院科技戰(zhàn)略咨詢研究院、中科寒武紀科技股份有限公司、科大訊飛等產學研各界代表探討交流,共同形成了通用認知智能大模型評測體系。
“評測體系根據底層認知智能能力的智能涌現對通用認知智能大模型的能力進行分析,從而制定通用認知智能大模型的評測標準與評測方法,更科學地衡量通用認知智能大模型各個方面的能力和水平。”認知智能全國重點實驗室副主任王士進介紹說。
王士進表示,本次發(fā)布的評測體系覆蓋內容生成、語言理解、知識問答、邏輯推理、數學能力、編程能力、多模態(tài)7大能力維度,共計481個細分任務類型,力求為大模型的研究、行業(yè)標準的制定提供參考和借鑒。
他表示,未來評測體系將致力于讓認知智能大模型技術真正解決社會剛需,助力長三角打造具有全球影響力的通用人工智能科技創(chuàng)新策源地和新興產業(yè)聚集地?!皣@推動通用人工智能評測體系共建,下一步,認知智能全國重點實驗室希望與長三角企業(yè)家聯(lián)盟單位基于通用評測體系持續(xù)合作優(yōu)化,共同推動行業(yè)評測方案落地,促進技術和產業(yè)健康發(fā)展?!蓖跏窟M說。
關鍵詞:
關于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網 版權所有 聯(lián)系網站:435 226 40@qq.com