(資料圖片僅供參考)
以ChatGPT為代表的生成式人工智能廣受關(guān)注,大模型亦在加速發(fā)展??蒲袌F(tuán)隊(duì)近日發(fā)布新的AI安全平臺(tái),以期為大模型系好“安全帶”、把好“方向盤”。
據(jù)介紹,人工智能安全平臺(tái)RealSafe3.0版本由清華大學(xué)人工智能研究院孵化企業(yè)瑞萊智慧RealAI發(fā)布。該平臺(tái)能夠提供端到端的模型安全性測(cè)評(píng)解決方案,旨在解決當(dāng)前通用大模型安全風(fēng)險(xiǎn)難以審計(jì)的“痛點(diǎn)”。
“大模型‘落地難’的本質(zhì)在于,當(dāng)前還沒(méi)有找到場(chǎng)景、風(fēng)險(xiǎn)和規(guī)范三者之間的平衡點(diǎn)。”瑞萊智慧聯(lián)合創(chuàng)始人、算法科學(xué)家蕭子豪在受訪時(shí)說(shuō),而在探尋這一平衡點(diǎn)的過(guò)程中缺少易用和標(biāo)準(zhǔn)化的工具。換言之,亟須在技術(shù)層面找到有力抓手,幫助人們科學(xué)評(píng)判大模型在場(chǎng)景中能否同時(shí)滿足規(guī)范和低風(fēng)險(xiǎn),助力大模型上線運(yùn)行。
據(jù)知,相較上一版本,RealSafe3.0新增了對(duì)通用大模型的評(píng)測(cè)。該平臺(tái)覆蓋數(shù)據(jù)安全、認(rèn)知任務(wù)、通用模型特有漏洞、濫用場(chǎng)景等近70個(gè)評(píng)測(cè)維度,可以全方位、多維度地評(píng)測(cè)通用大模型的性能,未來(lái)還會(huì)持續(xù)擴(kuò)增測(cè)評(píng)維度的數(shù)量。
蕭子豪介紹說(shuō),RealSafe3.0內(nèi)部集成了多個(gè)自研模型和專家論證高質(zhì)量數(shù)據(jù)集,來(lái)幫助用戶修復(fù)模型中的問(wèn)題。例如,對(duì)黑盒不可解釋的通用大模型,自研紅隊(duì)對(duì)抗模型取代人工設(shè)計(jì)問(wèn)題,顯著提升攻擊成功率和樣本多樣性。
再如,教練模型通過(guò)對(duì)被測(cè)大模型進(jìn)行多輪次的“提問(wèn)—回答訓(xùn)練”,并以訓(xùn)練好的評(píng)分模型對(duì)問(wèn)答結(jié)果進(jìn)行評(píng)分,再將評(píng)分結(jié)果反饋給大模型,使其不斷強(qiáng)化學(xué)習(xí)到好壞答案的要點(diǎn)及區(qū)別,直至問(wèn)答能力逐步迭代至最優(yōu)。
值得一提的是,瑞萊智慧科研團(tuán)隊(duì)還研發(fā)出能夠防范生成式人工智能惡意濫用的DeepReal2.0,即“生成式人工智能內(nèi)容檢測(cè)平臺(tái)”。該平臺(tái)支持對(duì)圖像、視頻、音頻、文本進(jìn)行是否偽造的檢測(cè),應(yīng)用場(chǎng)景包括打擊網(wǎng)絡(luò)詐騙和聲譽(yù)侵害行為、檢測(cè)網(wǎng)絡(luò)內(nèi)容合規(guī)性、檢測(cè)音視頻物證真實(shí)性等。
“我們將持續(xù)迭代技術(shù)、打磨產(chǎn)品,以確保在這場(chǎng)人工智能安全‘攻防戰(zhàn)’中始終立于不敗之地,將人工智能的兩面性這一‘關(guān)鍵變量’,轉(zhuǎn)化為高質(zhì)量發(fā)展的‘最大增量’?!笔捵雍勒f(shuō)。(完)
關(guān)鍵詞:
最新資訊
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com