(資料圖片僅供參考)
近日,微軟發(fā)布了一款名為可組合擴(kuò)散模型(CoDi)的人工智能模型。這是一種獨(dú)特的、基于可組合擴(kuò)散的人工智能模型,其設(shè)計(jì)目標(biāo)是互動(dòng)和生成多模態(tài)內(nèi)容。 微軟設(shè)計(jì)CoDi的目標(biāo),是為了解決傳統(tǒng)單一模態(tài)AI模型的局限性。例如,在同步視頻和音頻的情況下,獨(dú)立生成的信息流拼接在一起時(shí)可能存在不一致和對(duì)齊的問題。CoDi采用了獨(dú)特的可組合生成策略,在擴(kuò)散過程中對(duì)齊多模態(tài),從而生成相互交織的模式。更重要的是,CoDi能夠處理任意輸入模式并生成任意模態(tài)的內(nèi)容。 CoDi是由微軟Azure認(rèn)知服務(wù)研究團(tuán)隊(duì)與北卡羅來納大學(xué)教堂山分校合作開發(fā)的,也是微軟項(xiàng)目i-Code的一部分,該項(xiàng)目使用人工智能來增強(qiáng)人機(jī)交互。對(duì)此項(xiàng)目感興趣的用戶可以深入了解。
關(guān)鍵詞:
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報(bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com