在27日舉行的“新視界·新壹視頻大模型發(fā)布會(huì)”上,新壹科技正式發(fā)布了首款聚焦視頻的大模型“新壹視頻大模型”、AIGC視頻生成平臺(tái)“秒創(chuàng)視頻創(chuàng)作平臺(tái)”以及首款基于商用的數(shù)字人平臺(tái)“新壹數(shù)字人平臺(tái)”。此外,新壹科技還發(fā)布了首款明星數(shù)字人祝福視頻制作產(chǎn)品“秒?!?。
新壹視頻大模型發(fā)布儀式現(xiàn)場(chǎng)。王闖 攝新壹科技創(chuàng)始人、董事長(zhǎng)韓坤在會(huì)上表示:“由于沒(méi)有從實(shí)際場(chǎng)景出發(fā),導(dǎo)致大部分通用大模型的實(shí)用性并不強(qiáng),難以真正重塑實(shí)際的生產(chǎn)。我們需要建立一個(gè)連接AI技術(shù)能力和垂直場(chǎng)景需求的大模型,能夠提供釋放生產(chǎn)力的能力,并創(chuàng)造更多實(shí)際價(jià)值的垂直場(chǎng)景大模型?!?/p>
(資料圖片)
新壹科技創(chuàng)始人、董事長(zhǎng)韓坤發(fā)表演講。王闖 攝據(jù)介紹,新壹視頻大模型是以視頻生成為核心的多模態(tài)AIGC模型。基于深度學(xué)習(xí)海量視頻樣本,新壹視頻大模型擁有了從腳本生成、素材匹配、智能剪輯配音到數(shù)字人播報(bào)的AI全流程視頻生產(chǎn)能力。讓每個(gè)人都能實(shí)現(xiàn)高質(zhì)量、高效率、低成本、無(wú)門(mén)檻視頻創(chuàng)作。
另外,新壹視頻大模型還具備多模態(tài)感知、實(shí)時(shí)學(xué)習(xí)、自迭代及多場(chǎng)景交叉推理的核心能力。能夠處理多模態(tài)的輸入信息,可以理解文字的含義,識(shí)別圖像的內(nèi)容,感知音樂(lè)的情緒,基于對(duì)內(nèi)容深度準(zhǔn)確的理解,生成視頻。
據(jù)了解,新壹視頻大模型采用了自監(jiān)督學(xué)習(xí)方案,會(huì)觀察和學(xué)習(xí)大量的視頻數(shù)據(jù),通過(guò)分析視頻的結(jié)構(gòu)、內(nèi)容、風(fēng)格等多個(gè)維度,自我理解和把握視頻制作的規(guī)則和邏輯。從而在處理視頻制作任務(wù)時(shí),能有出色的表現(xiàn)。
新壹視頻大模型能跨場(chǎng)景進(jìn)行知識(shí)遷移與關(guān)聯(lián),選擇合適素材,調(diào)整視頻風(fēng)格,生成滿(mǎn)足創(chuàng)作者需求且質(zhì)量高的視頻;其可面向行業(yè)級(jí)的垂直場(chǎng)景對(duì)新壹視頻大模型做定向訓(xùn)練,以提供更加精準(zhǔn)、專(zhuān)業(yè)的服務(wù),滿(mǎn)足客戶(hù)的多樣化需求。
韓坤表示,新壹視頻大模型不僅僅是一個(gè)工具,更是一個(gè)理解用戶(hù)、理解視頻、理解美學(xué)的藝術(shù)家。新壹科技將以“釋放AIGC視頻生產(chǎn)力”作為公司新的定位,這也是公司要達(dá)成的首要目標(biāo)。
同時(shí),新壹科技還現(xiàn)場(chǎng)演示了秒創(chuàng)視頻創(chuàng)作平臺(tái)的操作全過(guò)程。秒創(chuàng)是基于新壹科技視頻大模型的智能AI內(nèi)容生成平臺(tái)。通過(guò)秒創(chuàng)平臺(tái),創(chuàng)作者可以把一篇文章甚至是一個(gè)想法快速地制作為視頻,5分鐘即可從文案到視頻成品。為了達(dá)到這樣的效果,秒創(chuàng)除了提供圖片生成、視頻生成、聲音生成、數(shù)字人生成等AIGC功能外,還提供了一個(gè)千萬(wàn)級(jí)的結(jié)構(gòu)化視頻庫(kù)位用戶(hù)提供精準(zhǔn)匹配。據(jù)悉,秒創(chuàng)試運(yùn)營(yíng)半年多以來(lái),已經(jīng)積累了200多萬(wàn)的用戶(hù),每天產(chǎn)出超過(guò)10萬(wàn)分鐘視頻。
新壹科技CEO雷濤在現(xiàn)場(chǎng)對(duì)相關(guān)產(chǎn)品進(jìn)行演示講解。王闖 攝數(shù)字人平臺(tái)“新壹數(shù)字人平臺(tái)”同時(shí)發(fā)布。該平臺(tái)通過(guò)多模態(tài)合成AI技術(shù),該平臺(tái)可以將真人錄制的視頻和音頻素材,快速生成2D寫(xiě)實(shí)數(shù)字人。基于新壹視頻大模型,24內(nèi)小時(shí)即可完成一個(gè)數(shù)字人的訓(xùn)練。通過(guò)融合通用語(yǔ)言模型、音視頻生成技術(shù),能夠快速、低成本的生成真人播報(bào)視頻和直播,極大降低了真人出鏡門(mén)檻。此外,新壹數(shù)字人平臺(tái)也可以驅(qū)動(dòng)各種風(fēng)格的3D數(shù)字人形象。
發(fā)布會(huì)上,新壹科技還發(fā)布了明星數(shù)字人祝福視頻制作產(chǎn)品——秒祝。秒祝通過(guò)對(duì)明星視頻進(jìn)行訓(xùn)練,將明星的形象和聲音完美地還原出來(lái),生成對(duì)應(yīng)的明星數(shù)字人形象。最終呈現(xiàn)給客戶(hù)的是以明星數(shù)字人為主角的個(gè)性化定制祝福視頻。
目前,新壹科技的AI生成能力已覆蓋文本、圖像、音視頻等內(nèi)容模態(tài),已成為國(guó)內(nèi)AIGC領(lǐng)域布局最為全面、技術(shù)最成熟的公司之一,實(shí)現(xiàn)了從大模型到平臺(tái)服務(wù)再到產(chǎn)品服務(wù)落地的AIGC業(yè)務(wù)全鏈路打通。
韓坤表示,新壹科技接下來(lái)將會(huì)推出更多的垂直場(chǎng)景服務(wù)平臺(tái)和產(chǎn)品,比如為政府政務(wù)、金融保險(xiǎn)、適老養(yǎng)老、智能交互數(shù)字人以及游戲等垂直場(chǎng)景提供服務(wù),目前已經(jīng)有解決方案和產(chǎn)品正在落地。
關(guān)鍵詞:
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛(ài)好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com