AI音頻轉(zhuǎn)錄工具SwiftScribe使用教程:
百度美國推出了轉(zhuǎn)錄工具SwiftScribe,一個利用人工智能,讓用戶能快速將音頻快速轉(zhuǎn)成文字的免費網(wǎng)頁工具。
百度在近年一直在持續(xù)改善其新一代深度語音識別系統(tǒng)DeepSpeech2。DeepSpeech2系統(tǒng)由百度硅谷人工智能實驗室(SVAIL)研發(fā),并在去年被麻省理工科技評論評為2016年十大突破技術(shù)。
百度在語音技術(shù)領(lǐng)域不斷進(jìn)步,語音接口更為實用和有效。用戶可以愈加便利地與身邊的設(shè)備進(jìn)行互動。百度的深度語音識別系統(tǒng)(DeepSpeech2)包含了一個非常龐大的神經(jīng)網(wǎng)絡(luò),引入了數(shù)以百萬計的轉(zhuǎn)錄語音。有時它在識別漢語語音片段方面,要比人為識別更加準(zhǔn)確。麻省理工科技評論寫道。
百度在去年也推出了應(yīng)用DeepSpeech2的安卓輸入法應(yīng)用TalkType,讓用戶能夠快速語音輸入文字。國際科技巨頭如微軟、亞馬遜、蘋果以及谷歌同樣在語音識別領(lǐng)域投入大量精力,但在長段語音識別轉(zhuǎn)錄上仍不及百度。
SwiftScribe支持上傳轉(zhuǎn)錄wav和mp3格式的音頻文件。一段30秒左右的音頻轉(zhuǎn)錄成文本時間大概為10秒,而一段1分鐘左右的文件大致需要30秒的轉(zhuǎn)錄時間。SwiftScribe最大支持用戶上傳1小時長的音頻文件,1小時的音頻則需要20分鐘左右的處理時間,百度的項目管理人武田介紹道。
但SwiftScribe的功能目前還沒有很完善,在轉(zhuǎn)錄成功后,用戶還需自行對文本進(jìn)行編輯。SwiftScribe轉(zhuǎn)錄出來的文本是不帶標(biāo)點符號的,用戶需要自行斷句、并對可能出現(xiàn)的錯誤進(jìn)行更正、以及編輯英文單詞大小寫等。不過SwiftScribe同樣提供變速閱讀工具,讓用戶在校對編輯時可以調(diào)慢播放速度。
SwiftScribe的開發(fā)靈感源于武田在加州大學(xué)圣芭芭拉分校讀研期間的采訪經(jīng)歷。
我的母語不是英語,要整理一段1小時錄音對我來說要花上10個小時。而對于專業(yè)人士來說,時間也不短,大概要6小時,武田說道。
武田和同事Nina Wei在跟幾個速記員交流過后也為開發(fā)SwiftScribe找到了不少靈感。武田的團(tuán)隊認(rèn)為SwiftScribe能給速記員帶來1.67倍的效率提升,能縮短40%的工作時間,這也意味著他們能花同樣的時間賺到更多的錢。
顯而易見,SwiftScribe并不只是單單面向于速記員,它基于網(wǎng)頁,并免費為用戶提供服務(wù),對于其他如記者等需要經(jīng)常整理音頻文件的職業(yè),SwiftScribe可謂是提高效率的神器。
我們希望在未來能夠?qū)⑵渖虡I(yè)化,武田說道,透露在技術(shù)成熟后增加收費服務(wù)的打算。
武田的團(tuán)隊計劃未來給SwiftScribe加入音頻自動轉(zhuǎn)錄文字、為視頻上字幕等功能,以及增加支持文件格式,并加入自動添加標(biāo)點符號的功能,希望大家在這里都能獲得自己需要的東西。
關(guān)鍵詞: SwiftScribe 音頻轉(zhuǎn)錄
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com