9月1日消息,今年是世界人工智能大會(huì)舉辦的第五年,“科技風(fēng)向標(biāo)、產(chǎn)業(yè)加速器”是這場(chǎng)全球AI領(lǐng)域的行業(yè)盛會(huì)對(duì)參展技術(shù)與產(chǎn)品的期許。針對(duì)圖像處理及內(nèi)容識(shí)別中,文檔圖像質(zhì)量退化嚴(yán)重、文字檢測(cè)及版面分析困難、非限定條件文字識(shí)別率低、結(jié)構(gòu)化智能理解能力差等全球性難題,合合信息重點(diǎn)展示了智能文字識(shí)別技術(shù)的創(chuàng)新成果及產(chǎn)業(yè)應(yīng)用示范,用科技探索產(chǎn)研融合新方向。
據(jù)介紹,合合信息智能文字識(shí)別技術(shù)主要由以“彎曲矯正”為代表的智能圖像處理,基于深度學(xué)習(xí)的復(fù)雜場(chǎng)景文字識(shí)別,自然語(yǔ)言處理(NLP)三大核心模塊組成。智能圖像處理技術(shù)可對(duì)曲面、陰影、摩爾紋等復(fù)雜場(chǎng)景下的文檔圖像進(jìn)行精準(zhǔn)的矯正處理,為接下來(lái)的文字信息提取、識(shí)別創(chuàng)造了良好的條件;復(fù)雜場(chǎng)景文字識(shí)別技術(shù)主要利用手寫(xiě)印刷混排識(shí)別,抗強(qiáng)干擾識(shí)別,扭曲文字識(shí)別等一系列深度學(xué)習(xí)技術(shù)進(jìn)行文字提取及識(shí)別,并結(jié)合領(lǐng)先的NLP技術(shù),對(duì)識(shí)別出的結(jié)果進(jìn)行語(yǔ)義理解。
本次展示的鐘鼎文識(shí)別項(xiàng)目,是繼去年的甲骨文識(shí)別之后,合合信息向古文字識(shí)別發(fā)起的又一次沖鋒。大會(huì)現(xiàn)場(chǎng)還可使用公司旗下產(chǎn)品“掃描全能王APP”,用“拍圖識(shí)字”功能一鍵識(shí)別豎排的繁體古籍《桃花源記》,將其轉(zhuǎn)化為易于閱讀的橫排、簡(jiǎn)體版本。
合合信息技術(shù)人員介紹:“選擇鐘鼎文、古籍等素材來(lái)識(shí)別,是因?yàn)榕c常規(guī)文本相比,鼎面的文字形小細(xì)密,豎排的格式也與正常的文本不同。從載體上看,青銅鼎面存在彎曲、反光、凹凸不平的狀況,古籍表面也可能有模糊、框線等因素的干擾,整體識(shí)別難度極大。這些問(wèn)題的解決不僅對(duì)文物保護(hù)和文化傳承意義重大,也有助于技術(shù)在各行業(yè)的應(yīng)用向縱深拓展。”
合合信息“PS篡改檢測(cè)”功能是智能文字識(shí)別技術(shù)的另一大亮點(diǎn)。從個(gè)人證件、票據(jù)到各類商業(yè)材料,詐騙團(tuán)伙經(jīng)常會(huì)使用PS過(guò)的材料來(lái)進(jìn)行偽裝行騙,受害者不計(jì)其數(shù)。該技術(shù)主要采用神經(jīng)網(wǎng)絡(luò)捕捉圖像在篡改過(guò)程中留下的細(xì)微痕跡,基于百萬(wàn)級(jí)的數(shù)據(jù)學(xué)習(xí)圖像被篡改后統(tǒng)計(jì)特征的變化,不僅可以判斷圖片是否被篡改,還能定位修改區(qū)域,以熱力圖形式展示圖片的PS區(qū)域篡改置信度,檢測(cè)準(zhǔn)確率遠(yuǎn)超傳統(tǒng)技術(shù)方法和人眼判斷。
“PS篡改檢測(cè)”是合合信息智能圖像處理技術(shù)優(yōu)勢(shì)的集中體現(xiàn),這種直接針對(duì)圖像特征信息的篡改檢測(cè)方法在行業(yè)中屬于創(chuàng)新應(yīng)用,覆蓋身份證、護(hù)照等多種證照識(shí)別,適用于保險(xiǎn)、銀行、證券、政務(wù)等多種場(chǎng)景。
公開(kāi)資料顯示,創(chuàng)立于2006年的合合信息在智能文字識(shí)別領(lǐng)域中已有十多年深耕經(jīng)驗(yàn),相關(guān)技術(shù)已廣泛落地各行業(yè),為全球百余個(gè)國(guó)家和地區(qū)的億級(jí)用戶提供數(shù)字化服務(wù)。據(jù)權(quán)威機(jī)構(gòu)認(rèn)定,掃描全能王 APP 針對(duì)常規(guī)的印刷體文檔字符平均識(shí)別率達(dá)到99.77%, 手寫(xiě)體文檔字符平均識(shí)別率為 97.00%;“AI+OCR”行業(yè)解決方案可識(shí)別上百種卡證、票據(jù)、行業(yè)單據(jù)內(nèi)容,支持五十多種主流語(yǔ)言的信息提取。據(jù)悉,近三年來(lái),合合信息先后在ICDAR、ICPR等人工智能國(guó)際競(jìng)賽中斬獲15項(xiàng)冠軍,學(xué)術(shù)成果在CVPR、AAAI、ACL、ACM MM等頂會(huì)上發(fā)表,相關(guān)項(xiàng)目獲中國(guó)圖象圖形學(xué)學(xué)會(huì)(CSIG)科技進(jìn)步獎(jiǎng)二等獎(jiǎng)。在今年8月的CSIG圖像圖形技術(shù)挑戰(zhàn)賽中,合合信息參與的賽隊(duì)奪得總冠軍。
關(guān)鍵詞: 智能文字識(shí)別技術(shù) 合合信息智能文字識(shí)別技術(shù) 鐘鼎文識(shí)別項(xiàng)目 PS篡改檢測(cè)功能
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:43522640@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛(ài)好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:43522640@qq.com