數(shù)據(jù)洪流正在席卷整個世界。研究機(jī)構(gòu)Statista預(yù)計(jì),至2025年全球數(shù)據(jù)創(chuàng)建量——即創(chuàng)建、捕獲、復(fù)制和使用的數(shù)據(jù)總量,將超過180ZB。面對指數(shù)級增長的數(shù)據(jù)規(guī)模和愈發(fā)復(fù)雜的數(shù)據(jù)類型,企業(yè)想要從中獲得商業(yè)洞察變得越來越難。究其原因,是業(yè)務(wù)人員難以從海量數(shù)據(jù)中發(fā)現(xiàn)其關(guān)聯(lián)性,缺乏行之有效的工具,無法找到真正有價(jià)值的信息來指導(dǎo)業(yè)務(wù)發(fā)展。此時(shí),就不能不提大數(shù)據(jù)技術(shù)的演進(jìn)。
從Hadoop誕生之日起,大數(shù)據(jù)的發(fā)展走過了十余年,期間像存儲、離線處理等基礎(chǔ)問題已經(jīng)得到了解決。隨著深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等AI技術(shù)的逐級深入,人們開始思考如何通過挖掘大數(shù)據(jù)的關(guān)聯(lián)性去探索“隱藏”在背后的商業(yè)價(jià)值,這種訴求也將一個18年前的技術(shù)再次推到了臺前——圖數(shù)據(jù)庫。與以往用表格處理數(shù)據(jù)相比,圖沒有表的概念的,就是數(shù)學(xué)上點(diǎn)和邊的關(guān)系,所有的數(shù)據(jù)可以匯集在一起。
對于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫來說,雖然其具有靈活的特點(diǎn),可以做各種復(fù)雜計(jì)算,但在大數(shù)據(jù)時(shí)代對于并行計(jì)算、多機(jī)版的支持是缺乏的,而文檔數(shù)據(jù)庫、關(guān)鍵字、內(nèi)存數(shù)據(jù)庫,犧牲了業(yè)務(wù)的一些表達(dá)能力,得到的好處就是可擴(kuò)充,但很多以前用關(guān)系型數(shù)據(jù)庫能表達(dá)的問題卻表達(dá)不了。從存儲角度來說,圖是存儲數(shù)據(jù)最自然的關(guān)聯(lián)模型。從計(jì)算角度來說,則適合數(shù)據(jù)和人工智能。由于早年間計(jì)算性能和架構(gòu)的局限,使得圖數(shù)據(jù)庫這個在計(jì)算機(jī)科學(xué)領(lǐng)域較為高階的研究成果在近幾年才開始顯露威力。
在Neo4j高級產(chǎn)品市場總監(jiān)Maya Natarajan博士看來,伴隨數(shù)據(jù)量猛增而帶來的則是數(shù)據(jù)更加復(fù)雜且高度關(guān)聯(lián),關(guān)系型數(shù)據(jù)庫已無法滿足處理復(fù)雜關(guān)聯(lián)數(shù)據(jù)的需求,不能使客戶從數(shù)據(jù)中完全受益。相比之下,圖數(shù)據(jù)庫是專為存儲和分析高度關(guān)聯(lián)數(shù)據(jù)而生的,“隨著人工智能的發(fā)展和大數(shù)據(jù)時(shí)代的到來,并行計(jì)算類的處理需求增加,圖數(shù)據(jù)庫客戶反饋,圖在關(guān)聯(lián)模型方面具有更大的優(yōu)勢,更具有前瞻性,可以更加充分地利用關(guān)聯(lián)數(shù)據(jù)并發(fā)掘他們的價(jià)值?!?/p>
Neo4j高級產(chǎn)品市場總監(jiān)Maya Natarajan博士
事實(shí)上,近年來的數(shù)據(jù)庫領(lǐng)域正在經(jīng)歷融合式的創(chuàng)新,文檔數(shù)據(jù)庫、圖數(shù)據(jù)庫、時(shí)序數(shù)據(jù)庫、NoSQL 逐漸成為主流。與此同時(shí),數(shù)據(jù)庫也越來越多地融入了云計(jì)算、AI/ML等技術(shù)。擁有13年歷史的瑞典企業(yè)Neo4j是圖技術(shù)的開創(chuàng)者,也是原生圖數(shù)據(jù)庫市場的領(lǐng)導(dǎo)者。Neo4j的產(chǎn)品有社區(qū)版和企業(yè)版,服務(wù)著全球超過1000家企業(yè)客戶。過去十年,Neo4j從圖數(shù)據(jù)庫逐步演變成為圖數(shù)據(jù)平臺。與傳統(tǒng)的圖數(shù)據(jù)庫不同,圖數(shù)據(jù)平臺整合了數(shù)據(jù)科學(xué)、人工智能,機(jī)器學(xué)習(xí),充實(shí)和擴(kuò)大了解決方案的功能。
Gartner預(yù)測,2012年至2022年,全球圖處理及圖數(shù)據(jù)庫的應(yīng)用將以每年100%的速度迅猛增長。DB Engines近七年數(shù)據(jù)庫流行趨勢也顯示,圖數(shù)據(jù)庫相較其他主流數(shù)據(jù)庫受歡迎程度遙遙領(lǐng)先。在圖數(shù)據(jù)庫高速發(fā)展的浪潮之中,知識圖譜的重要性不言而喻。根據(jù)IDC亞太數(shù)據(jù)和內(nèi)容技術(shù)2022年預(yù)測報(bào)告,到2025年亞太地區(qū)2000家企業(yè)中約有30%將部署圖數(shù)據(jù)庫。到2023年,亞太地區(qū)20%的商業(yè)智能將整合知識圖譜。
另據(jù)Neo4j一項(xiàng)針對100名企業(yè)高管的相關(guān)調(diào)查顯示,88%的企業(yè)管理者已經(jīng)認(rèn)識到知識圖譜的價(jià)值,認(rèn)為知識圖譜可以幫助跨越管理和數(shù)據(jù)治理的瓶頸,在彌合數(shù)據(jù)孤島,改進(jìn)AI或者機(jī)器學(xué)習(xí),以及協(xié)助開辟新收入來源等方面發(fā)揮重要作用。到2023年80%的數(shù)據(jù)和分析創(chuàng)新項(xiàng)目將使用圖數(shù)據(jù)庫來實(shí)現(xiàn),而2021年只有10%的創(chuàng)新項(xiàng)目是使用圖數(shù)據(jù)庫。
阿蘭·圖靈研究所將知識圖譜定義為“對知識進(jìn)行編碼以在開放、不斷發(fā)展、去中心化系統(tǒng)中大規(guī)模使用”的最佳方式。簡而言之,知識圖譜是具有豐富含義、相互關(guān)聯(lián)的數(shù)據(jù)集。企業(yè)可以針對基礎(chǔ)數(shù)據(jù)進(jìn)行推理,并且自信地將其用于復(fù)雜的分析和決策中。
Maya Natarajan認(rèn)為,知識圖譜有三方面價(jià)值:第一、知識圖譜可以將數(shù)據(jù)轉(zhuǎn)化為智能,使企業(yè)更好地管理人工智能和機(jī)器學(xué)習(xí);第二,知識圖譜能幫助企業(yè)在不改變現(xiàn)有數(shù)據(jù)格局和基礎(chǔ)設(shè)施的前提下,進(jìn)行數(shù)據(jù)編排和自動化,為管理者提供連續(xù)觀察層,優(yōu)化數(shù)據(jù)管理、數(shù)據(jù)預(yù)測和數(shù)據(jù)創(chuàng)新,加速企業(yè)數(shù)字化轉(zhuǎn)型;第三,知識圖譜能夠幫助企業(yè)開創(chuàng)新的收入來源,提高業(yè)務(wù)效率,應(yīng)用場景分布在金融、制造、零售、電信、互聯(lián)網(wǎng)等多個行業(yè)。
據(jù)了解,Neo4j知識圖譜包含數(shù)據(jù)、顯示動態(tài)內(nèi)容的圖數(shù)據(jù)及語義在內(nèi)的三大要素。與關(guān)系型數(shù)據(jù)庫的平面結(jié)構(gòu)不同,當(dāng)數(shù)據(jù)被抽取到Neo4j動態(tài)圖結(jié)構(gòu)中存儲時(shí),節(jié)點(diǎn)和節(jié)點(diǎn)之間的關(guān)系就被添加進(jìn)來,為數(shù)據(jù)提供了動態(tài)的內(nèi)容,即第一層上下文關(guān)系。而隨著信息不斷豐富,圖也會不斷增長。在圖中獲取數(shù)據(jù)并為它添加語義,就獲得一個知識圖。語義為圖添加了第二層上下文關(guān)系,圖譜就具備了深入動態(tài)的上下文關(guān)系。通過這個步驟將智能引入到數(shù)據(jù)當(dāng)中,便于系統(tǒng)或者客戶從中推斷出不同的含義。
根據(jù)數(shù)據(jù)范圍,Neo4j知識圖譜的應(yīng)用范疇劃分為數(shù)據(jù)管理和數(shù)據(jù)分析。數(shù)據(jù)管理包括匯集、校驗(yàn)、治理和探索數(shù)據(jù)。而數(shù)據(jù)分析側(cè)重推理、預(yù)測判定。相對應(yīng)的,Neo4j提供行為圖和決策圖兩種類型的知識圖譜,協(xié)助客戶從行為知識圖譜過渡到?jīng)Q策知識圖譜,實(shí)現(xiàn)數(shù)據(jù)分析到數(shù)據(jù)智能,完成數(shù)據(jù)創(chuàng)新。
Maya Natarajan介紹稱,行為知識圖譜是以數(shù)據(jù)管理為核心的知識圖譜,其主要目的是提供數(shù)據(jù)保障,并通過數(shù)據(jù)洞察來推動決策行動。其中,數(shù)據(jù)保障側(cè)重把不同數(shù)據(jù)源的數(shù)據(jù)聚合在一起,進(jìn)行數(shù)據(jù)交叉驗(yàn)證從而產(chǎn)生洞察,數(shù)據(jù)治理包括如何溯源數(shù)據(jù)目錄和結(jié)構(gòu),數(shù)據(jù)是否存在血緣關(guān)系以及是否合規(guī),以甄別存在的風(fēng)險(xiǎn)。數(shù)據(jù)洞察專注于新知識的探索、演繹和推理,主要用例包括客戶360、產(chǎn)品360、供應(yīng)鏈360,以及身份驗(yàn)證、客戶計(jì)劃等。決策知識圖譜側(cè)重于數(shù)據(jù)分析、預(yù)測判定和基礎(chǔ)圖的機(jī)器學(xué)習(xí),主要用例包括流失分析、欺詐分析、風(fēng)險(xiǎn)分析、假設(shè)分析和影響分析以及實(shí)體解析和知識圖譜補(bǔ)全和預(yù)測模型等,例如醫(yī)療行業(yè)的患者旅程分析、制造行業(yè)的數(shù)字孿生等。
Neo4j知識圖譜解決方案是一個知識圖譜平臺,建立在豐富的產(chǎn)品基礎(chǔ)上,包括負(fù)責(zé)數(shù)據(jù)存儲的Neo4j圖數(shù)據(jù)庫,幫助建模的知識圖譜工作臺,致力數(shù)據(jù)分析的圖數(shù)據(jù)科學(xué)(GDS)和數(shù)據(jù)可視化工具Neo4j Bloom。作為原生的圖數(shù)據(jù)平臺,Neo4j專注于處理高度復(fù)雜且具有高度關(guān)聯(lián)的數(shù)據(jù),擁有超過60個圖數(shù)據(jù)算法,并且可以連接各類外部平臺,便于用戶更充分地進(jìn)行數(shù)據(jù)分析。
美國國家航空航天局利用Neo4j處理了大量的工程項(xiàng)目和文檔資料數(shù)據(jù),工程師可以通過學(xué)習(xí)項(xiàng)目知識來提高業(yè)務(wù)決策效率,數(shù)據(jù)的關(guān)聯(lián)性使得查詢搜索過程大幅加快;中國一家全球最大的通訊設(shè)備供應(yīng)商擁有超過600個數(shù)據(jù)庫,將這些數(shù)據(jù)抽取到Neo4j數(shù)據(jù)平臺,數(shù)據(jù)量超過500億節(jié)點(diǎn)和800億關(guān)聯(lián),將知識圖譜優(yōu)化之后,客戶實(shí)現(xiàn)了全面的產(chǎn)品360視圖,大幅減少了查詢時(shí)間,使產(chǎn)品團(tuán)隊(duì)得以進(jìn)行更高級和深入的數(shù)據(jù)分析;中國某家大型銀行使用Neo4j知識圖譜進(jìn)行配置管理,支持靈活建模,提高了客戶效率,讓配置管理更加自動化;全球知名PC供應(yīng)商基于Neo4j圖數(shù)據(jù)庫,對營銷和銷售各關(guān)鍵要素的關(guān)系進(jìn)行了深入挖掘,并支持了多場景的實(shí)踐,幫助業(yè)務(wù)實(shí)現(xiàn)效率與效果的提升。
類似的案例還發(fā)生在eBay、UBS、思科、Caterpillar、AstraZeneca等企業(yè)。Neo4j所有的圖數(shù)據(jù)科學(xué)項(xiàng)目都始于知識圖譜,其67%的客戶已經(jīng)成功地實(shí)施了知識圖譜。除此之外,Neo4j的成功也離不開對開發(fā)者生態(tài)的建設(shè)。目前,Neo4j的社區(qū)在全球擁有25萬名成員,并且多數(shù)分布在中國。自2018年起,Neo4j就開始活躍在中國市場,業(yè)務(wù)足跡遍布北京、上海、廣州、深圳,并與業(yè)內(nèi)合作伙伴建立了良好的關(guān)系。今年,Neo4j將在大中華區(qū)開展更多的推廣活動,提供更加本地化的資料,為社區(qū)成員提供更多的培訓(xùn),幫助其獲得Neo4j的免費(fèi)認(rèn)證。在產(chǎn)品研發(fā)上繼續(xù)加大投入,持續(xù)優(yōu)化產(chǎn)品,使其更加便于使用。
去年6月,Neo4j在F輪風(fēng)險(xiǎn)投資中獲得3.25億美元的融資,創(chuàng)造了私營數(shù)據(jù)庫公司單筆最高融資紀(jì)錄,投后估值超過20億美元。除了繼續(xù)投資圖數(shù)據(jù)平臺和數(shù)據(jù)科學(xué)之外,Neo4j還會重點(diǎn)擴(kuò)展中國市場,幫助越來越多的中國企業(yè)通過圖數(shù)據(jù)平臺來挖掘數(shù)據(jù)的價(jià)值?!癗eo4j的企業(yè)愿景就是在不同的行業(yè)場景,幫助客戶深入分析高度關(guān)聯(lián)的復(fù)雜數(shù)據(jù),使業(yè)務(wù)數(shù)據(jù)變?yōu)樯虡I(yè)智能,提高數(shù)據(jù)的應(yīng)用價(jià)值,加速企業(yè)數(shù)字化進(jìn)程?!盡aya Natarajan說。
戴爾易安信PowerEdge R340 機(jī)架式服務(wù)器(Xeon E-2224/16GB/4TB*2)
領(lǐng)券滿15000減511
進(jìn)入購買
聯(lián)想ThinkSystem SR850(Xeon Gold 5218*2/32GB/1.2TB*4)
領(lǐng)券滿50000減1000贈
進(jìn)入購買
浪潮NF2180M3(FT2000+/32GB*8/960GB*2+12TB*4/9361-8i)
進(jìn)入購買
關(guān)鍵詞: 圖數(shù)據(jù)庫 知識圖譜
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報(bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:39 60 2 914 2@qq.com