甲骨文宣布,Oracle MySQL HeatWave現(xiàn)支持數(shù)據(jù)庫內(nèi)機器學習(ML),為之前的事務處理和分析功能錦上添花,這是唯一支持此功能的MySQL云數(shù)據(jù)庫服務。MySQL HeatWave ML全面自動執(zhí)行機器學習生命周期,并將所有經(jīng)過訓練的模型存儲在MySQL數(shù)據(jù)庫中,因此無需將數(shù)據(jù)或模型移動到機器學習工具或服務中。消除提取、轉(zhuǎn)換和加載 (ETL) 流程可降低應用程序的復雜性與成本,并提高數(shù)據(jù)和模型的安全性。HeatWave ML功能現(xiàn)已包含在所有37個Oracle云基礎設施(OCI)區(qū)域的MySQL HeatWave數(shù)據(jù)庫云服務中。
HeatWave ML可以全面自動化模型訓練、推斷和解釋
到目前為止,為MySQL應用程序添加機器學習功能對許多開發(fā)人員來說非常困難且耗時。首先,開發(fā)人員需要將數(shù)據(jù)從數(shù)據(jù)庫提取到另一個系統(tǒng),以創(chuàng)建和部署 機器學習模型。在將機器學習應用于應用程序數(shù)據(jù)方面,這種方法創(chuàng)建了多個孤島,并延遲數(shù)據(jù)移動。這還導致數(shù)據(jù)庫外的數(shù)據(jù)激增,使其更易受到安全威脅,并增加了開發(fā)人員在多個環(huán)境中進行編程的復雜性。其次,現(xiàn)有的服務期待開發(fā)人員成為指導機器學習模型訓練過程的專家;否則,模型是次優(yōu)的,并會降低預測的準確性。最后,大多數(shù)現(xiàn)有的 機器學習解決方案沒有包括相應功能來解釋開發(fā)人員構(gòu)建的模型為何會提供某種特定預測。
MySQL HeatWave ML通過在MySQL數(shù)據(jù)庫內(nèi)原生集成機器學習功能來解決這些問題,而無需將數(shù)據(jù)ETL到其他服務。HeatWave ML完全自動化訓練過程,并為給定數(shù)據(jù)集和指定任務創(chuàng)建具有最佳算法、最佳特征和最佳超參數(shù)的模型。HeatWave ML生成的所有模型都可以提供模型和預測解釋。
沒有其他云數(shù)據(jù)庫供應商可以直接在數(shù)據(jù)庫服務中提供此類高級的機器學習功能。甲骨文此次發(fā)布的機器學習基準測試可在大量公開可用的機器學習分類和回歸數(shù)據(jù)集上執(zhí)行,例如Numerai、Nomao和Bank Marketing等。針對在更大的HeatWave集群上進行培訓時,會增加相對于Redshift ML的性能優(yōu)勢。使用MySQL HeatWave可以非常高效且快速地完成耗時的訓練過程,因此客戶現(xiàn)在可以更頻繁地重新訓練模型并跟上數(shù)據(jù)的變化。這樣可以使模型保持最新并提高預測的準確性。
甲骨文首席企業(yè)架構(gòu)師Edward Screven表示:“正如在單一數(shù)據(jù)庫中集成運行分析和事務處理一樣,我們現(xiàn)將機器學習引入MySQL HeatWave。MySQL HeatWave是甲骨文發(fā)展最迅速的云服務之一。越來越多客戶從Amazon和其他云數(shù)據(jù)庫服務遷移到MySQL HeatWave,并顯著提高了性能和降低成本。如今,我們還發(fā)布一系列豐富了HeatWave功能的其他創(chuàng)新,以提高可用性并降低成本。我們?nèi)虑彝耆该鞯幕鶞蕼y試結(jié)果再次表明,Snowflake、AWS、Microsoft和Google的速度比MSQL HeatWave更慢且成本更高。”
相較于其他云數(shù)據(jù)庫服務,HeatWave ML提供了以下功能:
完全自動化的模型訓練:使用HeatWave ML創(chuàng)建模型的所有不同階段都是完全自動化的,無需開發(fā)人員干預。這樣可以實現(xiàn)更準確、無需手動操作的模型優(yōu)化,并且始終完成培訓過程。Amazon Redshift等其他云數(shù)據(jù)庫服務提供了集成外部服務的機器學習功能,意味著開發(fā)人員在ML培訓過程中需要進行大量的手動輸入。
模型和推斷解釋:模型的可解釋性有助于開發(fā)人員了解機器學習模型的行為。例如,如果銀行拒絕客戶貸款,則它需要能夠確定模型的哪些參數(shù)有被考慮在內(nèi),或者模型是否包含任何偏差。預測可解釋性是一組技術,有助于回答機器學習模型為何做出如此特定預測的問題。如今,預測解釋變得越來越重要,因為公司必須能夠解釋其機器學習模型作出的決策。HeatWave ML將模型解釋和預測解釋相結(jié)合,作為模型訓練過程的一部分。因此,HeatWave ML創(chuàng)建的所有模型都可以提供模型和推斷解釋,而無需在推斷解釋時提供訓練數(shù)據(jù)。甲骨文增強了現(xiàn)有的解釋技術,以提高性能、可解釋性和質(zhì)量。其他云數(shù)據(jù)庫服務并未針對其所有機器學習模型提供如此豐富的可解釋性。
超參數(shù)優(yōu)化:HeatWave ML為超參數(shù)優(yōu)化實現(xiàn)了基于漸變搜索的全新縮減算法。這樣可以并行執(zhí)行超參數(shù)搜索,而不影響模型的準確性。超參數(shù)優(yōu)化是機器學習模型訓練最耗時的階段,此獨特功能可以為HeatWave ML提供優(yōu)于其他云服務構(gòu)建機器學習模型的性能優(yōu)勢。
算法選擇:HeatWave ML使用代理模型的概念來確定最佳的ML算法,以進行訓練。代理模型是一種展示完整復雜模型屬性的簡單模型。使用簡單的代理模型可非常高效地完成算法選擇,而不會犧牲準確性。其他用于構(gòu)建機器學習模型的數(shù)據(jù)庫服務皆未提供這種代理建模功能。
智能數(shù)據(jù)采樣:在模型訓練期間,HeatWave ML對一小部分數(shù)據(jù)進行抽樣,以提高性能。這種抽樣的方式是在樣本數(shù)據(jù)集中捕獲所有代表性的數(shù)據(jù)點。其他用于構(gòu)建機器學習模型的云服務采用了效率較低的方法,即使用隨機數(shù)據(jù)采樣,在不考慮數(shù)據(jù)分布特征的情況下對一小部分數(shù)據(jù)進行采樣。
特征選擇:這個功能有助于確定訓練數(shù)據(jù)的屬性;這些屬性會影響機器學習模型進行預測的行為。HeatWave ML中的特征選擇技術針對多個域和應用程序的大量數(shù)據(jù)集進行了訓練。根據(jù)這些收集到的統(tǒng)計信息和元數(shù)據(jù)信息,HeatWave ML能夠有效地識別新數(shù)據(jù)集中的相關特征。
除了機器學習功能,甲骨文還為MySQL HeatWave服務發(fā)布了更多創(chuàng)新。實時彈性功能讓客戶將HeatWave集群擴展和縮小到任意數(shù)量的節(jié)點,無需任何停機時間或只讀時間,也無需手動重新平衡集群。其他功能還包括數(shù)據(jù)壓縮,可讓客戶處理每個節(jié)點兩倍的數(shù)據(jù),并降低近50%的成本,同時保持相同的性價比。新增的暫停與恢復功能則可讓客戶暫停HeatWave,以節(jié)省成本。恢復后,MySQL Autopilot所需的數(shù)據(jù)和統(tǒng)計信息將自動重新加載到HeatWave中。
聯(lián)想(Lenovo)SR588服務器主機2U機架式 桌面云數(shù)據(jù)庫虛擬化 深度學習備份存儲 定制 2顆銀牌4210R 20核 2.2G丨雙電 64GB丨480GB+3*4TB Raid5
進入購買
浪潮(INSPUR) NF5270M5機架式服務器(1顆3204 6核 1.9GHz/16G/2T*1 SATA/雙千兆*1/單電550W/三年服務)
進入購買
戴爾(DELL)R740服務器主機/2*至強銀牌4210R十核2.4GHz/16G*4/4TSAS*3/H730P-2G/750W雙電/導軌/三年保修
進入購買
關鍵詞: MySQL
關于我們 廣告服務 手機版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網(wǎng) 版權所有 聯(lián)系網(wǎng)站:39 60 2 914 2@qq.com