美國谷歌旗下人工智能公司DeepMind開發(fā)了一種新的矩陣算法,這是50多年來的首次進步。一系列軟件都依賴于大規(guī)模執(zhí)行乘法任務,而這一發(fā)現有望將某些計算速度提高20%。相關論文10月5日發(fā)表于《自然》。
矩陣乘法,即兩個矩陣之中的數字相乘,在某種程度上幾乎是所有軟件的基本計算任務,尤其是在圖形、人工智能和科學模擬中。即使這些算法的效率僅提高一點,也可以帶來顯著的性能提升或節(jié)約能源。
過去幾個世紀,數學家普遍認為,矩陣中相乘元素的個數與矩陣乘法的運算效率成正比。這意味著,當矩陣擴大,乘法的計算量也會擴大。
直到1969年,德國數學家Volker Strassen證明,一個由兩個數字組成的兩行矩陣與另一個同樣大小的矩陣相乘,并不需要8次乘法計算,而可以通過技巧簡化為7次。該過程需要一些額外的加法,但這是可以接受的,因為計算機計算加法比乘法快得多。
這一方法名為Strassen算法,能使運算效率進一步提升。對大多數矩陣而言,該方法是50多年來最有效的。現在,DeepMind公司利用人工智能AlphaTensor發(fā)現了一種新型矩陣乘法,可以在當前的硬件系統(tǒng)上完美運行,將計算速度提高20%。
例如,一個4×5矩陣乘以一個5×5矩陣,傳統(tǒng)算法需要進行100次乘法運算。而用此前的最佳算法,這個數字可以減少到80次?,F在,AlphaTensor發(fā)現的算法只需76次乘法就能完成這一計算。在超過70種大小各異的矩陣上,AlphaTensor都擊敗了現有的最佳算法。它還發(fā)現了針對每種矩陣大小的數千種函數算法,其中僅4×4矩陣就有1.4萬種,但只有一小部分比現有技術更好。
這項研究建立在DeepMind公司的游戲模型AlphaZero基礎之上,歷時兩年。
DeepMind公司的Hussein Fawzi表示,這些結果在數學上是合理的,但對人類來說卻遠遠不夠直觀。“目前,我們還不清楚為什么這是矩陣乘法的最佳方式。關于深度學習是如何做到這些的,還有一些理論工作要做。”
除了上述例子,AlphaTensor 還在有限域內改進了Strassen的二階算法,這是Strassen算法自 50 多年前被提出以來迎來的首次改進。
英國薩塞克斯大學的James Knight表示,在超級計算機和強大硬件上運行的一系列軟件,如人工智能研究和天氣模擬,實際上都在使用大規(guī)模矩陣乘法。“如果這種方法真的能實施,那可能會帶來普遍性的加速。”
倫敦大學的Oded Lachish表示,新算法可以提高各種軟件的效率,因為矩陣乘法是一個非常常見的問題。
“我相信,我們將看到人工智能為類似的問題帶來解決方案。這類技術有著重要的應用前景,因為算法中的更少操作不僅意味著更快的結果,還意味著更少的能量消耗。”Lachish說。(王方)
關鍵詞: 人工智能發(fā)明更快算法 有望將某些計算速度提高20% 矩陣中相乘元素的個數與矩陣乘法的運算效率成正比 矩陣乘法
關于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛好者日報網 版權所有 聯系網站:435 226 40@qq.com