5月5日,達摩院發(fā)布并開源新型聯(lián)邦學習框架FederatedScope,該框架支持大規(guī)模、高效率的聯(lián)邦學習異步訓練,能兼容不同設備運行環(huán)境,且提供豐富功能模塊,大幅降低了隱私保護計算技術開發(fā)與部署難度。
過去幾年,機器學習的迅猛發(fā)展是人工智能領域最引人注目的大事件,大數(shù)據(jù)則是隱藏在這波浪潮后面的重要功臣。過往的經(jīng)驗告訴我們,如果要讓技術獲得令人滿意的成果,對數(shù)據(jù)的理解和應用都非常關鍵。
但現(xiàn)實并不總能很好滿足研究人員對數(shù)據(jù)的質量要求。更多時候,科學家們可以使用的都是數(shù)據(jù)孤島中的“小數(shù)據(jù)”——它們或者規(guī)模較小、或者缺少部分重要的特征。數(shù)據(jù)所有權意識上升帶來的數(shù)據(jù)隱私需求增強后,上述問題的重要性進一步凸顯出來。怎樣在保護隱私的同時推動人工智能發(fā)展,已經(jīng)成為這個時代最重要的技術挑戰(zhàn)之一。
Gartner報告顯示,到2025年之前,約60%的大型企業(yè)預計將應用至少一種隱私保護計算技術。達摩院2022十大科技趨勢同樣將隱私保護計算列為重要趨勢,認為該技術將從覆蓋少量數(shù)據(jù)場景走向全域保護,從而激發(fā)數(shù)字時代的新生產(chǎn)力。
科學家必須想辦法使用那些不那么完美的數(shù)據(jù),聯(lián)邦學習理念應運而生。科學家曾經(jīng)用一個形象的比喻來描述聯(lián)邦學習的思想——養(yǎng)羊就像機器學習,草料就像各類數(shù)據(jù),沒有草料的持續(xù)供應,就沒有羊群的不斷壯大。以前,科學家選擇在全球收割草料并集中起來提供給羊群;現(xiàn)在,他們選擇趕著羊群進入一塊又一塊草場。
然而,隨著應用隱私保護計算的場景和行業(yè)日趨多元,涉及的數(shù)據(jù)類型日趨豐富,已有聯(lián)邦學習框架難以靈活高效地滿足越來越復雜的計算需求,“可用”到“好用”之間的技術挑戰(zhàn)困擾著各方。
為解決上述挑戰(zhàn),達摩院智能計算實驗室研發(fā)了新型聯(lián)邦學習框架FederatedScope,該框架使用事件驅動的編程范式來構建聯(lián)邦學習,即將聯(lián)邦學習看成是參與方之間收發(fā)消息的過程,通過定義消息類型以及處理消息的行為來描述聯(lián)邦學習過程。通過這一方式,F(xiàn)ederatedScope實現(xiàn)了支持在豐富應用場景中進行大規(guī)模、高效率的聯(lián)邦學習異步訓練。
同時,達摩院團隊對FederatedScope訓練模塊進行抽象,使其不依賴特定的深度學習后端,能兼容PyTorch、Tensorflow等不同設備運行環(huán)境,大幅降低了聯(lián)邦學習在科研與實際應用中的開發(fā)難度和成本。
為進一步適應不同應用場景,F(xiàn)ederatedScope還集成了多種功能模塊,包括自動調參、隱私保護、性能監(jiān)控、端模型個性化等。FederatedScope支持開發(fā)者通過配置文件便捷地調用集成模塊,方便快速入門;也允許通過注冊的方式添加新的算法實現(xiàn)并調用,支持定制化及深度開發(fā)。
達摩院智能計算實驗室隱私保護計算團隊負責人丁博麟表示,“數(shù)據(jù)已成為重要的生產(chǎn)要素,而隱私保護計算是保障這一要素發(fā)揮作用的關鍵技術。通過開源最新聯(lián)邦學習框架,我們希望促進隱私保護計算在研究和生產(chǎn)中的廣泛應用,讓醫(yī)藥研發(fā)、政務互通、人機交互等數(shù)據(jù)密集領域更安全、更順暢地發(fā)展。”
-
數(shù)據(jù)
+關注
關注
8文章
7256瀏覽量
91889 -
人工智能
+關注
關注
1807文章
49029瀏覽量
249568 -
隱私保護
+關注
關注
0文章
300瀏覽量
16775 -
機器學習
+關注
關注
66文章
8503瀏覽量
134630
發(fā)布評論請先 登錄
阿里巴巴達摩院劉志偉:QEMU RISC-V 的進展、特性與未來規(guī)劃
普華基礎軟件蒞臨阿里巴巴達摩院調研交流
百度飛槳框架3.0正式版發(fā)布

深度解讀英偉達Newton機器人平臺:技術革新與跨界生態(tài)構建

靈汐科技開源類腦深度學習應用開發(fā)平臺BIDL

黃鶴開源社區(qū)正式發(fā)布
開源鴻蒙應用案例重磅發(fā)布
開源鴻蒙助力工業(yè)數(shù)字化、賦能新型工業(yè)化
用于SLAM中點云地圖綜合評估的開源框架

評論