優(yōu)步有開源光纖,一個新的庫,旨在授權(quán)用戶在計算機(jī)集群上實現(xiàn)大規(guī)模的機(jī)器學(xué)習(xí)計算。 庫的主要目標(biāo)是利用異構(gòu)計算硬件,動態(tài)規(guī)模算法,并減輕工程師在集群上實現(xiàn)復(fù)雜算法的負(fù)擔(dān)。.
對于機(jī)器學(xué)習(xí)框架來說,保持足夠的靈活性來支持強(qiáng)化學(xué)習(xí)(RL)和基于人口的算法以及其他啟發(fā)式算法(如深度學(xué)習(xí))是一個挑戰(zhàn),因為需求可能會有很大的變化。
雖然TensorFlow和Py Torch等已建立的框架涵蓋了大多數(shù)常見機(jī)器學(xué)習(xí)方法的分布式培訓(xùn)設(shè)置,但這些框架不太適合基于RL和基于人口的方法,這往往需要與模擬器頻繁交互以及復(fù)雜和動態(tài)的縮放策略。 光纖為其分布式計算框架提供了統(tǒng)一的Python用戶界面,以支持這些新需求。
與Fiber一起發(fā)表的研究論文詳細(xì)介紹了用于評估框架開銷、進(jìn)化策略和近端策略優(yōu)化(PPO)庫的實驗。 研究人員比較了Fiber與IPy并行(iPython用于并行計算)、Spark和標(biāo)準(zhǔn)python多處理庫在框架開銷上的性能,發(fā)現(xiàn)Fiber在任務(wù)持續(xù)時間較短時優(yōu)于iPy并行和Spark,這是處理模擬器時要理解的重要指標(biāo)。
與Atari基準(zhǔn)中關(guān)于Breakout的多處理實現(xiàn)相比,F(xiàn)iber啟用的PPO分布式版本的性能表明,F(xiàn)iber可以將RL算法擴(kuò)展到本地機(jī)器之外。
光纖分成API層,后端層,簇層。. API層與標(biāo)準(zhǔn)Python多處理模塊具有相似的要求和語義,但擴(kuò)展到分布式環(huán)境中工作。
后端層可以處理多個不同集群管理器的任務(wù)通信。 最后,聚類層包含Kubernetes和Peloton等集群管理器。
光纖引入了一個新的概念,稱為工作支持過程。 當(dāng)啟動其中一個進(jìn)程時,將創(chuàng)建一個在當(dāng)前集群上帶有Fiber后端的新作業(yè)。 父容器在使用相同的容器映像啟動子進(jìn)程之前封裝所需的文件、輸入數(shù)據(jù)和該作業(yè)的任何其他依賴項,以保證一致的運行環(huán)境。 下圖更詳細(xì)地說明了這一架構(gòu):
纖維和谷歌新的分布式強(qiáng)化學(xué)習(xí)庫種子RL的發(fā)布表明,大科技公司的目標(biāo)是既降低成本,又簡化培訓(xùn)尖端機(jī)器學(xué)習(xí)算法的過程。
-
光纖
+關(guān)注
關(guān)注
20文章
4146瀏覽量
75202 -
算法
+關(guān)注
關(guān)注
23文章
4709瀏覽量
95353 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134584
發(fā)布評論請先 登錄
基于RV1126開發(fā)板移植NCNN部署庫方法

Open Echo:一個開源的聲納項目

沐曦GPU跑通DeepSeek開源代碼庫FlashMLA
AI開源模型庫有什么用
優(yōu)步革新服務(wù):讓服務(wù)性動物乘車體驗再升級
開源AI模型庫是干嘛的
芯原股份與開源圖形庫LVGL達(dá)成戰(zhàn)略合作
PingCAP推出TiDB開源分布式數(shù)據(jù)庫

分享一個嵌入式通用FIFO環(huán)形緩沖區(qū)實現(xiàn)庫

評論