AutoML是一項技術(shù),客戶可以攜帶數(shù)據(jù)并離開模型而不必?fù)?dān)心訓(xùn)練機器學(xué)習(xí)模型所涉及的復(fù)雜工作流程。它大大簡化了基于成熟算法的數(shù)據(jù)準(zhǔn)備,特征工程,模型選擇和超參數(shù)調(diào)整的方法。
基于公共云的ML平臺即服務(wù)(PaaS)產(chǎn)品(例如Azure ML,IBM Watson Studio和Google Cloud AI)具有AutoML組件。AWS遲遲未將AutoML功能引入其SageMaker平臺。自2019年發(fā)布SageMaker AutoPilot以來,亞馬遜一直在不斷改善其托管ML平臺的AutoML功能。
通過最近添加的SageMaker JumpStart,AWS現(xiàn)在擁有完整的AutoML功能,涵蓋了回歸,分類,視覺和自然語言處理領(lǐng)域。
盡管AWS并未正式稱呼Amazon SageMaker Autopilot和JumpStart服務(wù)AutoML,但它們是Azure AutoML和Google Cloud AutoML的替代產(chǎn)品。
Amazon SageMaker Autopilot針對諸如銷售預(yù)測,推薦系統(tǒng),呼叫中心路由和廣告優(yōu)化之類的方案,這些方案依賴于通常存儲在CSV文件,關(guān)系數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫中的數(shù)據(jù)集。
基于XGBoost和Linear Learner算法,Autopilot非常適合處理線性回歸,邏輯回歸以及二元或多元分類問題。通過添加深度學(xué)習(xí)算法,Autopilot可以處理不可線性分離的復(fù)雜數(shù)據(jù)。
Amazon SageMaker Autopilot的主要與眾不同之處在于,自動生成筆記本是AutoML工作流程的一部分??蛻糁荒軇?chuàng)建一個Autopilot作業(yè)來生成筆記本,而不是運行整個過程。這些筆記本基于在數(shù)據(jù)科學(xué)界流行的標(biāo)準(zhǔn)開源Juypter筆記本。開發(fā)人員和數(shù)據(jù)科學(xué)家可以下載筆記本,以了解數(shù)據(jù)準(zhǔn)備工作的完成方式以及為每個候選人構(gòu)建的單獨管道所使用的算法。
在re:Invent 2020上宣布的Amazon SageMaker JumpStart是Amazon SageMaker Studio的最新成員,后者是面向AWS客戶的集成ML開發(fā)平臺。盡管Amazon SageMaker Autopilot處理通常以表格格式存儲的結(jié)構(gòu)化數(shù)據(jù),但SageMaker JumpStart專注于視覺和NLP域。
Amazon SageMaker JumpStart包含三個組件-開源模型部署,解決方案和基于較小的定制數(shù)據(jù)集的現(xiàn)有開源模型構(gòu)建的定制模型。
亞馬遜利用TensorFlow和PyTorch提供的官方模型動物園來提供開源模型部署。只需單擊一下,即可在SageMaker Studio中提供150多個模型。AWS下載模型,在SageMaker中注冊它們,并公開一個端點進行推斷。
例如,您可以一鍵顯示ResNet或MobileNet SSD模型以進行圖像分類和對象檢測。部署模型后,SageMaker會將您指向帶有示例代碼的Jupyter Notebook,以調(diào)用推理端點。
部署使用公共數(shù)據(jù)集(例如ImageNet或CIFAR-100)訓(xùn)練的現(xiàn)有計算機視覺模型可能對企業(yè)不是很有用。他們需要使用與特定業(yè)務(wù)問題保持一致的自定義數(shù)據(jù)集進行訓(xùn)練的模型。例如,組織可能需要識別在接待區(qū)沒有面具的人。沒有公開可用的模型可以可靠地檢測沒有面罩的面部。
責(zé)任編輯:lq
-
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134565 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25434 -
自然語言處理
+關(guān)注
關(guān)注
1文章
628瀏覽量
14149
發(fā)布評論請先 登錄
評論