一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Facebook推出新AI模型,希望給計算機視覺領域帶來一次“革命”   

jf_f8pIz0xS ? 來源:賢集網 ? 作者:AI新訊   ? 2021-03-05 13:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3月5日消息,F(xiàn)acebook的研究人員推出了一種新的AI模型,該模型可以從網上任何未標記圖像的中學習,這是一項突破,盡管該團隊的研究仍處于早期階段,但他們希望給計算機視覺領域帶來一次“革命”。

該模型被稱為SEER(SElf-SupERvised),被饋入了10億張公開可用的Instagram圖像,這些圖像未經過手動標記。但是,即使沒有通常在AI算法訓練中使用的標簽和注釋,SEER仍能夠自主地訓練數據集,不斷進行學習,并最終在諸如對象檢測之類的任務上達到最高的準確性。

圖片來自Facebook AI

這種被稱為自監(jiān)督學習(self-supervised learning)的方法在AI領域已經很成熟:它由可以直接從給定信息中學習的系統(tǒng)組成,而不必依賴經過仔細標記的數據集來教他們如何執(zhí)行諸如識別照片中的對象或翻譯文本之類的任務。

自監(jiān)督式學習近來引起了很多關注,因為這意味著需要手工標記數據的工作要少很得,這對大多數研究人員而言是費時費力的工作。無需管理數據集的同時,自監(jiān)督模型可以處理更大,更多樣化的數據集。

在某些領域,特別是自然語言處理中,該方法已經取得了突破。在數量越來越多的未標記文本上訓練算法已使諸如問答、機器翻譯、自然語言推理等應用程序取得了進展。

相反,計算機視覺尚未完全進入自監(jiān)督的學習革命。正如Facebook AI Research的軟件工程師Priya Gopal解釋的那樣,SEER是該領域的首創(chuàng)。她告訴ZDNet:“與現(xiàn)有的在ImageNet數據集上訓練的計算機視覺的自監(jiān)督模型相比,SEER是第一個可以隨機訓練互聯(lián)網上圖像上的完全自監(jiān)督的計算機視覺模型?!?/p>

ImageNet是一個大規(guī)模數據庫,包含研究人員標記的數百萬張圖片,并向較大的計算機視覺社區(qū)開放,以促進AI的發(fā)展。

該項目的數據庫被Facebook的研究人員用作評估SEER性能的基準,他們發(fā)現(xiàn)自監(jiān)督模型在諸如低空拍攝、物體檢測、分割和圖像分類等任務上優(yōu)于最新的監(jiān)督AI系統(tǒng)。

Goyal說:“通過僅對隨機圖像進行訓練,SEER優(yōu)于現(xiàn)有的自監(jiān)督模型。這一結果表明,我們不需要像ImageNet這樣的高度精選的數據集,對隨機圖像的自監(jiān)督學習就可以產生非常高質量的模型?!?/p>

隨著自監(jiān)督學習復雜度的提高,研究人員的工作并非沒有挑戰(zhàn)。在文本方面,AI模型的任務是為單詞賦予含義。但是對于圖像,該算法必須決定每個像素如何與一個概念相對應,同時考慮到其在不同圖片中拍攝角度、視圖和形狀的差別。

換句話說,研究人員需要大量數據,并且需要一個能夠從這種復雜的信息池中推導出所有可能的視覺概念。

為了完成此任務,Goyal和她的團隊從Facebook AI在自監(jiān)督學習中的現(xiàn)有工作中改編了一種新算法,稱為SwAV,該算法將顯示相似的圖像聚集到單獨的組中??茖W家還設計了卷積網絡,也就是一種深度學習算法,算法對人腦中神經元的連接模式進行建模,根據重要性分配給圖像中的不同對象。

至少可以說,借助Instagram的10億張圖片的數據集,該系統(tǒng)的規(guī)模很大。Facebook的團隊使用了具有32GB RAM的V100 Nvidia GPU,并且隨著模型尺寸的增加,必須將模型放入可用的RAM中。但是Goyal解釋說,進一步的研究將對確保計算功能適應新系統(tǒng)很有用。

“隨著我們在越來越多的GPU上訓練模型,這些GPU之間的通信需要快速進行。可以通過開發(fā)軟件來解決給定的內存和運行時間帶來的挑戰(zhàn)?!彼f。

盡管仍有許多工作要做,但是,在可以將SEER應用于現(xiàn)實世界的用例之前,Goyal認為不應低估該技術的影響。她說:“借助SEER,我們現(xiàn)在可以通過大量隨機的互聯(lián)網上的圖像訓練大型模型,在計算機視覺方面取得更大的進步?!?/p>

“這一突破可以實現(xiàn)計算機視覺的自監(jiān)督學習革命,類似于我們在自然語言處理文本中所看到的?!?/p>

在Facebook內部,SEER可用于各種計算機視覺任務,從自動生成圖像描述到幫助識別違反政策的內容。在公司外部,該技術還可用于圖像和元數據有限的領域,例如醫(yī)學成像。

Facebook的團隊呼吁開展更多工作,以將SEER推進到其下一階段的開發(fā)。作為研究的一部分,該團隊開發(fā)了一種基于PyTorch的全能庫,用于自監(jiān)督學習,稱為VISSL,該庫是開源的,鼓勵更多的AI社區(qū)成員對該技術進行測試。

當被問及是否已通知Instagram用戶使用其圖像來訓練SEER或用戶是否有機會選擇其圖像不被用來學習時,Goyal指出,F(xiàn)acebook在其數據政策中告知Instagram帳戶持有人,其使用圖片等信息來支持研究,其中包括支持SEER的研究。也就是說,F(xiàn)acebook并不打算分享這些圖片或SEER模型本身,部分原因是該模型可能包含無意識的偏見。

Facebook在一篇博客文章中寫道:“自我監(jiān)督學習一直是Facebook人工智能的重點,因為它使機器可以直接從世界上大量可用的信息中學習,而不僅僅是從專門為人工智能研究創(chuàng)建的訓練數據中學習。就像在其他研究領域一樣,自我監(jiān)督學習對未來的計算機視覺有著不可思議的影響。消除了對人工注釋和元數據的需要,使計算機視覺社區(qū)能夠處理更大、更多樣化的數據集,從隨機公共圖像中學習,并可能減輕數據管理中出現(xiàn)的一些偏見。自我監(jiān)督學習還可以幫助在圖像或元數據有限的領域(如醫(yī)學成像)對模型進行專門研究。無需人工提前標記,模型可以更快地創(chuàng)建和部署,能夠對快速變化的情況做出更快、更準確的反應?!?br /> 編輯:lyn

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35118

    瀏覽量

    279669
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    任正非說 AI已經確定是第四工業(yè)革命 那么如何從容地加入進來呢?

    和實踐項目經驗。 考取相關的專業(yè)認證,如人工智能工程師認證等。這些認證可以證明自己在AI領域的知識水平,也有助于在求職或者參與相關項目時增加競爭力。 跨學科知識積累 結合計算機科學、物理學、生物學等
    發(fā)表于 07-08 17:44

    軟通計算機重磅發(fā)布DeepSeek大模型體機產品

    3月20日,華為中國合作伙伴大會2025在深圳盛大啟幕。大會上,軟通計算機重磅發(fā)布了“DeepSeek大模型體機產品”,為用戶提供站式的AI
    的頭像 發(fā)表于 03-22 10:40 ?959次閱讀
    軟通<b class='flag-5'>計算機</b>重磅發(fā)布DeepSeek大<b class='flag-5'>模型</b><b class='flag-5'>一</b>體機產品

    NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機

    臺式超級計算機由 NVIDIA Grace Blackwell 驅動,為開發(fā)者、研究人員和數據科學家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technologies、HP
    的頭像 發(fā)表于 03-20 18:59 ?883次閱讀
    NVIDIA GTC2025 亮點  NVIDIA<b class='flag-5'>推出</b> DGX Spark個人<b class='flag-5'>AI</b><b class='flag-5'>計算機</b>

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    的 DGX? 個人 AI 超級計算機。 ? DGX Spark(前身為 Project DIGITS)支持 AI 開發(fā)者、研究人員、數據科學家和學生,在臺式電腦上對大模型進行原型設計、
    發(fā)表于 03-19 09:59 ?317次閱讀
       NVIDIA 宣布<b class='flag-5'>推出</b> DGX Spark 個人 <b class='flag-5'>AI</b> <b class='flag-5'>計算機</b>

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數據的支持范圍。在增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內存的邊緣AI視覺模型
    的頭像 發(fā)表于 03-11 15:11 ?385次閱讀
    英飛凌邊緣<b class='flag-5'>AI</b>平臺通過Ultralytics YOLO<b class='flag-5'>模型</b>增加對<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的支持

    虹軟推出新一視覺模型ArcMuse 2025 V1.1

    模型從最初的“不計成本”探索,到如今的“可持續(xù)”商業(yè)化落地,經歷了從技術突破到工程優(yōu)化,再到產業(yè)融合的深度演進。在這過程中,虹軟始終走在創(chuàng)新前沿,依托深厚的視覺AI技術積累,以Ar
    的頭像 發(fā)表于 03-05 17:19 ?902次閱讀

    NVIDIA推出個人AI超級計算機Project DIGITS

    NVIDIA 推出個人 AI 超級計算機 NVIDIA Project DIGITS,全球的 AI 研究員、數據科學家和學生都可獲取 NVIDIA Grace Blackwell 平臺
    的頭像 發(fā)表于 01-08 11:03 ?820次閱讀

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算個新興的研究領域,科學家們利用量子力學,制造出具有
    的頭像 發(fā)表于 11-24 11:00 ?1477次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    新思科技如何應對量子計算機的威脅

    隨著技術發(fā)展的突飛猛進,量子計算機的威脅日益凸顯。盡管量子計算機有望在天氣預報、藥物研發(fā)和基礎物理學等領域帶來革命性的變革,但它也對現(xiàn)行加密
    的頭像 發(fā)表于 11-18 09:33 ?923次閱讀

    【小白入門必看】文讀懂深度學習計算機視覺技術及學習路線

    、什么是計算機視覺?計算機視覺,其實就是教機器怎么像我們人樣,用攝像頭看看周圍的世界,然后理
    的頭像 發(fā)表于 10-31 17:00 ?1240次閱讀
    【小白入門必看】<b class='flag-5'>一</b>文讀懂深度學習<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及學習路線

    丹麥推出首臺AI超級計算機Gefion

    近日,丹麥正式推出了該國首臺人工智能超級計算機,命名為Gefion,以紀念丹麥神話中的女神。此次揭幕儀式由英偉達首席執(zhí)行官黃仁勛與丹麥國王共同出席,彰顯了該項目的重要性和影響力。 Gefion AI
    的頭像 發(fā)表于 10-29 15:13 ?809次閱讀

    NVIDIA助力丹麥發(fā)布首臺AI超級計算機

    這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設,是臺 NVIDIA DGX SuperPOD 超級計算機
    的頭像 發(fā)表于 10-27 09:42 ?896次閱讀

    初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI計算機視覺技術變革航海安全系統(tǒng)

    總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI計算機視覺技術變革航海安全系統(tǒng),讓每一次出海變得更安全。
    的頭像 發(fā)表于 09-09 09:32 ?914次閱讀

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域個重要分支,旨在使計算機能夠像人類樣理解和解釋圖像和視頻中的信息
    的頭像 發(fā)表于 08-14 09:49 ?2038次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域個重要分支,旨在使計算機能夠像人類樣理解和解釋圖像及視頻中的
    的頭像 發(fā)表于 07-24 12:46 ?1804次閱讀