Meta開源I-JEPA，“類人”AI模型

Meta宣布推出一個(gè)全新的AI 模型Image Joint Embedding Predictive Architecture (I-JEPA)，可通過對(duì)圖像的自我監(jiān)督學(xué)習(xí)來學(xué)習(xí)世界的抽象表征，實(shí)現(xiàn)比現(xiàn)有模型更準(zhǔn)確地分析和完成未完成的圖像。

目前相關(guān)的訓(xùn)練代碼和模型已開源，I-JEPA 論文則計(jì)劃在下周的 CVPR 2023 上發(fā)表。

根據(jù)介紹，I-JEPA 結(jié)合了 Meta 首席 AI 科學(xué)家 Yann LeCun 所提倡的類人推理方式，幫助避免 AI 生成圖像常見的一些錯(cuò)誤，比如多出的手指。

I-JEPA 在多項(xiàng)計(jì)算機(jī)視覺任務(wù)上表現(xiàn)出色，且計(jì)算效率比其他廣泛使用的計(jì)算機(jī)視覺模型高得多。

I-JEPA 學(xué)習(xí)的表征也可以用于許多不同的應(yīng)用程序，而無需進(jìn)行大量微調(diào)。

例如，項(xiàng)目團(tuán)隊(duì)在 72 小時(shí)內(nèi)使用 16 個(gè) A100 GPU 訓(xùn)練了一個(gè) 632M 參數(shù)的視覺轉(zhuǎn)換器模型，I-JEPA 在 ImageNet 上的 low-shot 分類中性能表現(xiàn)最優(yōu)，每個(gè)類只有 12 個(gè)標(biāo)記示例。

其他方法通常需要 2 到 10 倍的 GPU 時(shí)間，并且在用相同數(shù)量的數(shù)據(jù)進(jìn)行訓(xùn)練時(shí)錯(cuò)誤率更高。 I-JEPA 背后的想法是以更類似于人類一般理解的抽象表示來預(yù)測(cè)缺失的信息。

I-JEPA 使用抽象的預(yù)測(cè)目標(biāo)，潛在地消除了不必要的 pixel-level 細(xì)節(jié)，從而使模型學(xué)習(xí)更多語義特征。

另一個(gè)引導(dǎo) I-JEPA 產(chǎn)生語義表征的核心設(shè)計(jì)選擇是多塊掩碼策略。

具體來說，項(xiàng)目團(tuán)隊(duì)證明了使用信息豐富的（空間分布的）上下文來預(yù)測(cè)包含語義信息（具有足夠大的規(guī)模）的大塊的重要性。

I-JEPA 中的預(yù)測(cè)器可以看作是一個(gè)原始的（和受限的）世界模型，它能夠從部分可觀察的上下文中模擬靜態(tài)圖像中的空間不確定性。

更重要的是，這個(gè)世界模型是語義的，因?yàn)樗A(yù)測(cè)圖像中不可見區(qū)域的高級(jí)信息，而不是 pixel-level 細(xì)節(jié)。

為了解模型捕獲的內(nèi)容，團(tuán)隊(duì)還訓(xùn)練了一個(gè)隨機(jī)解碼器，將 I-JEPA 預(yù)測(cè)的表征映射回像素空間。

這種定性評(píng)估表明該模型正確地捕獲了位置不確定性并生成了具有正確姿勢(shì)的高級(jí)對(duì)象部分（例如，狗的頭、狼的前腿）。

簡(jiǎn)而言之，I-JEPA 能夠?qū)W習(xí)對(duì)象部分的高級(jí)表示，而不會(huì)丟棄它們?cè)趫D像中的局部位置信息。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

轉(zhuǎn)換器

轉(zhuǎn)換器

+關(guān)注

關(guān)注
27

文章
9001

瀏覽量
151261
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4925

瀏覽量
130925
計(jì)算機(jī)視覺

計(jì)算機(jī)視覺

+關(guān)注

關(guān)注
9

文章
1708

瀏覽量
46669

原文標(biāo)題：Meta開源I-JEPA，“類人” AI 模型

文章出處：【微信號(hào)：OSC開源社區(qū)，微信公眾號(hào)：OSC開源社區(qū)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

OSC開源社區(qū)
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot 什么是數(shù)據(jù)脫敏？常用的脫敏規(guī)則有哪些呢？
Hot 12款開源的低代碼開發(fā)平臺(tái)

New 使用Prometheus與Grafana實(shí)現(xiàn)MindIE服務(wù)可視化監(jiān)控功能
New 基于MindSpeed MM玩轉(zhuǎn)Qwen2.5VL多模態(tài)理解模型

精選推薦
更多

文章

資料

帖子

從驅(qū)動(dòng)到應(yīng)用：RT-Thread環(huán)境下的SDIO開發(fā)指南

RT-Thread官方賬號(hào)
1天前

71 閱讀

完整指南：如何使用樹莓派5、Hailo AI Hat、YOLO、Docker進(jìn)行自定義數(shù)據(jù)集訓(xùn)練？

上海晶珩電子科技有限公司
1天前

70 閱讀

新華財(cái)經(jīng)：RT-Thread睿賽德加速布局RISC-V產(chǎn)業(yè) | 媒體視角

RT-Thread官方賬號(hào)
1天前

64 閱讀

為無刷吸塵器驅(qū)動(dòng)方案按下“靜音鍵”--【其利天下】

其利天下技術(shù)
1天前

106 閱讀

德州儀器方案|諧振轉(zhuǎn)換器同步整流器(SR)設(shè)計(jì)注意事項(xiàng)

德州儀器
1天前

376 閱讀

硬盤錄像機(jī)使用手冊(cè)

王蘭
2.29 MB

10積分

223下載

半導(dǎo)體和集成電路 (IC) 封裝熱度量

beijiwangzi
320 KB

免費(fèi)

0下載

RISC-V設(shè)計(jì)簡(jiǎn)單的指令集

石飛鵬
0.12 MB

2積分

2下載

jquery-dynatable互動(dòng)表插件

賈熹
0.06 MB

2積分

1下載

WLDOS云應(yīng)用支撐平臺(tái)

孫成紅
1.65 MB

2積分

1下載

這個(gè)電路板升壓IC不穩(wěn)定，容易燒，是什么原因

jf_38390749
17小時(shí)前

239 閱讀

【HZ-RK3568開發(fā)板免費(fèi)體驗(yàn)】【HZ-RK3568開發(fā)板免費(fèi)體驗(yàn)】--開發(fā)板了解與初探

1653149838.791300
1天前

158 閱讀

【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】麻雀雖小五臟俱全超高性價(jià)比開發(fā)板Milk-V Duo S

jf_1137202360
1天前

140 閱讀

【潤(rùn)開鴻HH-SCDAYU800A開發(fā)板試用體驗(yàn)】潤(rùn)開鴻HH-SCDAYU800A開發(fā)板（一）

jf_29910226
1天前

159 閱讀

【嘉楠堪智K230開發(fā)板試用體驗(yàn)】+02+基本功能測(cè)試

jf_18702540
1天前

144 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

Meta開源I-JEPA，“類人”AI模型

評(píng)論