一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究者們在人工神經(jīng)網(wǎng)絡(luò) CLIP 上發(fā)現(xiàn)了「真」神經(jīng)元

人工智能與大數(shù)據(jù)技術(shù) ? 來源:機器之心 ? 作者:機器之心 ? 2021-03-22 17:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無論是字面上、符號上還是概念上的表達,這種神經(jīng)元都會對相同的概念做出反應(yīng)。

OpenAI 的研究者們在人工神經(jīng)網(wǎng)絡(luò) CLIP 上發(fā)現(xiàn)了「真」神經(jīng)元,這種機制解釋了 AI 模型對令人驚訝的視覺呈現(xiàn)進行分類時,為何擁有如此的準確性。研究人員表示,這是一項重要發(fā)現(xiàn),可能對計算機大腦乃至人類大腦的研究產(chǎn)生重大影響。 這或許意味著通用人工智能距離我們并沒有想象的那么遠。但理解了抽象概念的神經(jīng)元,卻也會做出一些令人啼笑皆非的理解。

15 年前,Quiroga 等人發(fā)現(xiàn)人腦中包含多模態(tài)神經(jīng)元。這些神經(jīng)元能夠?qū)@常見高級主題的抽象概念簇產(chǎn)生反應(yīng),而不是任意特定的視覺特征。其中最著名的神經(jīng)元當屬 Halle Berry 神經(jīng)元,它能夠?qū)γ绹輪T「哈莉·貝瑞」的照片、圖像和文本產(chǎn)生反應(yīng)。 今年 1 月初,OpenAI 提出了一種通用視覺系統(tǒng) CLIP,其性能媲美 ResNet-50,并在一些有挑戰(zhàn)性的數(shù)據(jù)集上超過現(xiàn)有的視覺系統(tǒng)。給出一組以語言形式表述的類別,CLIP 能夠立即將一張圖像與其中某個類別進行匹配,而且它不像標準神經(jīng)網(wǎng)絡(luò)那樣需要針對這些類別的特定數(shù)據(jù)進行微調(diào)。 最近,OpenAI 又有了一個驚人發(fā)現(xiàn):CLIP 模型中出現(xiàn)了多模態(tài)神經(jīng)元!這類神經(jīng)元能夠?qū)σ晕谋?、符號或概念形式呈現(xiàn)的相同概念作出反應(yīng)。例如「Spider-Man」神經(jīng)元(類似 Halle Berry 神經(jīng)元)能夠?qū)χ┲雸D像、文本「spider」的圖像和漫畫人物「蜘蛛俠」做出響應(yīng)。

在 CLIP 模型中發(fā)現(xiàn)的神經(jīng)元具備與人腦中 Halle Berry 神經(jīng)元類似的功能,相比之前的人工神經(jīng)元有所進步。 這一發(fā)現(xiàn)為合成視覺系統(tǒng)與自然視覺系統(tǒng)中的普遍機制——抽象提供了線索。研究人員發(fā)現(xiàn) CLIP 的最高層將圖像組織為 idea 的松散語義集合,從而為模型的通用性和表示的緊湊性提供了簡單解釋。 OpenAI 表示:這一發(fā)現(xiàn)或許可以解釋 CLIP 模型的分類準確率,也是理解大型語言模型在訓練過程中學習到的關(guān)聯(lián)和偏見的重要一步。

那么,CLIP 中的多模態(tài)神經(jīng)元到底是什么樣子呢?OpenAI 研究人員利用可解釋性工具進行了探究,發(fā)現(xiàn) CLIP 權(quán)重內(nèi)的高級概念包含很多人類視覺詞匯,如地區(qū)、面部表情、宗教圖像、名人等。通過對神經(jīng)元影響力的探究,我們可以更加了解 CLIP 如何執(zhí)行分類。 CLIP 中的多模態(tài)神經(jīng)元 OpanAI 的論文《Multimodal Neurons in Artificial Neural Networks》建立在近十年來對卷積網(wǎng)絡(luò)解釋的研究基礎(chǔ)上,該研究首先觀察到許多經(jīng)典方法可以直接應(yīng)用于 CLIP。OpenAI 使用兩種工具來理解模型的激活,分別是特征可視化(通過對輸入進行基于梯度的優(yōu)化來最大化神經(jīng)元的激活)和數(shù)據(jù)集示例(觀察數(shù)據(jù)集中神經(jīng)元最大激活圖像的分布)。 通過這些簡單的方法,OpenAI 發(fā)現(xiàn) CLIP RN50x4(ResNet-50 利用 EfficientNet 擴展規(guī)則擴增 4 倍)中的大多數(shù)神經(jīng)元都可以得到解釋。這些神經(jīng)元似乎是「多面神經(jīng)元」的極端示例,它們只在更高層次的抽象上對不同用例做出響應(yīng)。 例如,對于夏季和冬季兩個不同季節(jié),文本、人臉、Logo、建筑物、室內(nèi)、自然和姿態(tài)等表現(xiàn)出了不同的效果:

對于美國和印度兩個不同國家,文本、人臉、Logo、建筑物、室內(nèi)、自然和姿態(tài)等也呈現(xiàn)出了不同的效果:

OpenAI 驚奇地發(fā)現(xiàn),其中很多類別似乎是利用顱內(nèi)深度電極記錄的癲癇患者內(nèi)側(cè)顳葉中的鏡像神經(jīng)元,包含對情緒、動物和名人做出反應(yīng)的神經(jīng)元。 然而,OpenAI 對 CLIP 的研究發(fā)現(xiàn)了更多這類奇怪但絕妙的抽象,包括似乎能計數(shù)的神經(jīng)元、對藝術(shù)風格做出響應(yīng)的神經(jīng)元,甚至對具有數(shù)字修改痕跡的圖像做出響應(yīng)的神經(jīng)元。 多模態(tài)神經(jīng)元的構(gòu)成是怎樣的 這些多模態(tài)神經(jīng)元能夠幫助我們理解 CLIP 如何執(zhí)行分類。使用一個稀疏線性探針即可以很容易地查看 CLIP 的權(quán)重,從而了解哪些概念結(jié)合在一起實現(xiàn)了 ImageNet 數(shù)據(jù)集上的最終分類。 如下圖所示,存錢罐似乎是由一個「finance」神經(jīng)元和瓷器(porcelain )神經(jīng)元組成的?!窼pider-Man」神經(jīng)元也表現(xiàn)為一個蜘蛛檢測器,并在「谷倉蜘蛛」(barn spider)的分類中發(fā)揮重要作用。

對于文本分類,OpenAI 的一個關(guān)鍵發(fā)現(xiàn)是,這些概念以類似于 word2vec 目標函數(shù)的方式包含在神經(jīng)元中,它們幾乎是線性的。因此,這些概念構(gòu)成了一個單代數(shù),其行為方式類似于線性探針。通過線性化注意力,我們也可以像線性探針那樣檢查任意句子,具體如下圖所示:

錯誤的抽象 CLIP 的抽象化程度揭示了一種新的攻擊向量(vector of attack),OpenAI 認為這種向量并未在以往的系統(tǒng)中表現(xiàn)出來。和很多深度網(wǎng)絡(luò)一樣,模型最高層上的表征完全由這類高級抽象控制。但是,區(qū)分 CLIP 的關(guān)鍵在于程度(degree),CLIP 的多模態(tài)神經(jīng)元能夠在文字和符號之間實現(xiàn)泛化,而這可能是一把雙刃劍。 通過一系列精心設(shè)計的實驗,OpenAI 證明了可以利用這種還原行為來欺騙模型做出荒謬的分類。此外,OpenAI 觀察到,CLIP 中神經(jīng)元的激發(fā)通??梢越柚鋵ξ谋緢D像的響應(yīng)來控制,從而為攻擊該模型提供了一個簡單的向量。 舉例而言,金融神經(jīng)元可以對存錢罐和貨幣符號串「$$$」做出響應(yīng)。通過強制性地激活金融神經(jīng)元,我們可以欺騙 CLIP 模型將一條狗分類為存錢罐。具體如下圖所示:

野外攻擊 OpenAI 將這類攻擊稱為「typographic attack」。研究人員窮盡 CLIP 模型魯棒性讀取文本的能力,發(fā)現(xiàn)即使是手寫文本圖像也能騙過模型。如下圖所示,在「史密斯奶奶」青蘋果表面貼上寫著「iPod」的紙張,系統(tǒng)將其錯誤分類為「iPod」。

研究人員認為這類攻擊還可能以更微妙、不明顯的形式出現(xiàn)。CLIP 的輸入圖像往往用多種細微復雜的形式進行抽象,這可能會對一些常見模式進行過度抽象——過度簡化,進而導致過度泛化。 偏見和過度泛化 CLIP 模型基于精心收集的網(wǎng)絡(luò)圖像進行訓練,但它仍然繼承了許多未經(jīng)檢查的偏見與關(guān)聯(lián)。研究人員發(fā)現(xiàn) CLIP 中的許多關(guān)聯(lián)是良性的,但也有一些關(guān)聯(lián)會帶來損害,如對特定個人或組織的貶損。例如,「Middle East」(中東)神經(jīng)元與恐怖主義存在關(guān)聯(lián),「immigration」(移民)神經(jīng)元對拉丁美洲有反應(yīng),甚至有的神經(jīng)元還對黑皮膚人群和大猩猩產(chǎn)生反應(yīng)。這映射了早期其他模型中存在的圖像標注問題,而這是不可接受的。 這些關(guān)聯(lián)對此類強大視覺系統(tǒng)的應(yīng)用提出了極大挑戰(zhàn)。不管是經(jīng)過微調(diào)還是使用零次學習,這些偏見和關(guān)聯(lián)大概率仍會存在于系統(tǒng)中,而它們也將以可見或不可見的方式影響模型部署。我們或許很難預(yù)測很多帶偏見的行為,如何度量和糾正它們是非常困難的事情。OpenAI 認為這些可解釋性工具可以提前發(fā)現(xiàn)關(guān)聯(lián)和歧視,進而幫助從業(yè)者規(guī)避潛在的問題。 OpenAI 表示他們對 CLIP 的理解仍在繼續(xù),而是否發(fā)布 CLIP 模型的大型版本尚屬未知。 這一研究或許會對 AI 技術(shù),甚至神經(jīng)科學研究打開一條新路?!敢驗槲覀儾涣私馍窠?jīng)網(wǎng)絡(luò)運作的機制,因此很難理解它們出錯的原因,」OpenAI 的聯(lián)合創(chuàng)始人、首席科學家 Ilya Sutskever 說道。「我們不知道它們是否可靠,或它們是否存在一些測試中未發(fā)現(xiàn)的漏洞?!? 此外,OpenAI 還發(fā)布了用于理解 CLIP 模型的工具,例如 OpenAI Microscope,它最近更新了 CLIP RN50x4 中每個神經(jīng)元的特征可視化、數(shù)據(jù)集示例和文本特征可視化。詳情參見:https://microscope.openai.com/models

圖源:https://microscope.openai.com/models/contrastive_4x?models.technique=deep_dream 研究者還公布了 CLIP RN50x4 和 RN101 的權(quán)重,參見 GitHub 項目:https://github.com/openai/CLIP

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103621
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49028

    瀏覽量

    249516
  • 神經(jīng)元
    +關(guān)注

    關(guān)注

    1

    文章

    368

    瀏覽量

    18840

原文標題:第一次,我們在人工神經(jīng)網(wǎng)絡(luò)中發(fā)現(xiàn)了「真」神經(jīng)元

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    無刷直流電機單神經(jīng)元PI控制器的設(shè)計

    摘要:研究一種基于專家系統(tǒng)的單神經(jīng)元PI控制器,并將其應(yīng)用于無刷直流電機調(diào)速系統(tǒng)中??刂破鲗崿F(xiàn)PI參數(shù)的在線調(diào)整,具有PID控制器良好
    發(fā)表于 06-26 13:34

    神經(jīng)網(wǎng)絡(luò)RAS異步電機轉(zhuǎn)速估計中的仿真研究

    ,在一定程度上擴展轉(zhuǎn)速估計范圍。 純分享帖,需要可點擊附件免費獲取完整資料~~~*附件:神經(jīng)網(wǎng)絡(luò)RAS異步電機轉(zhuǎn)速估計中的仿真研究.p
    發(fā)表于 06-16 21:54

    BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計原則

    ,僅作為數(shù)據(jù)輸入的接口。輸入層的神經(jīng)元個數(shù)通常與輸入數(shù)據(jù)的特征數(shù)量相對應(yīng)。 隱藏層 :對輸入信號進行非線性變換,是神經(jīng)網(wǎng)絡(luò)的核心部分,負責學習輸入與輸出之間的復雜映射關(guān)系。隱藏層可以有一層或多層,層數(shù)和神經(jīng)元數(shù)量根據(jù)具體問題而定
    的頭像 發(fā)表于 02-12 16:41 ?743次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    多層。 每一層都由若干個神經(jīng)元構(gòu)成,神經(jīng)元之間通過權(quán)重連接。信號神經(jīng)網(wǎng)絡(luò)中是前向傳播的,而誤差是反向傳播的。 卷積神經(jīng)網(wǎng)絡(luò)(CNN) :
    的頭像 發(fā)表于 02-12 15:53 ?668次閱讀

    什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法

    神經(jīng)網(wǎng)絡(luò)(即反向傳播神經(jīng)網(wǎng)絡(luò))的核心,它建立梯度下降法的基礎(chǔ),是一種適合于多層神經(jīng)元網(wǎng)絡(luò)的學習算法。該算法通過計算每層
    的頭像 發(fā)表于 02-12 15:18 ?768次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的基本原理

    輸入層、隱藏層和輸出層組成。其中,輸入層負責接收外部輸入數(shù)據(jù),這些數(shù)據(jù)隨后被傳遞到隱藏層。隱藏層是BP神經(jīng)網(wǎng)絡(luò)的核心部分,它可以通過一層或多層神經(jīng)元對輸入數(shù)據(jù)進行加權(quán)求和,并通過非線性激活函數(shù)(如ReLU、sigmoid或tanh)進行處理,從而提取出數(shù)據(jù)中的特征。最后,
    的頭像 發(fā)表于 02-12 15:13 ?857次閱讀

    如何訓練BP神經(jīng)網(wǎng)絡(luò)模型

    BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種經(jīng)典的人工神經(jīng)網(wǎng)絡(luò)模型,其訓練過程主要分為兩個階段:前向傳播和反向傳播。以下是訓練BP神經(jīng)網(wǎng)絡(luò)模型的步驟: 一、前向傳播 前向傳播
    的頭像 發(fā)表于 02-12 15:10 ?921次閱讀

    深度學習入門:簡單神經(jīng)網(wǎng)絡(luò)的構(gòu)建與實現(xiàn)

    深度學習中,神經(jīng)網(wǎng)絡(luò)是核心模型。今天我們用 Python 和 NumPy 構(gòu)建一個簡單的神經(jīng)網(wǎng)絡(luò)。 神經(jīng)網(wǎng)絡(luò)由多個神經(jīng)元組成,神經(jīng)元之間通過
    的頭像 發(fā)表于 01-23 13:52 ?530次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    所擬合的數(shù)學模型的形式受到大腦中神經(jīng)元的連接和行為的啟發(fā),最初是為了研究大腦功能而設(shè)計的。然而,數(shù)據(jù)科學中常用的神經(jīng)網(wǎng)絡(luò)作為大腦模型已經(jīng)過時,現(xiàn)在它們只是能夠某些應(yīng)用中提供最先進性能
    的頭像 發(fā)表于 01-09 10:24 ?1190次閱讀
    <b class='flag-5'>人工</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    神經(jīng)網(wǎng)絡(luò),也稱為全連接神經(jīng)網(wǎng)絡(luò)(Fully Connected Neural Networks,F(xiàn)CNs),其特點是每一層的每個神經(jīng)元都與下一層的所有神經(jīng)元相連。這種結(jié)構(gòu)簡單直觀,但在
    的頭像 發(fā)表于 11-15 14:53 ?1872次閱讀

    RNN模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(前饋神經(jīng)網(wǎng)絡(luò)) 2.1 結(jié)構(gòu) 傳統(tǒng)神經(jīng)網(wǎng)絡(luò),通常指的是前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks, FNN),是一種最簡單的
    的頭像 發(fā)表于 11-15 09:42 ?1128次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與工作機制

    的結(jié)構(gòu)與工作機制的介紹: 一、LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)主要包括以下幾個部分: 記憶單元(Memory Cell) : 記憶單元是LSTM網(wǎng)絡(luò)的核心,負責整個序列
    的頭像 發(fā)表于 11-13 10:05 ?1631次閱讀

    Moku人工神經(jīng)網(wǎng)絡(luò)101

    Moku3.3版更新Moku:Pro平臺新增全新的儀器功能【神經(jīng)網(wǎng)絡(luò)】,使用戶能夠Moku設(shè)備上部署實時機器學習算法,進行快速、靈活的信號分析、去噪、傳感器調(diào)節(jié)校準、閉環(huán)反饋等應(yīng)
    的頭像 發(fā)表于 11-01 08:06 ?666次閱讀
    Moku<b class='flag-5'>人工</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>101

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    可以不局限于已知的訓練圖像開展識別。該神經(jīng)網(wǎng)絡(luò)需要映射到MCU中。 5、AI的模式識別內(nèi)部到底是什么? AI的神經(jīng)元網(wǎng)絡(luò)類似于人腦的生物神經(jīng)元網(wǎng)絡(luò)。一個神經(jīng)元有多個輸入,但只有一個輸出
    發(fā)表于 10-24 13:56

    Python自動訓練人工神經(jīng)網(wǎng)絡(luò)

    人工神經(jīng)網(wǎng)絡(luò)(ANN)是機器學習中一種重要的模型,它模仿人腦神經(jīng)元的工作方式,通過多層節(jié)點(神經(jīng)元)之間的連接和權(quán)重調(diào)整來學習和解決問題。
    的頭像 發(fā)表于 07-19 11:54 ?703次閱讀