一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

賦予機器自主設計模型“能力”,一文概覽結(jié)構(gòu)搜索的起源

倩倩 ? 來源:雷鋒網(wǎng) ? 2020-03-27 15:21 ? 次閱讀

伴隨著人工智能技術(shù)的飛速發(fā)展,語音識別、機器翻譯等各項科技名詞已不是傳統(tǒng)意義上被企業(yè)家束之高閣的前景應用,更不是研究人員諱莫如深的復雜概念,它們已經(jīng)伴隨著大數(shù)據(jù)時代的來臨走入了尋常人的身邊。如今的生活中我們無處不在享受著人工智能技術(shù)帶給我們的便利,從前在科幻電影《星際迷航》中使用的通用翻譯器,已然成為了現(xiàn)在人們出行途中能夠使用的小型翻譯機。而撥開這些實際應用的面紗,它們背后所使用的技術(shù)往往是這些年來備受關(guān)注的神經(jīng)網(wǎng)絡模型。

通俗來講,它是一種對外部輸入信息進行學習的數(shù)學模型或計算模型。它能夠通過對自身內(nèi)部結(jié)構(gòu)的調(diào)整來擬合輸入數(shù)據(jù),憑借著算法廣泛的通用性,其在語音、圖像、自然語言處理等眾多領域得到了廣泛的應用。

電影《星際迷航》里科克船長和老骨頭所使用的實時翻譯設備

而對于目前的基于神經(jīng)網(wǎng)絡技術(shù)的各項任務而言,主要的過程依舊是由研究人員手動地探索新的網(wǎng)絡結(jié)構(gòu),比如我們常見的循環(huán)神經(jīng)網(wǎng)絡(Recurrent neural network; RNN)、卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network; CNN)等。但這樣做實際上是一個非常系統(tǒng)工程的方式,我們把研究人員束縛在崗位上不斷地去“設計”所謂的更好的結(jié)構(gòu),而模型的好與壞則往往取決于人對任務的理解以及模型設計上的想象力,整個過程需要研究人員對相關(guān)領域有著充分的認知,間接提高了從業(yè)人員的入門門檻,與此同時通過人工不斷地對模型結(jié)構(gòu)進行改良也非常耗費時間。

隨著近年來計算機設備的算力以及存儲能力逐年遞增,人們逐漸開始去思考是否我們可以讓計算機像學網(wǎng)絡參數(shù)一樣學習神經(jīng)網(wǎng)絡模型的結(jié)構(gòu)?希望能通過這種方式將研究人員從模型結(jié)構(gòu)設計者的位置上“解救”出來,于是就有了這樣一個機器學習領域的研究分支——網(wǎng)絡結(jié)構(gòu)搜索(Neural Architecture Search; NAS)。

實際上目前神經(jīng)網(wǎng)絡結(jié)構(gòu)搜索技術(shù)已經(jīng)在各個領域中嶄露頭角,如谷歌團隊在Searching for Activation Functions【1】論文中通過對激活函數(shù)空間進行搜索發(fā)現(xiàn)了Swish函數(shù),相對諸如Relu等傳統(tǒng)人工設計的激活函數(shù)具有更快的收斂速度。而微軟團隊在WMT19機器翻譯評測任務中同樣也采用了其團隊提出的NAO【2】方法來自動地對神經(jīng)網(wǎng)絡結(jié)構(gòu)進行優(yōu)化,在英語-芬蘭語以及芬蘭語-英語的任務上均取得了不俗的成績。

可以看到網(wǎng)絡結(jié)構(gòu)搜索技術(shù)的使用已經(jīng)為各項任務中模型結(jié)構(gòu)的設計起到非常好的助力,那么其背后究竟使用了怎樣的技術(shù)?如何能夠讓神經(jīng)網(wǎng)絡自動地對自身結(jié)構(gòu)進行改良?雖然目前網(wǎng)絡結(jié)構(gòu)的搜索技術(shù)依舊方興未艾,但已然存在很多來自工業(yè)界以及學術(shù)界的團隊在不斷努力探索更好的方法。

可以預計在不遠的將來,隨著科研人員的努力以及計算資源的進一步提升,網(wǎng)絡結(jié)構(gòu)搜索的技術(shù)將大幅降低模型結(jié)構(gòu)的更迭所需要的時間周期,同時能夠讓研究人員有更多地精力去探索有趣的應用或討論神經(jīng)網(wǎng)絡背后的可解釋性。當然在這個過程中,我們需要審視這門技術(shù)的發(fā)展歷史,同時對未來的發(fā)展趨勢進行展望。

微軟團隊在WMT19機器翻譯評測任務中英語-芬蘭語任務的提交信息

從“人工”到“自動”的突圍

人類對于自動化的追求從未停止,這一點從三次工業(yè)革命的目標即可看到端倪,它們無一不在為了將人們從繁復的工作中解放出來不懈努力。而對于機器學習任務而言,人們也依舊在不斷地探索,希望能夠讓機器在無需人類過多干預的情況下,真正地替代人去完成更多的工作,而在這個過程中研究人員始終在不斷嘗試,努力做好這次從“人工”到“自動”的突圍。

機器學習方法的演化與變遷

傳統(tǒng)機器學習

如果我們將機器學習所處理的任務建模為一種從輸入到輸出的映射學習,那么在初代的機器學習算法中,我們不僅需要設計一種適用于當前任務的方法(如廣泛使用的決策樹、支持向量機等),同時還要為其提供人工設計的特征集合,在完成這些工作之后,才能使用數(shù)據(jù)對模型中的參數(shù)進行調(diào)優(yōu)。

以情感分析為例,我們可以向模型中輸入詞性、詞頻及其情感屬性等信息,然后通過支持向量機的模型來對情感分析任務進行建模,其中詞性、詞頻以及情感屬性即為我們從句子中提取出的人工設計的模型特征,支持向量機則是我們選擇來解決當前問題的機器學習算法。

我們可以看到,不管是輸入的特征還是模型自身,均為研究人員歸納總結(jié)而得,這個過程就很容易造成對有效特征的忽視以及模型設計上的不合理,因此基于這種傳統(tǒng)機器學習算法的情感分析任務在IMDB Movie Reviews【3】集合上的準確率一般很難超過92%(如斯坦福大學的工作Baselines and Bigrams: Simple, Good Sentiment and Topic Classification【4】,通過使用樸素貝葉斯的方法在IMDB Movie Reviews數(shù)據(jù)集上也僅達到了91.22%的準確率)??梢钥吹皆跈C器學習技術(shù)的初期,整個系統(tǒng)尚且處于對“人工”高度依賴的時代。

深度學習

隨著深度學習技術(shù)的廣泛普及,人們開始嘗試將提取特征的過程交由模型來自動完成,通過數(shù)據(jù)驅(qū)動的方式減少傳統(tǒng)方法中特征遺漏的問題。比如說對于圖像處理任務而言,我們無需根據(jù)人工經(jīng)驗對圖像中的局部特征進行設計,只需要直接將畫面完整地送入模型中進行訓練即可。

下圖中為人臉識別任務中不同層的神經(jīng)網(wǎng)絡對圖像信息的抽取,我們可以看到在學習過程中底層網(wǎng)絡主要是對圖像中局部紋理進行捕捉,而隨著層數(shù)的遞增,模型開始根據(jù)下層中收集到的紋理信息對人臉中的局部結(jié)構(gòu)(如眼睛、耳朵等)進行建模,而頂層將綜合上述局部特征對人臉在圖像中的位置進行確定,最終達成人臉識別的目的。

人臉識別任務中不同層對圖像信息的提取差異

此外,對于前文提到的情感分析任務而言,同樣是可以使用深度學習的方式對語言進行建模。相對基于傳統(tǒng)機器學習算法的模型而言,深度學習的方式直接接收文本的輸入,將詞匯以高維向量的方式建模為詞嵌入(word embedding)。這種方法利用高維空間對詞匯中語義信息進行捕獲,從而為下一步的情感分析提供了非常充足的信息。

基于深度學習的情感分析模型在IMDB Movie Reviews數(shù)據(jù)集上遠遠超越了傳統(tǒng)的機器學習方法,在卡內(nèi)基梅隆大學與谷歌團隊在NIPS 2019上合作發(fā)表的論文XLNet: Generalized Autoregressive Pretraining for Language Understanding【5】中,準確率達到了96.8%。

從上述例子中可以看到,深度學習技術(shù)在如今的機器學習領域已然達成諸多優(yōu)異成績,其中非常重要的一個貢獻在于通過使用自動提取的方式對初始輸入信息中的有效資訊進行捕獲,大幅度降低了手動設計特征所帶來的信息折損,為下游任務提供了更堅實的基礎。

深度學習&網(wǎng)絡結(jié)構(gòu)搜索

深度學習技術(shù)的到來使得原本由人工進行的特征提取過程交由機器自動完成,允許模型根據(jù)自身需求從原始數(shù)據(jù)中進行特征的捕獲,通過這種數(shù)據(jù)驅(qū)動的方式有效降低了人工抽取所帶來的信息丟失風險。但當我們回顧整個深度學習系統(tǒng),實際上其依舊并非我們期望的完全自動化的過程,在模型結(jié)構(gòu)的設計上仍然非常依賴行業(yè)專家面向任務對模型結(jié)構(gòu)進行設計。

以機器翻譯任務為例,研究人員在模型結(jié)構(gòu)上的探索腳步從未停止,從最初基于RNN【6】對文本序列進行表示發(fā)展到之后注意力機制【7】的引入,乃至更近一段時間的基于CNN【8】的翻譯系統(tǒng)以及目前備受關(guān)注的Transformer【9】系統(tǒng),科研人員始終在不斷地針對任務進行模型結(jié)構(gòu)的設計與改良。但有了深度學習初期的發(fā)展,研究人員也期望著有朝一日能夠讓模型結(jié)構(gòu)設計的過程同樣不再過分依賴人工設計,能夠采用同特征選擇類似的方式自動進行學習,因此在深度學習方法的基礎上,人們開始嘗試網(wǎng)絡結(jié)構(gòu)搜索的方式來自動得到模型結(jié)構(gòu)。

實際上網(wǎng)絡結(jié)構(gòu)搜索的任務并非起源于近些年,早在上世紀80年代,斯坦福大學的Miller, Geoffrey F.等人在Designing Neural Networks using Genetic Algorithms【10】論文中就提出使用進化算法對神經(jīng)網(wǎng)絡結(jié)構(gòu)進行學習的方式,在此之后也有很多研究人員沿著該思路進行了相關(guān)的探索(如Representation and evolution of neural networks【11】一文對進化算法的編碼格式進行改良,J. R. Koza等人在Genetic generation of both the weights and architecture for a neural network【12】中提出要同時對網(wǎng)絡中的結(jié)構(gòu)和參數(shù)進行學習等)。

但受限于當時計算資源,針對神經(jīng)網(wǎng)絡的結(jié)構(gòu)搜索的應用場景較少,因此這方面的工作并沒有受到很多研究者的關(guān)注。而隨著近些年來神經(jīng)網(wǎng)絡以及深度學習的技術(shù)的廣泛應用,對于網(wǎng)絡結(jié)構(gòu)自學習的需求也越來越大,與此同時發(fā)展迅猛的半導體技術(shù)也使得設備的算力、存儲能力大大提升,為網(wǎng)絡結(jié)構(gòu)搜索任務提供了必要的支持。

縱觀整個機器學習算法的發(fā)展過程,網(wǎng)絡結(jié)構(gòu)搜索任務的出現(xiàn)可以看作是歷史的必然。無論是數(shù)據(jù)資源的累積還是計算能力的提升,無一不在催生著數(shù)據(jù)驅(qū)動下的網(wǎng)絡結(jié)構(gòu)設計。雖然目前的網(wǎng)絡結(jié)構(gòu)搜索技術(shù)尚且處于比較初級的階段,其高資源消耗、模型結(jié)構(gòu)不穩(wěn)定等問題始終困擾著研究人員,但是其發(fā)展勢頭迅猛,在圖像、自然語言處理等領域均開始嶄露頭角。

可以預見的是,深度學習&網(wǎng)絡結(jié)構(gòu)搜索的組合將是把研究人員從模型工程的泥淖中救起的稻草,我們也相信網(wǎng)絡結(jié)構(gòu)搜索技術(shù)會終將為機器學習完成這場從“人工”到“自動”的終局突圍。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4797

    瀏覽量

    102416
  • 機器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    140

    瀏覽量

    15095
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    625

    瀏覽量

    13938
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    LD Gen2 Lite激光雷達:賦予機器人 “感知力” 的關(guān)鍵

    機器人的感知世界里,激光雷達宛如雙敏銳的“慧眼”,賦予機器人“看”清周圍環(huán)境、自主決策的能力
    的頭像 發(fā)表于 04-25 10:42 ?87次閱讀

    百度發(fā)布心大模型4.5和文心大模型X1

    心大模型4.5是百度自主研發(fā)的新代原生多模態(tài)基礎大模型,通過多個模態(tài)聯(lián)合建模實現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解
    的頭像 發(fā)表于 03-18 16:29 ?322次閱讀

    百度搜索心智能體平臺接入DeepSeek及心大模型深度搜索

    夠免費使用DeepSeek和文心大模型的深度搜索功能。這功能不僅融合了先進的搜索算法,還借助心大模型
    的頭像 發(fā)表于 02-17 09:14 ?458次閱讀

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎模塊

    次生成深度信息。 自主機器人定位任務的本質(zhì)是對機器人自身狀態(tài)的估計問題,包括位置,朝向,速度等問題。 路徑規(guī)劃旨在找到從起點到目標區(qū)域的路徑,確保路徑的可行性和最優(yōu)性。路徑規(guī)劃方法包括變分方法,圖搜
    發(fā)表于 01-04 19:22

    說清楚什么是AI大模型

    生成能力強,部分版本支持多模態(tài)輸入(如圖像理解) 言 百度 針對中文優(yōu)化,適合國內(nèi)應用場景 LLa
    的頭像 發(fā)表于 01-02 09:53 ?1191次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>說清楚什么是AI大<b class='flag-5'>模型</b>

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    。 多模態(tài)融合的創(chuàng)新與突破 機器人控制技術(shù)的另個重要突破在于多模態(tài)大模型的應用。相比于僅通過文字進行人機交互的傳統(tǒng)方法,現(xiàn)代機器人能夠融合視覺、聲音、定位等多模態(tài)輸入信息,為任務執(zhí)行
    發(fā)表于 12-29 23:04

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    與未來,涵蓋如基于行為的人工智能、生物啟發(fā)的進化人工智能及認知機器人技術(shù)的發(fā)展。這歷史背景為隨后的大模型驅(qū)動的具身智能討論奠定了基礎,隨著人工智能模型復雜性和
    發(fā)表于 12-28 21:12

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第章學習

    ,特別是在模型訓練的時候,高質(zhì)量、大規(guī)模且多樣化的模型才能夠訓練出來個好的網(wǎng)絡。針對具身智能機器人也是如此,如自主導航
    發(fā)表于 12-27 14:50

    《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

    設計專門的編碼器處理視覺、觸覺、位置等不同類型的傳感器數(shù)據(jù),再用cross-attention機制將它們對齊到同語義空間。這種設計不僅提高了模型的感知能力,還增強了推理過程的可解釋性。在實驗中,RT-1
    發(fā)表于 12-24 15:03

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    的,書籍封面如下。下面對全書概覽并對第章時間序列概述進行細度。 . 全書概覽 全書分為8章,每章的簡介如下: ●第1章“時間序列概述”:介紹時間序列分析的基礎知識、發(fā)展歷程、應
    發(fā)表于 08-07 23:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    今天開始學習《大語言模型應用指南》第篇——基礎篇,對于人工智能相關(guān)專業(yè)技術(shù)人員應該可以輕松加愉快的完成此篇閱讀,但對于我還是有許多的知識點、專業(yè)術(shù)語比較陌生,需要網(wǎng)上搜索學習更多的資料才能理解書中
    發(fā)表于 07-25 14:33

    【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書

    上周收到《大語言模型應用指南》書,非常高興,但工作項目繁忙,今天才品鑒體驗,感謝作者編寫了部內(nèi)容豐富、理論應用相結(jié)合、印刷精美的著作,也感謝電子發(fā)燒友論壇提供了個讓我了解大語言
    發(fā)表于 07-21 13:35

    多層感知機模型結(jié)構(gòu)

    多層感知機(MLP,Multilayer Perceptron)是種基本且廣泛應用的人工神經(jīng)網(wǎng)絡模型,其結(jié)構(gòu)由多個層次組成,包括輸入層、個或多個隱藏層以及輸出層。MLP以其強大的非
    的頭像 發(fā)表于 07-11 17:57 ?2226次閱讀

    Al大模型機器

    理解能力強大: AI大模型機器人可以理解和生成自然語言,能夠進行復雜的對話和語言任務。它們能夠識別語言中的語義、語境和情感,并據(jù)此作出適當?shù)幕貞?。廣泛的知識儲備: 這些模型基于大規(guī)模的
    發(fā)表于 07-05 08:52

    智能制造能力成熟度模型是什么?

    ),賦予每個級別明確定義,相應標準和實現(xiàn)的必要條件。從最低級到最高級,智能制造能力是逐級提升的,每個級別都在前個級別的基礎上提升完善,同時也構(gòu)成了向下個級別提升演進的基礎,從而體現(xiàn)
    的頭像 發(fā)表于 06-12 11:25 ?1317次閱讀
    智能制造<b class='flag-5'>能力</b>成熟度<b class='flag-5'>模型</b>是什么?