摘要:這篇論文提出了一種非手工設(shè)計(jì)的基于啟發(fā)式搜索算法在解空間搜索候選智能體的工程方法,該解空間由人工智能智能體在仿生學(xué)基礎(chǔ)上建模而形成。通過(guò)和以元學(xué)習(xí)為代表的人工設(shè)計(jì)方法以及以神經(jīng)架構(gòu)芯片為代表的仿生學(xué)方法進(jìn)行比較表明,該方法更加有望實(shí)現(xiàn)通用人工智能,并且和認(rèn)知神經(jīng)科學(xué)有更好的交互作用。同時(shí),該工程方法基于一個(gè)理論假設(shè)即最終的學(xué)習(xí)算法在確定的場(chǎng)景中是穩(wěn)定的,并且可以泛化到不同的場(chǎng)景中。本文初步地討論了理論層面,并提出了該理論和不動(dòng)點(diǎn)定理在數(shù)學(xué)上的可能聯(lián)系,但目前僅僅是個(gè)猜想。
鑒于當(dāng)前認(rèn)知神經(jīng)科學(xué)和人工智能工程所遇到的困難,華為2012實(shí)驗(yàn)室的研究人員提出了一種新的通用人工智能工程方法:使用學(xué)習(xí)算法的穩(wěn)定性作為在特定場(chǎng)景中的適合度函數(shù)的啟發(fā)式搜索方法。論文將其方法與人工設(shè)計(jì)方法、仿生學(xué)方法進(jìn)行了對(duì)比,結(jié)果表明該方法更加有望實(shí)現(xiàn)通用人工智能,并且和認(rèn)知神經(jīng)科學(xué)有更好的交互作用。
作者指出雖然可以直接在這篇論文中提出其工程方法,但為了剛好地解釋這個(gè)方法的必要性和可行性,以及使無(wú)相關(guān)背景的讀者能更好地理解,因此介紹當(dāng)前的主流人工智能工程方法的背景,并指出其中面臨的挑戰(zhàn),以及這些挑戰(zhàn)對(duì)實(shí)現(xiàn)通用人工智能的阻礙是很有必要的。
因此,這篇論文只介紹了該方法的一般過(guò)程和方法論并忽略了進(jìn)一步的細(xì)節(jié),并且只對(duì)方法論做了粗略的分類。該論文首先介紹了認(rèn)知神經(jīng)科學(xué)的現(xiàn)狀,然后討論了兩種主流的工程方法:以元學(xué)習(xí)為代表的人工設(shè)計(jì)方法,和以神經(jīng)架構(gòu)芯片為代表的仿生學(xué)方法。
1.1認(rèn)知神經(jīng)科學(xué)的研究現(xiàn)狀
為了闡明當(dāng)前人工智能工程方法的局限性來(lái)源和它們與認(rèn)知神經(jīng)科學(xué)的聯(lián)系,作者首先了介紹了認(rèn)知神經(jīng)科學(xué)的研究現(xiàn)狀。
目前,認(rèn)知神經(jīng)科學(xué)在人類大腦微結(jié)構(gòu)(主要是神經(jīng)元和突觸)上的研究已經(jīng)比較全面,對(duì)其中的化學(xué)過(guò)程和電學(xué)性質(zhì)都得出了清晰的結(jié)論。對(duì)于神經(jīng)元,spiking模型是其中最重要的特征。而對(duì)于神經(jīng)突觸,由STDP和LTDP描述的特征也得到了充分的研究。
然而,在大腦宏觀結(jié)構(gòu)和其智能功能性上的研究仍然處于早期階段,目前對(duì)于人類大腦智能的機(jī)制仍未得到任何重要的結(jié)論。此外,在這個(gè)領(lǐng)域的主流研究方法也受到質(zhì)疑?;贛RI影像的方法在目前的神經(jīng)科學(xué)中是最重要的研究方法之一。在EricJonas和K.P.Cording的論文中,他們討論了基于MRI的方法是否可以用于分析電子芯片的理論[1],以此表明該方法無(wú)法從微觀行為特征得到關(guān)于宏觀功能性結(jié)構(gòu)的結(jié)論。
該論文還揭示了認(rèn)知神經(jīng)科學(xué)研究如果沒(méi)有程式化的理論指導(dǎo),無(wú)疑將很難研究諸如人類大腦這樣的復(fù)雜組織。因此,雖然認(rèn)知神經(jīng)科學(xué)啟發(fā)了人工智能的研究,但它同樣非常需要來(lái)自人工智能的研究以指導(dǎo)其研究方向,即它們可以互相促進(jìn)。
簡(jiǎn)言之,當(dāng)前的認(rèn)知神經(jīng)科學(xué)無(wú)法為人工智能工程(無(wú)論是當(dāng)前還是可預(yù)見(jiàn)的將來(lái))提供有價(jià)值的啟發(fā)。類似地,認(rèn)知神經(jīng)科學(xué)自身仍將處于成果匱乏的局面。
1.2人工設(shè)計(jì)方法
人工設(shè)計(jì)方法一般指的是元學(xué)習(xí)。元學(xué)習(xí)是一個(gè)很寬泛的概念,因?yàn)樗€只處于早期發(fā)展階段,其中有很多種工程方法,但只有少數(shù)幾種的研究目標(biāo)和這篇論文所定義的人工智能是一致的。其中包括了:基于梯度預(yù)測(cè)的方法[2]、基于損失預(yù)測(cè)的方法和基于LSTM的更新方法[4]。
這些方法由深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和其它傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法導(dǎo)出。在這些傳統(tǒng)學(xué)習(xí)算法中,反向傳播算法和策略梯度算法都獨(dú)立于神經(jīng)網(wǎng)絡(luò),并在網(wǎng)絡(luò)之外更新網(wǎng)絡(luò)連接權(quán)重,因此這和這篇論文的人工智能定義不一致。雖然上述的元學(xué)習(xí)方法和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法的建模方法是類似的,但它們還包括了在網(wǎng)絡(luò)結(jié)構(gòu)中更新網(wǎng)絡(luò)連接權(quán)重并將其作為學(xué)習(xí)的目標(biāo),從而其研究對(duì)象和這篇論文所定義的人工智能是一致的。
然而,這些方法在人工設(shè)計(jì)上是完全獨(dú)立的。人類大腦擁有幾百億個(gè)神經(jīng)元,平均每?jī)蓚€(gè)神經(jīng)元之間有超過(guò)100個(gè)神經(jīng)連接。上述的當(dāng)前認(rèn)知神經(jīng)科學(xué)對(duì)于大腦的結(jié)構(gòu)和功能得到的結(jié)論還是很初級(jí)的,基本上不能提供認(rèn)識(shí)通用人工智能的決定性啟發(fā)。同時(shí),人類大腦在自然選擇中已經(jīng)經(jīng)過(guò)了幾百萬(wàn)年的進(jìn)化。即使人工設(shè)計(jì)方法在人類環(huán)境中不是最優(yōu)的解決方案,它們也是近似最優(yōu)的。還可以進(jìn)一步推斷出,即使通用人工智能的實(shí)現(xiàn)并不是基于100%模仿人類大腦認(rèn)知機(jī)制,至少該結(jié)構(gòu)將擁有近似的復(fù)雜度。從以上討論中作者得出,目前實(shí)現(xiàn)通用人工智能的方法等價(jià)于在一個(gè)巨大的搜索空間中利用非常有限的先驗(yàn)知識(shí)尋找近似最優(yōu)解。如果依靠人工探索,很難想像在可預(yù)見(jiàn)的未來(lái)內(nèi)能找到正確的神經(jīng)網(wǎng)絡(luò)架構(gòu)和學(xué)習(xí)算法。
當(dāng)前這些方法生成的人工智能系統(tǒng)的實(shí)際性能在多樣性和魯棒性上仍遠(yuǎn)遠(yuǎn)落后于人類智能。依賴人工設(shè)計(jì)的另一個(gè)后果是無(wú)法與認(rèn)知神經(jīng)科學(xué)進(jìn)行交互并互相促進(jìn)發(fā)展。上述方法中,無(wú)論是微觀神經(jīng)元特征、宏觀網(wǎng)絡(luò)結(jié)構(gòu),甚至網(wǎng)絡(luò)的更新算法都和認(rèn)知神經(jīng)科學(xué)的研究相去甚遠(yuǎn)。
1.3仿生學(xué)方法
仿生學(xué)方法以神經(jīng)架構(gòu)芯片為代表,例如IBM的TrueNorth芯片[5],其使用了電子元件以部分地模擬人類大腦的生物學(xué)特征(比如spiking模型、神經(jīng)元突觸的可塑性,等等)。然而,由于對(duì)人類大腦的認(rèn)知神經(jīng)科學(xué)理解的限制,這些模擬仍然處于微觀層次,而不包含人類大腦神經(jīng)網(wǎng)絡(luò)的宏觀結(jié)構(gòu)。即使在微觀結(jié)構(gòu),對(duì)神經(jīng)元和其中連接的模擬也不能說(shuō)是完整的。就是說(shuō),某些對(duì)于智能產(chǎn)生的關(guān)鍵特征可能被忽視了。
由于仿生學(xué)方法追求真實(shí)地模仿人類大腦的生物學(xué)特征,可視其為相對(duì)于人工設(shè)計(jì)方法的另一個(gè)極端。然而,這類方法的最大問(wèn)題是它無(wú)法和認(rèn)知神經(jīng)科學(xué)進(jìn)行交互,因?yàn)樗耆珕蜗虻匾蕾囉谡J(rèn)知神經(jīng)科學(xué)研究的結(jié)果。
2本文使用的方法
鑒于在1.1節(jié)中所提到的當(dāng)前認(rèn)知神經(jīng)科學(xué)和人工智能工程所遇到的困難,本文提出了一種新的通用人工智能工程方法:使用學(xué)習(xí)算法的穩(wěn)定性作為在特定場(chǎng)景中的適合度函數(shù)(fitnessfunction)的啟發(fā)式搜索方法。
2.2模型
本文中使用的方法基于啟發(fā)式搜索算法,這是一種在解空間中使用的優(yōu)化算法,用于加速逼近最優(yōu)解的搜索過(guò)程,其中以遺傳算法(由J.D.Bagley提出)為代表[6]。此外,類似的算法還包括粒子群優(yōu)化算法、模擬退火算法、蟻群優(yōu)化算法等等。
雖然它們都屬于同一類算法,但都各有其不同的應(yīng)用領(lǐng)域。其中,模擬退火算法和蟻群優(yōu)化算法可以通過(guò)將為解決的問(wèn)題映射到空間相關(guān)的問(wèn)題中,并進(jìn)行搜索找到最優(yōu)解,所以它們更適合空間相關(guān)的問(wèn)題。本文中的方法的目標(biāo)是搜索人工智能智能體,其問(wèn)題特征并不和空間直接相關(guān),因此上述這些算法并不適用。而遺傳算法和粒子群優(yōu)化算法通過(guò)建模解決問(wèn)題,然后通過(guò)適合度函數(shù)評(píng)估候選解。因此,它們更適合用于本文方法所能解決的問(wèn)題。關(guān)于遺傳算法或粒子群優(yōu)化算法還是其它類似算法的使用,本文并沒(méi)有限制于工程需要或?qū)嶒?yàn)結(jié)果的層面。下圖以遺傳算法為例,描述了這種算法的工作流程:
圖1:遺傳算法的工作流程:?jiǎn)栴}建模;隨機(jī)生成初始群體;場(chǎng)景模擬;評(píng)估個(gè)體適應(yīng)性并分級(jí);表現(xiàn)最好的個(gè)體是否達(dá)到需求;是,輸出結(jié)果;否,進(jìn)行選擇,交叉或突變操作以生成新的群體。
本文中提出的啟發(fā)式搜索算法主要由三部分構(gòu)成:?jiǎn)栴}建模、適合度函數(shù)定義和適合度函數(shù)的輸入(場(chǎng)景模擬)。
本文提出的方法基于問(wèn)題導(dǎo)向建模的啟發(fā)式搜索算法和適應(yīng)性評(píng)估(例如遺傳算法或粒子群優(yōu)化算法)。因此,整個(gè)工作流程和圖1所示的很類似。在建模方面,該方法使用了全連接神經(jīng)網(wǎng)絡(luò)模型,以及認(rèn)知神經(jīng)科學(xué)中關(guān)于神經(jīng)網(wǎng)絡(luò)微結(jié)構(gòu)特征的先驗(yàn)知識(shí)以模擬智能體;在適合度函數(shù)方面,作者主要測(cè)試了智能體在確定場(chǎng)景中執(zhí)行任務(wù)的可重復(fù)性和穩(wěn)定性。以相同的遺傳算法為例,本論文中的方法的完整工作流程如下圖所示,以圖1的每一步的具體實(shí)現(xiàn)目標(biāo)為對(duì)照:
-
問(wèn)題建模:全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和微結(jié)構(gòu)特征的one-hot編碼字符串;
-
隨機(jī)生成初始群體:連接權(quán)重的隨機(jī)初始化和微結(jié)構(gòu)特征編碼的隨機(jī)初始化;
-
場(chǎng)景模擬:智能體行為和任務(wù)模擬的環(huán)境;
-
表現(xiàn)最好的個(gè)體是否達(dá)到需求:智能體是否能可重復(fù)地和穩(wěn)定地執(zhí)行任務(wù)?
圖4:本文方法的完整流程
論文:AHeuristicSearchAlgorithmUsingtheStabilityofLearningAlgorithmsastheFitnessFunctioninCertainScenarios:AnArtificialGeneralIntelligenceEngineeringApproach
-
華為
+關(guān)注
關(guān)注
216文章
35212瀏覽量
255890 -
人工智能
+關(guān)注
關(guān)注
1806文章
49018瀏覽量
249469 -
神經(jīng)
+關(guān)注
關(guān)注
0文章
46瀏覽量
12664
原文標(biāo)題:?jiǎn)l(fā)式搜索:華為提出通用人工智能工程方法
文章出處:【微信號(hào):gh_ecbcc3b6eabf,微信公眾號(hào):人工智能和機(jī)器人研究院】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
混合啟發(fā)式算法在汽車調(diào)度中的應(yīng)用
大家來(lái)討論一下這樣一個(gè)簡(jiǎn)單的局部搜索算法
改進(jìn)的雙向啟發(fā)式搜索算法主要流程是怎樣的?
一種無(wú)回溯的最長(zhǎng)前綴匹配搜索算法
基于禁忌搜索的啟發(fā)式求解背包問(wèn)題算法
一種改進(jìn)的快速搜索算法
深層次分類中候選類別搜索算法

激光散亂點(diǎn)云K最近鄰搜索算法
單規(guī)格一刀切矩形排樣的啟發(fā)式搜索算法

基于網(wǎng)頁(yè)排名算法面向論文索引排名的啟發(fā)式方法
基于并行搜索和快速插入的算法
一種路徑過(guò)濾性搜索算法

評(píng)論