人類的技能的基本就是把知識能聯(lián)系起來,能把所有的技能聯(lián)系起來,然后加以應(yīng)用和加以分享,能學(xué)習(xí),能比較。
9月15日,在由中國人工智能學(xué)會學(xué)術(shù)指導(dǎo)的全國博士后學(xué)術(shù)交流活動上,歐洲科學(xué)院院士,深知無限人工智能研究院(AITC)院長、首席科學(xué)家,德國人工智能研究中心(DFKI) 科學(xué)董事,聯(lián)想研究院AI首席顧問漢斯·烏思克爾特發(fā)表了題為“Combining different types of machine learning for information and knowledge extraction”的演講。
下為漢斯·烏思克爾特院士在本次大會中的演講實錄,經(jīng)整理后發(fā)布。
漢斯·烏思克爾特:非常感謝李教授,我非常喜歡他的演講,可以說講的非常好,他談到了愿景和現(xiàn)實也有很好的結(jié)合,在我的演講里面我也盡量現(xiàn)實一點,跟大家分享一下我個人的經(jīng)驗,特別是在機器學(xué)習(xí)的應(yīng)用方面,以及建立知識架構(gòu)方面,我希望能夠做到至少有一點遠見。我們知道有廣義的和窄義的AI,在今天的AI我們稱為窄義上的AI,因為我們知道AI能開車,能識別人臉,能翻譯,能下圍棋,通常同樣一個AI的模型不能做很多的事情,但是人類是不同的,人類可以做各種完全不同的事情。
現(xiàn)在讓我們再看一下歷史,看一下這兩種系統(tǒng),一個系統(tǒng)是做窄面的事情,可以反映有很長的歷史,還有其他的系統(tǒng),他們擁有知識,能夠去做不止一件事,可以做很多事情。所以在一開始,我們在機器學(xué)習(xí)開始的時候,在AI系統(tǒng)一開始是基于標(biāo)準(zhǔn),基于規(guī)則的,我們可以檢查一個人是否能夠獲得相應(yīng)的信用卡,要檢查他的信用情況等等,所以基于知識的AI。我們還有一些機器人,我們可以給他編程,像人類一樣做事情,這就是初期的AI,機器人可以去解決一些問題,遇到障礙可以停下來,這是把程序作為一個流程來安排的。
那么機器人也是有知識的,四處移動,一開始這些東西都是編號成序的,還有另外的一些方面,一方面是谷歌翻譯,可以翻譯成很多句子,即使他不理解其中的意思,也可以做到這點,對人類來講無法做到,我們只能在理解之后進行翻譯,但是谷歌的機器翻譯可以翻譯這些內(nèi)容,模仿人類,就像自動駕駛一樣,模仿人類駕駛來進行。另外機器識別,機器識別不用理解所說話的意思,無論講什么內(nèi)容但是可以去識別。另外有IBM watson系統(tǒng),也打敗了美國智力挑戰(zhàn)的專家,它是信息量豐富的,也是非常神奇的一個系統(tǒng)。IBM有一些人類挑戰(zhàn)賽的冠軍,IBM可以做到把圣經(jīng),把維基百科,把這些知識存儲到里面去,watson可以使用。
當(dāng)然還有其他的系統(tǒng),可以從人類的回答里進行分析,可以去模仿人類,就像小的鸚鵡一樣可以重復(fù)人類所說的知識。還有一些能學(xué)習(xí)的類似于機器人,像德國的DFKI的系統(tǒng),我們也討論很多,它也有很多的來自于大數(shù)據(jù)的知識。這些系統(tǒng)也使用一些機器學(xué)習(xí),逐漸擴大知識,也同樣在內(nèi)部使用深度學(xué)習(xí),深度學(xué)習(xí)也是非常強大的,需要讓它做很多事情,即使需要很大的知識量。人類的智能,在不同人類的技能也是相互聯(lián)系的,比如說當(dāng)我游泳的時候,這和我的識別別人人臉的功能是完全不相連的,人類的技能可以互相分開的,但是需要完全不同的知識,我能夠把不同的知識和技能應(yīng)用在不同的活動上面,比如我騎自行車向左轉(zhuǎn),我可以用一只手掌握車把,或者走一個曲線的路子。翻譯的時候我可以翻譯,我可以識別人臉,比如說在座的各位里面,我找出膚色白和膚色稍黑的人,這也是需要一定的技能。
這是不同的技能,我們可以把所有的技能都綜合起來,所以人類的技能的基本就是把知識能聯(lián)系起來,能把所有的技能聯(lián)系起來,然后加以應(yīng)用和加以分享,能學(xué)習(xí),能比較。下面讓我很快過一下這些內(nèi)容,我們都知道這些內(nèi)容,我們知道在指導(dǎo)下的學(xué)習(xí),我們有各種各樣的數(shù)據(jù),還有一些沒有監(jiān)督的或者沒有指導(dǎo)下的自主學(xué)習(xí),還有非常重要的就是這種半指導(dǎo)性下的學(xué)習(xí)有很多方法,比如說我們把一些數(shù)據(jù)予以標(biāo)記,可以去進行分析,然后有些數(shù)據(jù)不用有太多的標(biāo)記,這樣我們就可以去減輕人類的工作強度。還有一種叫做較少指導(dǎo)下的學(xué)習(xí),我們很少有例子,這些例子能被標(biāo)識。我們用非常好的數(shù)據(jù),這樣機器能找到更多的類似的數(shù)據(jù)根據(jù)標(biāo)簽,這樣可以進行更多的學(xué)習(xí),更好的建造學(xué)習(xí)架構(gòu)。
機器可以自動加標(biāo)記,因為已經(jīng)有這些數(shù)據(jù)了。還有機器性的學(xué)習(xí),我們都知道機器的學(xué)習(xí),這些系統(tǒng)能夠意識到有些數(shù)據(jù)是缺失的,他們可以去尋求這些數(shù)據(jù),或者說文字我不認識,請給我翻譯一下,因為缺少例子,你可以給我更多的例子,更多的數(shù)據(jù),作為機器性的學(xué)習(xí)。第二個就是強化學(xué)習(xí),剛才李教授提到了,也就是獲得強化學(xué)習(xí)的閉環(huán)。那么還有就是機器學(xué)習(xí),也就是機器教授,可能我們稱之為課程學(xué)習(xí),大家都有一種觀念就是把數(shù)據(jù)進行分離開來,把它們成為更簡單的數(shù)據(jù)和更困難的數(shù)據(jù),可能對于孩子會給他們更簡單的數(shù)據(jù),隨著他們的成長,要給他們更困難的數(shù)據(jù),所以這是一種很簡單的方式。這樣的方式當(dāng)中,我們就可以進行難度的增加,所以這叫做課程的學(xué)習(xí)。
實際上在我們的程序語言處理當(dāng)中,我們不知道其他的方面或者是領(lǐng)域,如果說你是通過一個簡單的物體開始,那我們就有不同的學(xué)習(xí)分層,或者是不同的目標(biāo)區(qū)分,也是從最簡單的開始,然后大家會展示他們的一些積極的學(xué)習(xí)成果,這可能就是機器的教授。教授是一層,然后機器是另一層,我們就把它加入整合起來,就是機器教授。那我們來講授一下這種應(yīng)用,機器人和自動駕駛的區(qū)別是什么?其實我們現(xiàn)在所說的AI是非常狹義的概念,比如說智能汽車以及其他各個領(lǐng)域的應(yīng)用,但其實對于AI技術(shù)非常關(guān)鍵的一點就是幫助人們做決定。我們知道現(xiàn)在的數(shù)據(jù)非常龐雜,我們的大腦也是有限的,我們并不能處理這么龐雜的數(shù)據(jù),其中的一個例子就是公司智能,那我們可以看到在公司智能中間部分,就是我們要運用新的AI技術(shù),來為我們提供平臺,幫助公司做決定。
那我們可以看到CIA,也就是中情局,可能和情報局是不一樣的,那在英國我們在英語當(dāng)中,我們情報和智能是一個詞,但是在中國智能實際上和情報是不一樣的,我們在這里強調(diào)的是智能。在德國也是,我們是有兩個不同的單詞,那現(xiàn)在企業(yè),非常重要的一個觀點,其實讓企業(yè)獲得成功的方面是在公司之外的,大家在工廠當(dāng)中,就是我們收入的來源,就是客戶支付錢,如果我們沒有技術(shù)來支撐的話,或者是說我們的客戶,我們的供應(yīng)商沒有給我們提供足夠的原料,或者是我們的投資者并沒有為我們持續(xù)的投資,而出售了我們的股份,或者是我們的分銷商并沒有繼續(xù)分銷我們的產(chǎn)品,這就會給公司造成損失。
現(xiàn)在作為一個中國的公司,我們可能有兩萬或一萬的人,而且我們將商品出口到世界各地,其實很多的供應(yīng)商不在中國,而且一些客戶也可能是在非洲和法國,我們的競爭者可能在瑞士,所以我們怎么樣來認知,對這些不同的成分進行認知呢?我們怎么樣看待這些全球化的不同的組成實體呢?那其實我們有一個夏明的工廠就找到我們來到柏林,他們來到我們的智能研究中心,可以幫助我們來監(jiān)控或者是觀察我們的客戶嗎?我不知道我們的產(chǎn)品的什么特征他們會喜歡,我們的客戶喜歡什么樣的產(chǎn)品,比如西班牙,他們說不同的語言,所以我不知道他們需求是什么。如果我們把這寫都整合起來,就是一個智能企業(yè)。那其實,中情局也是同樣的道理,并不是說作出最終決定,他們是得到這些所有的信息來幫助他們作出選擇。
我們并不是說使用人工智能來取代人,當(dāng)然了在很多領(lǐng)域,AI能取代人的功能,但是我們現(xiàn)在能給人們賦權(quán),能讓人更好的作出決定,更好的輔助他們的工作。那在行業(yè)當(dāng)中,我們可以通過人工智能幫助人作出更加明智的決定,比如在一些領(lǐng)域,他們是不能取代專家的產(chǎn)品經(jīng)理或者是市場調(diào)研員,因為在這些領(lǐng)域,AI所起的作用是幫助他們更好的篩選和分析數(shù)據(jù),作出更具邏輯的結(jié)論和決定。所以這是我們現(xiàn)在的人工智能形式。其實有來自全世界的數(shù)據(jù),然后我們的大腦作出決定,這個決定最終會影響公司。我們的大腦從世界獲取數(shù)據(jù),同時也從公司獲取數(shù)據(jù),還有一些其他的知識以及人們自有的認知的知識,這樣我們就可以作出更加明智的決定。
這個是傳統(tǒng)科學(xué),這個部分就是我們的智能,左邊部分可以取代的,右邊部分是不可以取代的,右邊部分的作用就是幫助CEO作出更好的決定。我們所要做的就是能夠使無論是這些無架構(gòu)的或半架構(gòu)的整個系統(tǒng)聯(lián)系起來,在其中當(dāng)中,我們有這些知識曲線,知識圖表,無論是谷歌,還是其他的媒介,我們希望有這些數(shù)據(jù)知識圖表,可能也是我們的大眾所使用的。那從傳統(tǒng)意義而言,公司會使用不同的產(chǎn)品以及不同的標(biāo)準(zhǔn),他們有自己的知識庫,他們有自己的自主的知識產(chǎn)權(quán),自主的技術(shù)。那其實我們想要進行數(shù)據(jù)的交換和交流,我們想有競爭力,我們不想從公眾當(dāng)中復(fù)制和獲取數(shù)據(jù),因為公眾當(dāng)中有一些數(shù)據(jù)是根據(jù)技術(shù)和材料的,但是你不想獲取這些已經(jīng)現(xiàn)有的數(shù)據(jù),我們想具有競爭力。
所以我們希望有這樣的一個知識社區(qū),通過這樣的事實社區(qū)提取出自己所需要的知識,所以在我們德國就有一家,我們可以為公司構(gòu)建自己的知識架構(gòu)。這樣的知識架構(gòu),它并不同于我們的百科全書這樣的公眾知識,那其中我們可以看到這個數(shù)據(jù)源,它是從左到右,但是并能從右到左,也就是我們能從百科當(dāng)中提取知識,但并不是說我們提取出來的知識或者數(shù)據(jù)再放到提取源當(dāng)中,是單向的,而不是雙向的。這樣大的知識數(shù)據(jù)庫當(dāng)中,我們現(xiàn)在已經(jīng)有30億的數(shù)據(jù)和DBPedia合作。
第二點我想說知道了解我們的競爭者或者是你的客戶,他們并沒有把產(chǎn)品的數(shù)據(jù)發(fā)給你,或者說沒有用一種結(jié)構(gòu)式的方式告訴你們,他們所喜歡的產(chǎn)品,但是他們可能會為你的產(chǎn)品進行評論,或者是發(fā)布了一些新聞,那可能你的競爭者在面臨財務(wù)危機,還有其他的情況,我們需要從龐雜的信息以及文本當(dāng)中提取有效的信息。我們提取出來這些信息,或者是話題,答案,姓名,事實,實踐,觀點,以及客戶的情緒等,那我們就通過大數(shù)據(jù)的處理方式,還有在柏林我的同事所研究出來的一種程序進行這些信息的處理,它可以幫助我們數(shù)據(jù)形成數(shù)據(jù)流,形成點的形式。
那我給大家展示一下現(xiàn)在有什么樣的問題,如果我想收購一家公司,或者我想了解他的破產(chǎn)情況,產(chǎn)品,那其實人類有很多的方式表達同樣的觀點,同樣的句子,比如說一家公司收購另一家公司,我們有很多方式表達這句話,這個很復(fù)雜。我們想要知道的就是它其中的模式,這是正確的關(guān)聯(lián)關(guān)系,綠色的就是,黑色的不感興趣,紅色就是我們想找出來的,綠色就是模式,這樣我們就能了解我們的競爭者。
現(xiàn)在我們所做的就是監(jiān)管式,我們已經(jīng)取得了很多的例子,我們獲得了一些公司的圖表,它已經(jīng)存在了在知識庫當(dāng)中存在,然后我們找到這些描述公司的句子,他們的價格,還有其他的信息。比如說2008年的并購,我們會得到相應(yīng)的信息,可能通過微軟,我們進行語義分析,因為我們要知道客體和主體是什么,其實這樣的程序,只知道兩個公司,并不知道誰是采購的,誰是被收購的,所以我們可以看到綠色的部分就是模式。
第二次就可以篩選綠色的部分獲得新的信息,同時我們已經(jīng)放了兩千個案例,基本上直說有五十到兩千個案例在其中,我們就可以看到整個圖?,F(xiàn)在我們來跳到下一部分,這是我們現(xiàn)在所采用的一個方式,我們在處理語言的時候,我們需要有不同的步驟,這是中國的排序,他們沒有空白,那我需要把它進行分區(qū),我們需要找到每一個部分的語義是什么樣的,我需要找到現(xiàn)在的表達方式是什么,因為同一種語義可能會有數(shù)百萬的表達方式,但我要看一下現(xiàn)在的流行表達方式是什么,還有現(xiàn)在的組織的坐落點以及人所處的位置,這些都是我們的機器可以進行學(xué)習(xí)的,比如說在這兒,我們要利用神經(jīng)語言網(wǎng)絡(luò)學(xué)習(xí),大家可能知道LSTM是一種長期短期的記憶系統(tǒng),它是德國所開發(fā)的。
同時,我們還有使用這些監(jiān)管架構(gòu)來進行學(xué)習(xí),以及包括數(shù)據(jù)過濾,為什么我們要進行這方面的實施呢?因為我們現(xiàn)在對于大腦的構(gòu)造和模式,還并不知道我們只是進行模仿,而且我們使用這種知識的方式,充滿知識的機器學(xué)習(xí)方式,那這種系統(tǒng)不止是從數(shù)據(jù)當(dāng)中學(xué)習(xí),同時也可以從外顯的知識當(dāng)中學(xué)習(xí),他們可以把語義和術(shù)語聯(lián)系起來。我們通過外圍的數(shù)據(jù)進行篩選,有相應(yīng)的案例,那所以整個學(xué)習(xí)流程并不是從空白的方式開始的,而是基于其他人所給予我們的知識,空白的知識,我并不相信,所以我們需要在這個知識庫當(dāng)中放入更多的知識,進行再度學(xué)習(xí)。
這是一種分階段式的學(xué)習(xí),那我們再跟大家分享一下我們的觀點就是通過把隱性知識和外顯知識結(jié)合起來,充分利用人的認知,這是革新性的資產(chǎn),如果只有具有邏輯性的知識,我們同樣也需要這些包括知覺或者是技能知識的總結(jié),在人工智能方面,我們需要把隱性知識和顯性知識結(jié)合起來,就像汽車一樣,用混合動力的,意味著人工智能和人腦結(jié)合方面,也就是把所有的學(xué)習(xí)整合起來。最重要的一點我們要理解數(shù)據(jù),收集數(shù)據(jù),可以把收集的信息進行簡化。這樣的結(jié)合可能運用到現(xiàn)在行業(yè)的各個領(lǐng)域。現(xiàn)在在醫(yī)藥領(lǐng)域,行業(yè)工業(yè)領(lǐng)域或者是汽車制藥領(lǐng)域都可以使用這樣的比如通過X光檢測產(chǎn)品的質(zhì)量,但是并沒有幫我們進行正確的決定,所以如果做出更合理的決定,我們需要把顯性知識和隱性知識結(jié)合起來,謝謝大家。
-
人工智能
+關(guān)注
關(guān)注
1806文章
49028瀏覽量
249529 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134622 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122795
原文標(biāo)題:演講實錄丨漢斯·烏思克爾特:結(jié)合不同類型機器學(xué)習(xí)進行的信息和知識提取
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
漢思新材料|芯片級底部填充膠守護你的智能清潔機器人

漢思膠水在半導(dǎo)體封裝中的應(yīng)用概覽

簡單認識阿倫尼烏斯壽命模型

使用MATLAB進行無監(jiān)督學(xué)習(xí)

漢思新材料取得一種封裝芯片高可靠底部填充膠及其制備方法的專利

不同類型機器人及其所需的滑環(huán)種類
思特威SC020HGS的數(shù)據(jù)手冊
阿丘科技將亮相斯圖加特國際機器視覺展,攜前沿技術(shù)啟航國際市場

評論