機器學習和互聯(lián)網(wǎng)意味著海量數(shù)據(jù)和復雜的聯(lián)系,同時也意味著人類無法理解的運行過程——人工智能的“黑箱”是近期學界熱議的一個話題,當我們無法理解算法和它生產出的內容,它會怎樣改變人類的思想和整個世界的運行?與此同時,完全無法理解這些數(shù)據(jù)意味著什么的人工智能,真的是在分析世界嗎?技術發(fā)展伴隨而來的是人類對自身的懷疑,也許在未來,關于世界的知識和對世界的理解之間的鴻溝會日漸加深。原文標題為Machine Learning Widens the Gap Between Knowledge and Understanding,摘自David Weinberger的新書《日?;靵y:技術、復雜性以及我們如何在一個充滿可能性的新世界中發(fā)展》(EVERYDAY CHAOS: Technology, Complexity, and How We’re Thriving in a New World of Possibility)。
Deep Patient的程序不知道被敲頭會讓人類感到頭暈,也不知道糖尿病人不應該一次吃5磅的三角巧克力,它甚至不知道肱骨和腕骨相連。它只知道研究人員在2015年給它提供的東西:70萬名患者的醫(yī)療記錄。這是一堆完全沒有可理解框架的混亂數(shù)據(jù)。
然而,在分析了這些數(shù)據(jù)之間的關系之后,Deep Patient不僅能夠診斷出個別患者罹患特定疾病的可能性(在某些情況下,它甚至比人類醫(yī)生更準確),包括一些迄今為止完全無法預測的疾病。
如果你問你的醫(yī)生,為什么Deep Patient認為現(xiàn)在就開始服用他汀類藥物或做個預防性手術可能比較明智,你的醫(yī)生可能沒法告訴你原因,但這不是因為他/她不夠聰明,也不是因為他/她醫(yī)術不高。Deep Patient是一種深度學習的人工智能(它本身就是機器學習的一種),盡管它不知道這些數(shù)據(jù)代表什么,但它可以發(fā)現(xiàn)數(shù)據(jù)之間的關系。
基于此,它組裝了一個信息點網(wǎng)絡——每個信息點都有權重,能夠決定它所連接的點有多大可能會“觸發(fā)”(該觸發(fā)會影響它們所連接的點,就像觸發(fā)大腦中的神經元一樣)。舉個例子,Deep Patient認為,某個病人有72%的幾率患上精神分裂癥,想要理解它為什么會作出這樣的診斷,醫(yī)生就必須進入這數(shù)百萬個信息點以及它們之間的聯(lián)系和權重網(wǎng)絡之中——這實在是太多了,他們之間的關系也太復雜了。
當然,作為一名患者,你可以選擇拒絕接受Deep Patient的概率性結論,但這樣做是有風險的?,F(xiàn)實情況是,在某些情況下,Deep Patient比人類醫(yī)生的預測準確得多,但是它完全無法解釋它的預測,這是一種人工智能“黑箱”。
這也是未來,遠超醫(yī)學這一個領域。
你手機的導航系統(tǒng)、輸入預測、語言翻譯、音樂推薦等等功能都依賴于機器學習。
隨著人工智能變得越來越先進,它會越來越神秘。谷歌的AlphaGo對圍棋一無所知,“只是”從13萬場有記錄棋局中分析出6000萬步棋,但它依然擊敗了全世界排名最高的人類棋手。如果你研究AlphaGo的原理,想弄明白它為什么會下這一步棋而不是那一步棋,你可能只會看到數(shù)據(jù)之間一組復雜得難以形容的加權關系。AlphaGo可能無法用人類能夠理解的方式告訴你,為什么它會下這樣一步棋。
然而,AlphaGo的一步棋讓一些評論者啞口無言,圍棋大師樊麾說:“這不是人類的一步棋。我從來沒見過人類這么走?!比缓笏p輕地感嘆:“太美了,太美了?!?/p>
深度學習的算法之所以有效,是因為它們比任何人類都能更好地捕捉到宇宙的復雜性、流動性,甚至是宇宙之美——每件事都在影響著其他事物,世界是普遍聯(lián)系的。
諸如機器學習這樣的工具和策略正越來越多地讓我們直面我們日常生活中難以理解的錯綜復雜。但這種好處是有代價的:我們需要放棄我們對于理解世界和世界上發(fā)生的事情的堅持。
膚淺理解
我們人類長期以來都有這樣的印象:如果我們能夠理解事物發(fā)生背后那不可改變的規(guī)律,我們就能夠完美地預測、計劃和管理未來。例如,如果我們知道天氣變化的原理,天氣預報就能告訴我們上班時是否要帶把傘;如果我們知道是什么讓人們在Facebook信息流中點擊這個帖子而不是另一個帖子,我們就能策劃出完美的廣告方案;如果我們知道流行病背后的發(fā)生機制,我們就能阻止它的傳播……通過發(fā)現(xiàn)支配我們世界的規(guī)律和模式,我們了解了事情是如何發(fā)生的,我們對理解世界感到義不容辭。
考慮到我們的知識總是不完善的,這個假設建立在一個更深奧的假設之上:可知論。似乎我們與宇宙之間有一個不成文的約定,那就是如果我們足夠努力、足夠清晰地思考,宇宙就會交出它的秘密,因為宇宙是可知的,至少在某種程度上是順從我們意志的。
但是現(xiàn)在,我們的新工具(特別是機器學習和互聯(lián)網(wǎng))讓我們認識到我們周圍數(shù)據(jù)和信息的廣泛性,我們開始接受世界的復雜性遠遠超過我們以往用來解釋它的法則和模型。我們創(chuàng)造的這些新的、容量大的機器比我們更接近于“理解世界”的層次。
而它們,作為機器,什么都不理解。
David Weinberger的《日?;靵y:技術、復雜性以及我們如何在一個充滿可能性的新世界中發(fā)展》(EVERYDAY CHAOS: Technology, Complexity, and How We’re Thriving in a New World of Possibility)封面
這反過來又挑戰(zhàn)了我們在更深層次上持有的另一種假設:宇宙可知,是因為(我們假設)我們人類足夠獨特,能夠理解宇宙的運行。至少從古希伯來人開始,我們就認為自己是上帝創(chuàng)造的獨一無二的生物,有能力接受上帝對真理的啟示。自古希臘以來,我們就把自己定義為理性的生物,能夠看到世界表面混亂之下的邏輯和秩序。我們最基本的戰(zhàn)略依賴于我們和世界之間的這種特殊關系。
放棄人類這個物種的傳統(tǒng)自我認知是無比痛苦的。感覺被信息過載壓碎,緊張地等待接下來的發(fā)生在商業(yè)、政府、文化中的混亂……這些情緒只是深層問題的局部痛感:我們并不像我們認為的那樣能很好地適應我們的宇宙。我們的大腦無法像人工智能那樣準確、快速地分析或預測事件。進化給了我們適應生存的思維,但這種思維只是順便發(fā)現(xiàn)了真相。我們的物種與眾不同,我們有情感、直覺、創(chuàng)造力,這種主張開始變得過于一廂情愿,甚至有點絕望。
這種幻滅是我們應該接受的——不僅僅是因為不管我們接受與否,它都在發(fā)生。我們理解和管理未來的能力正開始經歷偉大飛躍:我們開始制定相關策略,開始考慮世界的復雜性,而不是總要把世界縮小到一個我們可以預測、控制、感到舒適的大小。
我們正在經歷這一飛躍,因為它已經使我們能夠更高效、更有成效地與更多人、更多想法接觸,更有創(chuàng)意,更快樂。它已經使我們在商業(yè)和個人生活中的許多最基本的想法和最習慣的做法重新語境化。它正在我們文化的每一個角落產生回響。
這些跡象在我們周圍隨處可見,但在許多情況下,它們隱藏在看似正常且顯而易見的實踐和想法中。例如,在機器學習出現(xiàn)之前,互聯(lián)網(wǎng)已經讓我們習慣了這些變化。
A/B測試之謎
當巴拉克·奧巴馬(Barack Obama)第一次參加總統(tǒng)競選時,他在自己的網(wǎng)站上試用了兩個版本的注冊按鈕,結果發(fā)現(xiàn),與“現(xiàn)在加入我們(Join Us Now)”或“現(xiàn)在注冊(Sign Up Now)”此類按鈕名稱相比,標有“了解更多(Learn more)”的按鈕吸引了更多的點擊。
另一項測試顯示,奧巴馬一家的一張黑白照片獲得的點擊量,出人意料地遠超此前使用的彩色照片。
然后,他們在同一頁面放入“了解更多”按鈕和黑白照片,結果是:注冊人數(shù)增加了40%。
總的來說,在競選中,1300萬郵件列表名單中將近三分之一的名單、大約7500萬美元的捐款都是由于這樣的A/B測試提高了網(wǎng)站的表現(xiàn)。A/B測試即網(wǎng)站把一個廣告或內容的不同版本分發(fā)給一定量的幾組隨機用戶,然后用測試結果來決定用戶最終將會看到哪個版本的內容。
更令人驚訝的是,奧巴馬團隊發(fā)現(xiàn),與純文本信息相比,奧巴馬在集會上煽動群眾的視頻點擊率要低得多??紤]到奧巴馬作為演說家的才能著實不一般,這種差異該怎么解釋?。繄F隊并不知道,他們也并不需要知道。數(shù)據(jù)告訴他們應該在競選網(wǎng)站上發(fā)布哪些內容,即使沒有告訴他們原因,他們也照做不誤。結果很好:更多的點擊、更多的捐款、可能更多的選票。
A/B測試已經成為一種常見的實踐:谷歌的搜索結果是A/B測試的結果;Netflix上電影的布局來自A/B測試;甚至《紐約時報》使用的一些標題也是A/B測試的結果……2014年至2016年,必應的軟件工程師進行了2.12萬次A/B測試,其中三分之一的測試給服務帶來變化。
A/B測試有效果,甚至不需要懂它為什么有效。為什么在亞馬遜上,如果笑容燦爛的女性圖片在網(wǎng)頁左邊的話,該廣告會提高銷量呢?我們可以制造一個理論,但我們仍然建議針對下一個廣告的位置進行A/B測試。奧巴馬的黑白照片吸引了更多點擊,并不意味著他的對手約翰·麥凱恩(John McCain)也應該棄用他的彩色照片。亞馬遜為戶外燒烤架進行推廣活動時,使用藍色背景而不是綠色背景,這讓我們沒有理由認為它有可能會適用于室內燒烤。
事實上,影響人們偏好的因素完全有可能是微觀的、短暫的。也許50歲以上的男性更喜歡模特在左邊的廣告,但前提是廣告的標題很有趣,而來自底特律的女性在兩天陰沉沉的天氣之后終于呼吸到燦爛的陽光,她們這會兒更喜歡模特在右邊的廣告。也許有些人剛看完對比度強烈的視頻,他們現(xiàn)在更喜歡黑白照片,而其他人則可能因為洋基隊剛輸?shù)粢粓霰荣惗矚g彩色的版本。也許會出現(xiàn)一些能夠歸納的理論,也許不能,我們不知道。原因可能和世界本身一樣千差萬別。
我們從小就相信,世界的真相和現(xiàn)實是由一些不可改變的規(guī)律來表達的。學習規(guī)律,你就能做出預測。發(fā)現(xiàn)新的規(guī)律,你就能預測更多的事情。如果有人想知道你是如何做出預測的,你可以向他們展示你所掌握的規(guī)律和數(shù)據(jù)。但是在A/B測試中,我們通常沒有心理框架來解釋為什么一個版本的廣告比另一個版本更好。
想想扔沙灘球。你認為球將向你扔的方向呈拋物線運動,因為我們的心理模型——我們思考事物相互作用的一套規(guī)則——考慮了重力和動能。如果球向另一個方向運動了,你也不會認為模型錯了,相反,你會認為你沒有考慮到一些因素:也許你手滑了一下。
這正是我們在A/B測試中不需要做的事情。我們不需要知道為什么一張黑白照片和一個“了解更多”按鈕會增加競選捐款。如果我們發(fā)現(xiàn)民主黨人的競選廣告經驗對他/她的共和黨對手不起作用——他們很可能確實不會起作用——那也沒關系,因為再做一次A/B測試就好,A/B很便宜。
A/B測試只是一個例子,它在不知不覺中向我們表明:原理、規(guī)律和歸納并不像我們想象的那么重要。也許,只是也許,當我們無法處理現(xiàn)實的細枝末節(jié)時,我們才會用到原理。
復雜性的有效性
我們剛剛看了兩個基于計算機的技術案例,它們完全不同:一個是編程技術(機器學習),另一個是全球性的空間(互聯(lián)網(wǎng)),我們在互聯(lián)網(wǎng)遇到更多的人,欣賞他們對意義和創(chuàng)造力的表達。當然,這些技術通常是相互交織的:機器學習需要使用互聯(lián)網(wǎng)大規(guī)模收集信息,越來越多基于互聯(lián)網(wǎng)的服務同時使用、喂養(yǎng)機器學習。
這兩種技術至少有三個共同點:巨大性、聯(lián)系性、復雜性,這三個共同點一直在教導我們世界是如何運行的。
巨大性——即它們的規(guī)?!c我們參觀世界上最大的麻繩球故鄉(xiāng)或想象把世界上所有的土豆都堆在一起時完全不同。巨大性的重要性在于機器學習和互聯(lián)網(wǎng)能達到的細節(jié)水平。這兩種技術都依賴于細節(jié)和獨特性,而不是通過歸納或壓制“邊緣”信息和思想來擺脫細節(jié)。
聯(lián)系性意味著,這兩種技術所包含的各個部分可以相互影響,而無需顧慮物理距離造成的障礙。聯(lián)系性對這兩種技術至關重要:只能連接兩個部分、一次只能連接一對的網(wǎng)絡可不能叫做互聯(lián)網(wǎng),只能叫做舊的電話系統(tǒng)。我們新技術的聯(lián)系性是規(guī)模巨大的、多途徑的、無距離的,也是必不可少的。
機器學習和互聯(lián)網(wǎng)的巨大性和聯(lián)系性導致了它們的復雜性。規(guī)模巨大的碎片之間的聯(lián)系有時會導致一連串的事件,而這些事件的結局可能與它們開始的地方相去甚遠。微小的差異可能導致這些系統(tǒng)出現(xiàn)意想不到的巨大轉折。
我們不是因為這些技術的巨大性、聯(lián)系性、復雜性而使用這些技術,我們使用它們是因為它們有效。我們利用這些技術的成功——而不是技術本身——向我們展示了世界比我們想象的更加復雜和混亂,這反過來鼓勵我們探索新的方法和策略,挑戰(zhàn)我們對理解和解釋的本質和重要性的假設,并最終引導我們對世界有一個新的認識。
-
人工智能
+關注
關注
1807文章
49029瀏覽量
249603 -
機器學習
+關注
關注
66文章
8503瀏覽量
134635
原文標題:機器學習加深了“知識”和“理解”之間的鴻溝
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論