當你向Facebook上傳了一張你朋友的照片后,這張照片就進入了一個復雜的幕后處理過程。算法迅速行動并分析照片的每一個像素,直到將朋友的名字和這張照片匹配起來。這類型的前沿技術也被用在了自動駕駛汽車上,使得自動駕駛汽車能夠從背景中區(qū)分行人和其它車輛。
這項技術也可以用來區(qū)分μ介子和電子嗎?很多物理學家相信這一點。在該領域的研究人員正著手運用它來分析粒子物理數(shù)據(jù)。
支持者們希望利用深度學習節(jié)省實驗時間、金錢和人力,讓物理學家們做其它不太繁瑣的工作。另一些人希望能提高實驗的結(jié)果,相比以前使用的任何算法,這個算法能使他們更好地識別粒子和分析數(shù)據(jù)。盡管物理學家們不認為深度學習是萬能的,但一些人認為它可能在應對即將到來的數(shù)據(jù)處理危機中起到關鍵作用。
直至今日,計算機科學家們?nèi)越?jīng)常人工編寫算法,一個任務往往需要無數(shù)個小時的復雜計算機語言工作。“我們?nèi)匀蛔鲋诲e的科學工作,”費米國立加速器實驗室的科學家Gabe Perdue說,“但是我認為科學工作還可以做得更好?!?/p>
而如果要使用深度學習,我們則需要一種不同的人類輸入。
一種實現(xiàn)深度學習的方法是使用卷積神經(jīng)網(wǎng)絡(CNN)。CNN是模擬人類視覺感知建模的。人類用自身的神經(jīng)元網(wǎng)絡處理圖像;CNN通過輸入層節(jié)點(node)來處理圖像。人們通過向網(wǎng)絡送入預處理的圖像來訓練CNN。通過學習這些輸入,算法會不斷調(diào)整各節(jié)點的權重并因此學會識別模式和相關點。由于算法不斷修正這些權重,預測結(jié)果會變得越來越準確,甚至超越人類。
卷積神經(jīng)網(wǎng)絡以通過將多個權重綁在一起的方式來縮短分解數(shù)據(jù)處理的步驟,這意味著必須調(diào)整的算法元素更少。
CNN出現(xiàn)于90年代末。但是近年來隨著許多方面的突破(如處理圖形的硬件價格降低、訓練數(shù)據(jù)集不斷擴增以及CNN架構本身的創(chuàng)新),越來越多的研究人員開始使用它們。
CNN的發(fā)展導致語音識別、翻譯以及其它傳統(tǒng)上由人類完成的任務的進步。一家Alphabet(谷歌母公司)旗下位于倫敦的公司DeepMind使用CNN創(chuàng)建了AlphaGo,這個計算機程序在3月份打敗了世界排名第二的圍棋選手,圍棋是比國際象棋更復雜的策略棋盤游戲。
CNN使得我們可以更從容地處理大量的基于圖像的數(shù)據(jù),而之前我們對這些數(shù)據(jù)束手無策——高能物理學中經(jīng)常會碰到這種圖像數(shù)據(jù)。
進入物理學領域
隨著大數(shù)據(jù)和具有處理大量信息所必需的計算能力的圖形處理單元(GPU)的出現(xiàn),CNN在2006年開始得到大規(guī)模運用。Perdue說:“從那之后,精確度有了很大的提高,人們也還一直在繼續(xù)高速地創(chuàng)新。”
大約一年前,各類高能物理實驗的研究人員開始考慮將CNN引入他們的實驗的可能性。“我們把物理問題變成了:‘我們能否分辨一輛自行車和汽車?’”SLAC國家加速器實驗室研究員Michael Kagan說,“我們只想弄清楚如何以正確的方式重組問題。”
在大多數(shù)情況下,CNN將用于粒子識別和分類以及粒子軌跡重建。一些實驗已經(jīng)使用CNN來分析粒子的相互作用,其準確性很高。例如,NOvA中微子實驗的研究人員已經(jīng)將CNN應用到了其數(shù)據(jù)上。
“CNN 本來是用于識別動物和人的圖片,但它也能很好的用于物理領域的識別,”費米實驗室科學家Alex Himmel 說,“預測結(jié)果非常好——相當于我們的檢測器多產(chǎn)生了30% 的數(shù)據(jù)?!?/p>
從事大型強子對撞機(LHC/Large Hadron Collider)實驗的科學家們希望借助深度學習來使他們的實驗更自動化,CERN 物理學家Maurizio Pierini 說:“我們正試圖在一些任務上取代人。用人來看管比用計算機看管要昂貴得多?!?/p>
在檢測器物理學以外,CNN 也被證明是有用的。在天體物理學方面,一些科學家正在開發(fā)可以發(fā)現(xiàn)新的引力透鏡的CNN;引力透鏡是指可以扭曲來自它們后面的遙遠星系的光的大型天體(如星系團(galaxy clusters))。對望遠鏡數(shù)據(jù)掃描以尋找引力透鏡扭曲現(xiàn)象的過程是非常耗時的,并且普通的模式識別程序難以區(qū)分它們的特征。
“公平地說,在使用這些工具時,我們僅僅涉及了很淺的部分,”在費米實驗室的NOvA 實驗項目工作的威廉瑪麗學院博士后研究員Alex Radovic 說。
未來的數(shù)據(jù)盛宴
一些科學家認為神經(jīng)網(wǎng)絡可以幫助應對他們預見的即將到來的數(shù)據(jù)處理危機。
計劃于2025年推出的升級版大型強子對撞機將產(chǎn)生大約10倍的數(shù)據(jù)。暗能量光譜儀(Dark Energy Spectroscopic Instrument)將收集大約3500萬個宇宙物體的數(shù)據(jù),大型綜合巡天望遠鏡(Large Synoptic Survey Telescope)將捕獲近400億個星系的高分辨率視頻。
數(shù)據(jù)量一定會飛速增長,但從前計算機芯片處理能力的指數(shù)級增長預計將會陷入停頓。這意味著處理更大量的數(shù)據(jù)將越來越昂貴。
“對于10倍的碰撞次數(shù),你可能需要超過100倍的處理能力,”Pierini 說?!坝脗鹘y(tǒng)的做事方式,我們會走入死胡同?!?/p>
然而,并不是所有的實驗都適用于該技術。
“我認為有時這會是正確的工具,但它不會一直是正確的,”Himmel 說,“數(shù)據(jù)與自然圖像越不相似,神經(jīng)網(wǎng)絡的有用性越低?!?/p>
大多數(shù)物理學家都同意,CNN 不適合剛剛啟動的實驗中的數(shù)據(jù)分析,因為神經(jīng)網(wǎng)絡對于計算過程不是很透明?!斑@會很難說服人們相信他們已經(jīng)發(fā)現(xiàn)了新的東西,”Pierini 說,“我認為用紙和筆做事情仍然是有價值的?!?/p>
在某些情況下,運用CNN 的挑戰(zhàn)將超過獲益。例如,如果數(shù)據(jù)尚未轉(zhuǎn)換為圖像格式,則需要將其轉(zhuǎn)換為圖像格式。并且神經(jīng)網(wǎng)絡需要大量的數(shù)據(jù)用于訓練——有時不得不模擬數(shù)百萬的圖像。即使這樣,模擬也不如真實數(shù)據(jù)那么好。因此,神經(jīng)網(wǎng)絡必須用實際數(shù)據(jù)和其它交叉檢查進行測試。
“一個高標準的物理學家能夠接受任何新事物,”德克薩斯大學阿靈頓分校的物理學副教授Amir Farbin 說,“需要跨越很多障礙去說服大家這是對的?!?/p>
展望未來
對于那些相信CNN 結(jié)果的人,CNN 意味著更快的物理學和值得期待的未知。
一些人希望用神經(jīng)網(wǎng)絡來檢測數(shù)據(jù)中的異常,這可以指示檢測器中的缺陷或者為新發(fā)現(xiàn)指引線索。為了尋找新發(fā)現(xiàn),研究人員可以只是讓 CNN 遍歷數(shù)據(jù)并試圖找到突出點,而不是一定要找到具有特定標志的新事物?!安槐刂付ㄒ阉鞯男挛锢淼念I域,”Pierini 說,“這里獲取數(shù)據(jù)的方式更開放?!?/p>
日后,研究人員甚至可能開始采用無監(jiān)督學習來處理物理數(shù)據(jù)。無監(jiān)督學習,顧名思義,是指可以無需人工指導就訓練大量數(shù)據(jù)的算法??茖W家可以傳輸給該算法相應的數(shù)據(jù),然后該算法就能從中得出結(jié)論。
“如果你足夠聰明,你可以使用它來做所有類型的事情,”Perdue 說,“如果它能夠推斷新的自然規(guī)律或類似定律,這將是驚人的?!?/p>
“但是,”他補充道,“那樣的話,我也要去尋找新的工作了?!?/p>
評論