一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)引發(fā)對(duì)科學(xué)見(jiàn)解的反思簡(jiǎn)析

中科院半導(dǎo)體所 ? 來(lái)源:悅智網(wǎng) ? 2023-03-03 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)學(xué)和物理是一對(duì)老朋友。長(zhǎng)期以來(lái),它們見(jiàn)證了技術(shù)發(fā)展的起落,包括計(jì)算尺、計(jì)算器和Wolfram Alpha等輔助工具。如今,隨著機(jī)器學(xué)習(xí)的最新進(jìn)展應(yīng)用于解決數(shù)學(xué)和物理問(wèn)題,這些進(jìn)展提出了一個(gè)根本性的問(wèn)題:讓算法學(xué)會(huì)我們思考方式有何意義?

為什么要這么做?

“計(jì)算機(jī)非常擅長(zhǎng)數(shù)學(xué),指的是它們很擅長(zhǎng)解決非常具體的問(wèn)題?!惫雀柩芯吭旱臋C(jī)器學(xué)習(xí)專家蓋伊?古爾阿里(Guy Gur-Ari)說(shuō)。計(jì)算機(jī)擅長(zhǎng)運(yùn)算,填入數(shù)字并計(jì)算是相對(duì)簡(jiǎn)單的。但在形式結(jié)構(gòu)之外,計(jì)算機(jī)則舉步維艱。

解決數(shù)學(xué)文字問(wèn)題或“定量推理”看起來(lái)比較棘手,因?yàn)樗枰鼮榉€(wěn)健和嚴(yán)密,而解決許多其他問(wèn)題也許并不需要。雖然機(jī)器學(xué)習(xí)模型接受訓(xùn)練的數(shù)據(jù)越多,產(chǎn)生的錯(cuò)誤越少,但對(duì)于定量推理,改進(jìn)的程度卻很有限。研究人員開(kāi)始意識(shí)到,對(duì)于機(jī)器學(xué)習(xí)生成模型在解決語(yǔ)言文字問(wèn)題時(shí)產(chǎn)生的錯(cuò)誤,需要更有針對(duì)性的方法。

2021年,來(lái)自加州大學(xué)伯克利分校和OpenAI的兩個(gè)不同團(tuán)隊(duì)分別發(fā)布了MATH和GSM8K兩個(gè)數(shù)據(jù)集,這兩個(gè)數(shù)據(jù)集包含了涉及幾何、代數(shù)和微積分基礎(chǔ)等的數(shù)千個(gè)數(shù)學(xué)問(wèn)題。“我們就是想要看看,數(shù)據(jù)集是否有問(wèn)題?!痹?a target="_blank">人工智能安全中心研究MATH的研究員史蒂文?巴薩特(Steven Basart)說(shuō)。用格式更好的、更大的數(shù)據(jù)集進(jìn)行訓(xùn)練,是否能夠修復(fù)機(jī)器學(xué)習(xí)定量推理的錯(cuò)誤?MATH團(tuán)隊(duì)發(fā)現(xiàn),定量推理對(duì)最高級(jí)的機(jī)器學(xué)習(xí)語(yǔ)言模型也頗具挑戰(zhàn),其得分不到7%。(人類研究生的得分為40%,而國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽冠軍的得分為90%。)

GSM8K數(shù)據(jù)集則是更簡(jiǎn)單的小學(xué)階段問(wèn)題,受訓(xùn)模型的準(zhǔn)確率達(dá)到了約20%。為了實(shí)現(xiàn)這種準(zhǔn)確率,OpenAI的研究人員使用了兩種技術(shù):精調(diào)和驗(yàn)證。在精調(diào)中,研究人員采用一個(gè)包含不相關(guān)信息的預(yù)訓(xùn)練語(yǔ)言模型,在訓(xùn)練中僅展示相關(guān)信息(數(shù)學(xué)問(wèn)題);驗(yàn)證則允許模型重新審視其錯(cuò)誤。

當(dāng)時(shí),OpenAI預(yù)測(cè),需要使用100倍的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,才能在GSM8K上達(dá)到80%的準(zhǔn)確率。但2022年6月,谷歌的Minerva宣布,小規(guī)模擴(kuò)大訓(xùn)練即可實(shí)現(xiàn)78%的準(zhǔn)確率。OpenAI的機(jī)器學(xué)習(xí)專家卡爾·科布(Karl Cobbe)說(shuō):“這超出我們所有的預(yù)期?!卑退_特表示同意,他說(shuō):“這太令人震驚了,我還以為要花很長(zhǎng)的時(shí)間?!?br />
Minerva使用了谷歌自己的通路語(yǔ)言模型(PaLM),根據(jù)來(lái)自arXiv的科學(xué)論文和其他來(lái)源進(jìn)行格式化數(shù)學(xué)精調(diào)。此外,幫助Minerva的還有另外兩個(gè)策略。在“思維鏈提示”中,要求Minerva將較大的問(wèn)題分解為更容易接受的小問(wèn)題。該模型還使用多數(shù)投票,而不是僅要它提供一個(gè)答案或?qū)⒁粋€(gè)問(wèn)題解算100次。在這些結(jié)果中,Minerva選出最常見(jiàn)的答案。

這些新策略帶來(lái)了巨大的好處。Minerva在MATH上實(shí)現(xiàn)了高達(dá)50%的準(zhǔn)確率,在GSM8K上的準(zhǔn)確率接近80%。在MMLU上也是這樣,MMLU是一個(gè)包含化學(xué)和生物的STEM普通問(wèn)題集。對(duì)問(wèn)題略微調(diào)整后隨機(jī)取樣,讓Minerva重新進(jìn)行計(jì)算,其表現(xiàn)也很好,這表明,這個(gè)能力不僅源自記憶。

關(guān)于數(shù)學(xué),Minerva了解哪些、不了解哪些,是很模糊的。這與數(shù)學(xué)家使用的帶有內(nèi)置結(jié)構(gòu)的“證明助手”不同,Minerva和其他語(yǔ)言模型沒(méi)有形式結(jié)構(gòu)。它們可能會(huì)產(chǎn)生奇怪、混亂的推理,但仍然可得出正確的答案。隨著數(shù)字的增大,語(yǔ)言模型的準(zhǔn)確度會(huì)下降,這對(duì)于可靠的老式TI-84 Plus計(jì)算器,是絕不會(huì)發(fā)生的。

“它到底是聰明?還是不聰明?”科布問(wèn)。雖然像Minerva一樣的模型也許能夠得出與人類一樣的答案,但其遵循的實(shí)際過(guò)程可能完全不相同。另一方面,曾被要求“展示自己的作業(yè)”的學(xué)生都很熟悉“思維鏈提示”。

谷歌研究院的機(jī)器學(xué)習(xí)專家伊桑?戴爾(Ethan Dyer)說(shuō):“我認(rèn)為人們有這樣一個(gè)概念,做數(shù)學(xué)的人有某種嚴(yán)格的推理系統(tǒng),在已知和未知之間有明顯的區(qū)別。”但人也可能得出不一致的答案、會(huì)犯錯(cuò)誤和未能應(yīng)用核心概念。在機(jī)器學(xué)習(xí)的這一前沿,邊界是模糊的。

像物理學(xué)家一樣思考

粒子物理的數(shù)據(jù)與眾不同。雖然已經(jīng)證實(shí)卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)樹木、貓和食物等日常物體圖片的分類非常高效,但它并不適合粒子碰撞。加州大學(xué)圣地亞哥分校的粒子物理學(xué)家哈維爾?杜爾特(Javier Duarte)表示,問(wèn)題在于來(lái)自大型強(qiáng)子對(duì)撞機(jī)(LHC)的碰撞數(shù)據(jù)無(wú)法作為圖像。

華而不實(shí)地描述LHC碰撞可誤導(dǎo)甚至堵塞整個(gè)探測(cè)器。實(shí)際上,在數(shù)百萬(wàn)個(gè)輸入中只有少量幾個(gè)輸入在記錄信號(hào),就像白屏中有幾個(gè)黑色像素。這導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)中的圖像質(zhì)量很差,但在一個(gè)被稱為圖形神經(jīng)網(wǎng)絡(luò)(GNN)的不同新框架中,效果則很好。

除了格式奇怪以外,還有大量的數(shù)據(jù),大約為每秒約1拍字節(jié),其中只有少量高質(zhì)量數(shù)據(jù)被保存下來(lái)。為了更好地篩選數(shù)據(jù),研究人員想要訓(xùn)練更敏銳的算法。杜爾特說(shuō),要想提高效率,這種算法要具備驚人的速度,在微秒內(nèi)執(zhí)行。剪裁和量化等機(jī)器學(xué)習(xí)技術(shù)能使算法達(dá)到目標(biāo)。

借助機(jī)器學(xué)習(xí),粒子物理學(xué)家可以從不同的角度觀察數(shù)據(jù)。他們不僅關(guān)注單個(gè)事件,還學(xué)習(xí)和思考碰撞期間發(fā)生的幾十個(gè)其他事件,例如希格斯玻色子衰變?yōu)閮蓚€(gè)光子。雖然任意兩個(gè)事件之間沒(méi)有因果關(guān)系,但研究人員現(xiàn)在接受一個(gè)更全面的數(shù)據(jù)視圖,而不僅是單個(gè)事件分析得出的零碎視圖。

更引人注目的是,機(jī)器學(xué)習(xí)還迫使物理學(xué)家重新審視基本概念。麻省理工學(xué)院的理論粒子物理學(xué)家杰西?泰勒(Jesse Thaler)說(shuō):“過(guò)去,我自己對(duì)對(duì)稱性的看法不嚴(yán)密,強(qiáng)迫自己教授計(jì)算機(jī)什么是對(duì)稱,也是幫助自己理解對(duì)稱到底是什么?!睂?duì)稱需要參考系,換言之,鏡子中變形的球體圖像到底是否對(duì)稱?如果不知道鏡子本身是否變形,就無(wú)法知道答案。

粒子物理學(xué)中的機(jī)器學(xué)習(xí)仍然處于早期階段,實(shí)際上,研究人員現(xiàn)在對(duì)待相關(guān)技術(shù)就像對(duì)待廚房的洗碗池。杜爾特承認(rèn):“它也許不適合粒子物理學(xué)中的每一個(gè)問(wèn)題?!?br />
在一些粒子物理學(xué)家深入研究機(jī)器學(xué)習(xí)的同時(shí),腦中浮現(xiàn)出一個(gè)令人不安的問(wèn)題:他們是在研究物理學(xué)還是在研究計(jì)算機(jī)科學(xué)?往往不被視為“真正的物理學(xué)”的編程已經(jīng)存在;類似的擔(dān)憂也在困擾機(jī)器學(xué)習(xí)。有的研究人員擔(dān)心機(jī)器學(xué)習(xí)會(huì)遮掩非常復(fù)雜的情況,他們正在構(gòu)建算法,使用人類能夠理解的語(yǔ)言來(lái)提供反饋。而算法也許不是唯一負(fù)責(zé)溝通的主體。

泰勒說(shuō):“另一方面,我們希望機(jī)器能夠?qū)W習(xí)如何像物理學(xué)家那樣思考。我們也要多學(xué)習(xí)如何像機(jī)器那樣思考。我們需要學(xué)會(huì)講對(duì)方的語(yǔ)言。”







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 探測(cè)器
    +關(guān)注

    關(guān)注

    14

    文章

    2699

    瀏覽量

    74241
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4812

    瀏覽量

    103197
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7642

    瀏覽量

    90466
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8499

    瀏覽量

    134315
  • GNN
    GNN
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    6523

原文標(biāo)題:機(jī)器學(xué)習(xí)引發(fā)對(duì)科學(xué)見(jiàn)解的反思

文章出處:【微信號(hào):bdtdsj,微信公眾號(hào):中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2024年諾貝爾物理學(xué)獎(jiǎng)為何要頒給機(jī)器學(xué)習(xí)?

    (Geoffrey Hinton),表彰他們?cè)谑褂萌斯ど窠?jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方面的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。 ? 作為在科學(xué)界具有舉足輕重的地位和深遠(yuǎn)影響的諾貝爾獎(jiǎng),它不僅是對(duì)科學(xué)家個(gè)人成就的最高
    的頭像 發(fā)表于 10-10 00:11 ?4367次閱讀

    機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長(zhǎng)以及計(jì)算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場(chǎng)前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場(chǎng)的未來(lái)發(fā)展。
    的頭像 發(fā)表于 02-13 09:39 ?330次閱讀

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語(yǔ)。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法特征,供各位老師選擇。 01 傳統(tǒng)機(jī)器
    的頭像 發(fā)表于 12-30 09:16 ?1116次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?424次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    來(lái)源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆](méi)有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?930次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)機(jī)器
    的頭像 發(fā)表于 11-15 09:19 ?1141次閱讀

    工業(yè)機(jī)器人集成滑環(huán)特點(diǎn)簡(jiǎn)

    工業(yè)機(jī)器人也是滑環(huán)的重要應(yīng)用領(lǐng)域
    的頭像 發(fā)表于 10-23 15:05 ?480次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認(rèn)識(shí)。特別是書中提到的基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的能源管理系統(tǒng),通過(guò)實(shí)時(shí)監(jiān)測(cè)和分析能源數(shù)據(jù),實(shí)現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過(guò)多個(gè)案例展示了人工智能在能源科學(xué)
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    云端動(dòng)態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時(shí)還可提供高級(jí)安全性功能。AI 和數(shù)據(jù)科學(xué)家以及軟硬件開(kāi)發(fā)者均可充分利用高計(jì)算密度的優(yōu)勢(shì)來(lái)加速提升任何應(yīng)用的性能。AI 引擎機(jī)器學(xué)習(xí)擁有先進(jìn)的張量計(jì)算能力,非常適合用于高度優(yōu)化的 AI 和 M
    的頭像 發(fā)表于 09-18 09:16 ?774次閱讀
    AI引擎<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>陣列指南

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    Scrum框架的模式、過(guò)程和見(jiàn)解

    電子發(fā)燒友網(wǎng)站提供《Scrum框架的模式、過(guò)程和見(jiàn)解.pdf》資料免費(fèi)下載
    發(fā)表于 08-12 09:36 ?0次下載

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-02 11:25 ?2260次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無(wú)疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來(lái)了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?2364次閱讀