一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM新AI在辯論界完勝人類冠軍!

bzSh_drc_iite ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-04 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

6月18日,IBM的AI系統(tǒng)Project Debater首次與人類進行現(xiàn)場公開辯論。Project Debater能夠理解對方觀點,并有針對性地做出清晰的反駁,最終成功戰(zhàn)勝人類辯手。

美國時間6月18日,IBM Research推出了人工智能系統(tǒng)Project Debater,一個具有幽默感、小巧機智和偶爾有強有力的論點的實驗性會話AI系統(tǒng)。當(dāng)日,Project Debater首次與人類進行現(xiàn)場公開辯論,此次辯論比賽在舊金山的IBM沃森西部廠區(qū)( Watson West Site)舉行。

Project Debater是IBM Research(即超級電腦沃森背后的團隊)最新研制的AI系統(tǒng),也是第一個可以對復(fù)雜話題進行辯論的AI系統(tǒng),旨在通過公正的辯論來拓展人們的思維。Project Debater擁有數(shù)以億計的論文、報告和新聞文章的龐大數(shù)據(jù)庫。通過消化這些數(shù)據(jù),Project Debater可以就特定主題做出邏輯結(jié)構(gòu)良好的演講,提出清晰明確的論點,并對對手觀點進行反駁。盡管在一些敘述上不是很自然,并不能完全和人類相提并論,但Project Debater的思考和答辯仍然令人印象深刻。

IBM Research首席調(diào)查員兼Project Debater的創(chuàng)造者Noam Slonim稱,該AI系統(tǒng)的訓(xùn)練始于六年前,直到兩年前才有能力參與與人們的辯論。

IBM研究人員正在通過教授計算機來探索人工智能的界限,以創(chuàng)造引人入勝且信息更加豐富的觀點。他們的目標是建立一個智能系統(tǒng),幫助人們在答案模糊時作出基于證據(jù)的決定。自2012年起,Project Debater是IBM對AI的下一個重要里程碑,是繼深藍(Deep Blue)和沃森(Watson)后的又一突破。根據(jù)IBM的計劃,Project Debater未來將能夠通過提供引人注目的、以證據(jù)為基礎(chǔ)的論點并限制情感、偏見或模棱兩可的影響來幫助人們做出理智的判斷。

首戰(zhàn)告捷,戰(zhàn)勝頂尖人類辯手

Project Debater和2016年的以色列國家辯論冠軍Noa Ovadia、以色列國際辯論協(xié)會主席Dan Zafrir分別進行了辯論比賽。

圖左為Noa Ovadia,圖右為Dan Zafrir

在比賽中,Project Debater參與了兩個辯論主題,即“政府是否應(yīng)該資助太空探索”和“遠程醫(yī)療是否應(yīng)該在醫(yī)療保健中發(fā)揮更大作用”。IBM公司希望確保人工智能系統(tǒng)能在不知道將研究什么的情況下進行辯論,因此Project Debater在辯論前并不知道論題。

就“政府是否應(yīng)資助太空探索”的論題,Project Debater持正方,Noa Ovadia持反方。雙方隨后發(fā)布了四分鐘開幕詞、四分鐘反駁和兩分鐘論證總結(jié)。在每個部分之間,Project Debater聽取了人類對手的四分鐘開場白,解析了這些數(shù)據(jù),并創(chuàng)建了一個突出顯示并試圖駁斥人類對手所提出的信息的論據(jù)。這令人難以置信,因為它不僅要理解單詞,還要理解這些單詞的背景。鸚鵡學(xué)舌般復(fù)述維基百科條目很容易做到,但獲取數(shù)據(jù)并創(chuàng)建一個不僅基于原始數(shù)據(jù)而且還考慮到剛才聽到的敘述的內(nèi)容,卻十分困難。

Project Debater提出一個開放性觀點,即空間探索有益于人類,因為空間探索不僅有助于推動科學(xué)發(fā)現(xiàn),還能激勵年輕人突破思考的壁壘。Noa Ovadia則認為諸如地球科學(xué)研究之類的項目有更值得獲得政府補貼。在聽取了Noa的論點后,Project Debater發(fā)表了反駁言論,認為太空探索帶來的潛在技術(shù)和經(jīng)濟利益超過其他政府支出。

在雙方總結(jié)陳詞后,一項快速調(diào)查顯示,大多數(shù)觀眾認為Project Debater比人類的論述更能豐富他們的知識。

在這次辯論過程中,AI系統(tǒng)確實也出了些差錯,并做出了一些瘋狂的斷言,比如它認為太空探索“比更好的道路、更好的學(xué)?;蚋玫尼t(yī)療保健更重要”,或者在辯論過程中隨機地說出“Scott Pelley畫外音”,這似乎是參考了哥倫比亞廣播公司(CBS)新聞和60分鐘(60 Minutes)記者的言論。

Chris Reed是論證技術(shù)中心(Center for Argument Technology)的主任,負責(zé)的是一個探索會話式人工智能的學(xué)術(shù)團隊,并沒有參與Project Debater項目。應(yīng)IBM的邀請,Reed在周一的第一次演出中觀看了Project Debater的表現(xiàn),并表示就像在看“如此多的難題聚集在一起”,包括堅持自己論點的能力、語法錯誤的欠缺以及在做出決定之前能夠預(yù)測和反駁其反對者的論點等問題。

“爭論和辯論,本質(zhì)上是驅(qū)動科學(xué)進程的引擎,描述了大多數(shù)政治論壇發(fā)生的事情,甚至描繪了現(xiàn)代宗教的大多數(shù)概念?!盧eed說,“論證是人類的一個決定性特征,如果我們的機器能夠傳達其中的一部分,那么我認為這意味著一件非常重要的事情正在發(fā)生改變?!睆奈幕蟻砜矗q論的起源不在于沖突和競爭,而在于民主和討論。辯論豐富了決策制定過程,幫助人們權(quán)衡新思想和新理念的利弊。它處于文明社會的核心。我們辯論的不僅是為了讓別人相信我們自己的觀點,而且也是為了理解和學(xué)習(xí)彼此的觀點。

試想一下,一個與專業(yè)人類辯論家交流的AI系統(tǒng)聽取了他的觀點,并以令人信服的方式提出了自己的無腳本推論,說服聽眾思考其在有爭議的話題上的立場,這說明AI系統(tǒng)可以像人類一樣去理解意見并有針對性地給予自己的觀點。未來,相信機器能夠通過幫助人類做出許多重要決定。

之后,Project Debater與另一名以色列辯論專家Dan Zafrir之間進行了第二次辯論,對“應(yīng)該增加對遠程醫(yī)療的使用”的論題持反對意見。

此次辯論有四十名成員參與投票,Project Debater比Dan Zafrir多得9票,成功贏得比賽。

在辯論中,Project Debater能夠引用阿拉伯聯(lián)合酋長國的一系列資料以及德國經(jīng)濟事務(wù)部長的報告,獲得太空探索所能提供的就業(yè)數(shù)量等有效數(shù)據(jù)。但是,為了避免犯引用和語言邏輯方面的錯誤,Project Debater沒有直接引用其對手的論述。

“無偏見”的辯論機器

根據(jù)IBM研究人員Noam Slonim和Ranit Aharonov的說法,盡管人類辯論機器是對該技術(shù)的有趣展示,但Project Debater的真正力量將是其展現(xiàn)無偏見論述的能力。

圖左為Ranit Aharonov,圖右為Noam Slonim

我們生活在一個被情緒和偏見染上色彩的世界中,難免看問題的角度不夠真實與客觀。IBM表示,世界充滿了錯誤的信息和膚淺的想法,片面的、被篡改的敘事的興起正在挑戰(zhàn)社會和互聯(lián)網(wǎng)平臺。AI在語言和推理的新發(fā)展可以幫助提供多樣的、消息靈通的觀點,而Project Debater推動AI的前沿發(fā)展,促進智慧辯論,幫助人們建立充分知情的論點并做出更好的決策。

Project Debater可以幫助公司和政府透過我們生活經(jīng)歷中的喧囂提取出一些本質(zhì)的東西,并產(chǎn)生大多數(shù)公正的結(jié)論。當(dāng)然,它所提供的數(shù)據(jù)集是基于人類的寫作作品,而這些數(shù)據(jù)仍然會存在作者的情感與偏見。

雖然Project Debater的目標是一個沒有偏見的機器,但在辯論期間,它還是出現(xiàn)疑似帶有偏見的表現(xiàn)。在反駁人類辯手Dan Zafrir關(guān)于遠程醫(yī)療擴張的論題時,該系統(tǒng)聲稱,Zafrir在開幕聲明中并沒有說出有關(guān)遠程醫(yī)療使用增加的事實。換句話說,它認為Zafrir是個騙子。

當(dāng)被問及Project Debater這一表現(xiàn)時,IBM研究人員Noam Slonim表示,在反駁期間,該系統(tǒng)有一個置信度閾值。如果感覺非常自信,它會創(chuàng)建一個更復(fù)雜的陳述;如果感覺不那么自信,那么陳述就不那么令人印象深刻。因此,Project Debater對反駁意見不是很有信心,所以它基本上把Zafrir當(dāng)成一個騙子。有趣的是,這大概是這個系統(tǒng)整個晚上做的最人性化的事情。

構(gòu)建新AI系統(tǒng)困難重重

在此之前,人工智能可以對關(guān)鍵詞搜索回復(fù)簡單的問題或要求,比如“一升多少盎司?”或者“致電媽媽”,這為人們?nèi)粘I钐峁O大便利。Project Debater則開始探索新的領(lǐng)域:吸收了大量不同的信息和觀點,幫助人們建立有說服力的論點并做出明智的決定。

構(gòu)建系統(tǒng)是一項非常困難和復(fù)雜的挑戰(zhàn)。Slonim說,為了使Project Debater成為可能,研究人員開發(fā)了數(shù)十篇研究論文中記載的許多創(chuàng)新技術(shù)。雖然準備辯論和反駁或理解對手的論點可能需要大量的技術(shù),但辯論者的大部分對話仍然可以直接從文章中提取出來。

圖為研究人員Noam Slonim和Project Debater機器的合影

過去六年來,IBM以色列海法實驗室領(lǐng)導(dǎo)的全球IBM研究團隊賦予了Project Debater三種功能,每種功能都在AI方面開辟了新的天地:首先是數(shù)據(jù)驅(qū)動的語音編寫和交付功能;其次,聽力理解能夠識別隱藏在人類連續(xù)冗長的自然語音中的關(guān)鍵主張,并構(gòu)建有意義的反駁;第三,系統(tǒng)的模擬人類困境,基于一個獨特的知識圖譜,提煉出原則性的論點。

辯論的形式為這些核心能力提供了理想的測試基礎(chǔ)。辯論規(guī)則源于人類的討論文化,論證的內(nèi)核往往是內(nèi)在的主觀的。Project Debater必須適應(yīng)人的理性和思考邏輯,并提出人們可以理解和接受的論點。在辯論中,人工智能必須學(xué)會在凌亂的非結(jié)構(gòu)化人類世界中進行導(dǎo)航和檢索,而不是像在棋盤游戲中那樣使用預(yù)先定義的規(guī)則。

與Big Blue在國際象棋中打敗國際象棋大師Gary Kasparov、DeepMind的AlphaGo擊敗世界頂級圍棋選手不同,辯論比其他比賽更加細致,與會者通過投票來決定本場比賽的最佳辯手,而人工智能通常擁有勝過人類豐富觀眾知識的能力,Ranit Aharanov如是說。

結(jié)語:Project Debater有助于人類做出明智的決定

Project Debater讓我們更接近人工智能的一個巨大界限:掌握語言。它是IBM一系列主要AI創(chuàng)新產(chǎn)品中的最新產(chǎn)品,其它產(chǎn)品還包括1997年獲得國際象棋世界冠軍Garry Kasparov的IBM深?!癉eep Blue”,以及2011年在Jeopardy上擊敗人類冠軍的超級智能系統(tǒng)沃森(Watson)。

盡管Project Debater的工作還遠遠沒有完成,它有時會像人一樣犯錯。但在不遠的將來,它很有可能幫助解決數(shù)千個復(fù)雜的人類決策。例如,幫助收集和整理某個金融事實的相關(guān)材料,或提出與公共政策有關(guān)的贊成和反對的論點。由于不經(jīng)常受到人類主觀意識和偏見的影響,Project Debater提出的觀點可能會貼近事實。

Project Debater將擴展沃森的功能,目前數(shù)十家公司正在使用沃森的功能挖掘大量內(nèi)部數(shù)據(jù)集以獲得新的業(yè)務(wù)洞察力。該系統(tǒng)已經(jīng)使用了Watson Speech to Text API,并將有助于增強沃森的高級語言和對話功能。未來,它的基礎(chǔ)技術(shù)也將在IBM云平臺和IBM沃森中商業(yè)化。

這對AI來說是一個非常積極的發(fā)展。我們可以使這種變革性技術(shù)更加透明和可解釋,這樣我們就越能信任它;而我們越能信任它,它就越能幫助我們在日益復(fù)雜的世界中做出最好、最明智的決定。

Slonim在接受采訪時告訴VentureBeat,在此次辯論賽之后,Project Debrater將在今年晚些時候參加一場曠日持久的辯論,隨后可能會舉行一次研討會,學(xué)者可以提出他們對Project Debater的意見和評論。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1821

    瀏覽量

    75812
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279600

原文標題:辯論屆人機大戰(zhàn):IBM新AI完勝人類冠軍!

文章出處:【微信號:drc_iite,微信公眾號:全球技術(shù)地圖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    智能體AI面臨非結(jié)構(gòu)化數(shù)據(jù)難題:IBM推出解決方案

    北京?2025年7月1日?/美通社/ -- IBM 正在從根本上簡化面向 AI 的數(shù)據(jù)堆棧。IBM Think大會上預(yù)覽?watsonx.data?的重大演進,以幫助組織做好數(shù)據(jù)準備
    的頭像 發(fā)表于 07-02 09:40 ?154次閱讀

    比亞迪海鷗榮膺2025世汽車大獎“世界城市車”冠軍

    近日,全球汽車行業(yè)權(quán)威獎項“2025世汽車大獎”(World Car Awards)于紐約國際車展正式揭曉。比亞迪海鷗憑借其創(chuàng)新的設(shè)計理念、卓越的城市通勤性能及全球市場的高度認可,從全球12款候選車型中脫穎而出,榮膺“2025世城市車(World Urban Car)
    的頭像 發(fā)表于 04-18 17:52 ?547次閱讀

    IBM推出新一代大型主機IBM z17

    今天,IBM(紐約證券交易所:IBM)宣布推出新一代大型主機 IBM z17。作為 IBM Z 主機系列的最新旗艦產(chǎn)品,IBM z17 搭載
    的頭像 發(fā)表于 04-10 14:45 ?488次閱讀

    IBM攜手英偉達AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉達(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉達 AI 數(shù)據(jù)平臺參考架構(gòu)(reference architecture)進行產(chǎn)品集成
    發(fā)表于 03-24 19:20 ?239次閱讀

    納米銅燒結(jié)為何納米銀燒結(jié)?

    ,納米銅燒結(jié)技術(shù)逐漸展現(xiàn)出其獨特的優(yōu)勢,甚至某些方面被認為納米銀燒結(jié)。本文將深入探討納米銅燒結(jié)技術(shù)為何能夠在這一領(lǐng)域脫穎而出。
    的頭像 發(fā)表于 02-24 11:17 ?946次閱讀
    納米銅燒結(jié)為何<b class='flag-5'>完</b><b class='flag-5'>勝</b>納米銀燒結(jié)?

    IBMwatsonx.ai平臺推出DeepSeek R1蒸餾模型

    ,進一步增強企業(yè)安全、治理以及規(guī)?;渴鸱矫娴哪芰Α?DeepSeek R1是IBMAI領(lǐng)域的一項重要創(chuàng)新,它采用了蒸餾模型技術(shù),能夠
    的頭像 發(fā)表于 02-14 10:21 ?520次閱讀

    IBM企業(yè)級AI開發(fā)平臺watsonx.ai上線DeepSeek R1蒸餾模型

    IBM日前宣布,DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸餾版本現(xiàn)已在 IBM 的企業(yè)級 AI 開發(fā)平臺 watsonx.ai 上提供。
    的頭像 發(fā)表于 02-12 10:02 ?437次閱讀

    DeepSeek最新AI模型現(xiàn)已登陸IBM watsonx.ai平臺

    ,工程和科學(xué)計算提供裨益。 利用已部署的模型(如 IBM Granite,Llama,DeepSeek等)和以下解決方案能力,開發(fā)者可以 IBM watsonx.ai 內(nèi)構(gòu)建
    的頭像 發(fā)表于 02-08 09:21 ?766次閱讀

    天璣 9400拿下AI性能榜冠軍,最強NPU引領(lǐng)手機AI應(yīng)用變革

    蘇黎世AI Benchmark榜單冠軍,以稱霸行業(yè)的AI性能,加速智能手機的智能體化進程。 蘇黎世 ETHZ AI Benchmark榜單
    的頭像 發(fā)表于 12-30 20:09 ?706次閱讀
    天璣 9400拿下<b class='flag-5'>AI</b>性能榜<b class='flag-5'>冠軍</b>,最強NPU引領(lǐng)手機<b class='flag-5'>AI</b>應(yīng)用變革

    馬斯克預(yù)言:AI將全面超越人類智力

    近日,科技巨頭馬斯克作出了一個關(guān)于人工智能(AI)的大膽預(yù)測。他斷言,AI的發(fā)展速度將超乎人類的想象,并將在不久的將來全面超越人類的智力。 馬斯克
    的頭像 發(fā)表于 12-28 14:23 ?751次閱讀

    IBM亮相2024年世互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會

    11月 19日至 22日,2024年世互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會在中國浙江烏鎮(zhèn)舉辦。會議期間,“IBM 企業(yè)級數(shù)智化轉(zhuǎn)型解決方案”成功入選“攜手構(gòu)建網(wǎng)絡(luò)空間命運共同體精品案例”(此后簡稱“精品
    的頭像 發(fā)表于 11-20 14:34 ?774次閱讀

    IBM推出高性能AI模型Granite 3.0

    近日舉行的IBM年度TechXchange大會上,IBM正式推出了其最先進的AI模型家族——Granite 3.0。這款旗艦級語言模型代表了IBM
    的頭像 發(fā)表于 10-28 17:39 ?819次閱讀

    IBM發(fā)布Granite 3.0 AI模型家族

    IBM近日舉行的年度TechXchange大會上,正式推出了其迄今為止最先進的AI模型家族——Granite 3.0。這一系列的發(fā)布標志著IBM
    的頭像 發(fā)表于 10-23 17:09 ?770次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項重大合作計劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預(yù)計該服務(wù)將于2025年初正式上線。此次合作標志著兩家公司
    的頭像 發(fā)表于 09-03 15:52 ?662次閱讀

    IBM助力圖靈新智算構(gòu)建全能AI平臺

    近日,圖靈新智算(廣州)科技有限公司(以下簡稱為“圖靈新智算”)宣布采用 IBM 新一代 AI 與數(shù)據(jù)平臺 watsonx 的三大功能組件 watsonx.data、watsonx.ai
    的頭像 發(fā)表于 08-02 14:53 ?1050次閱讀