一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google研究人提議對(duì)引擎重新設(shè)計(jì)并用單一大型AI語言模型代替

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-06-01 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1998 年,一些斯坦福大學(xué)的研究生發(fā)表了一篇論文,描述了一種新型的搜索引擎:“在本文中,我們將會(huì)介紹 Google 這種大型搜索引擎的原型。該原型大量使用了超文本形式的結(jié)構(gòu)。Google 旨在有效地對(duì)萬維網(wǎng)數(shù)據(jù)進(jìn)行檢索和編制索引,并生成比現(xiàn)有系統(tǒng)更令人滿意的搜索結(jié)果?!?/p>

該研究的關(guān)鍵創(chuàng)新是一種稱為 PageRank 的算法,該算法通過基于用戶在網(wǎng)絡(luò)上查詢內(nèi)容與網(wǎng)絡(luò)上其他頁(yè)面鏈接的相關(guān)性來計(jì)算搜索結(jié)果,并且對(duì)搜索結(jié)果進(jìn)行排序。在 PageRank 的支持下,Google 成為了通往互聯(lián)網(wǎng)的門戶,而謝爾蓋?布林和拉里?佩奇建立了世界上最大的公司之一。

現(xiàn)在,一組 Google 研究人員發(fā)布了一項(xiàng)提議,要求對(duì)引擎進(jìn)行徹底的重新設(shè)計(jì),從而排除現(xiàn)有排序的方法,并用單一的大型 AI 語言模型(例如 BERT 或 GPT-3,以及它們的未來版本)來代替。

這樣一來,用戶將不再用在龐大的網(wǎng)頁(yè)列表中搜索信息,而是通過對(duì)這些頁(yè)面上經(jīng)過訓(xùn)練的語言模型提出問題來直接尋找答案。

這種方法不但可以改變搜索引擎的工作方式,而且可以改變它們可以做的事情,以及我們?nèi)绾闻c之互動(dòng)的方式。

即使網(wǎng)絡(luò)的規(guī)模激增,搜索引擎也在變得越來越快,且越來越準(zhǔn)確?,F(xiàn)在我們使用 AI 來對(duì)結(jié)果進(jìn)行排序,而 Google 可以通過 BERT 來更好地理解用戶搜索的內(nèi)容。

然而,在這些調(diào)整之下,所有主流搜索引擎的工作方式仍與 20 年前相同:爬蟲將網(wǎng)頁(yè)編入索引(可不間斷地讀取網(wǎng)絡(luò)并維護(hù)找到的所有內(nèi)容的列表的軟件),在與用戶查詢相匹配的結(jié)果索引中收集數(shù)據(jù),然后對(duì)結(jié)果進(jìn)行排序。

唐納德?麥茨勒(Donald Metzler)和他在 Google 研究部的同事寫道:“這種索引檢索然后排序的藍(lán)圖經(jīng)受得住時(shí)間的考驗(yàn),但也很少受到挑戰(zhàn)或被認(rèn)真地重新考慮一下。”

問題就在于,即使是當(dāng)今最好的搜索引擎,它仍然會(huì)以包含所需信息的文檔列表來進(jìn)行響應(yīng),而不是包含信息本身。

搜索引擎也并不擅長(zhǎng)回答需要從多個(gè)來源獲得答案的查詢?nèi)蝿?wù),就像你看病時(shí),醫(yī)生給你一篇需要閱讀的文章列表,而不是直接給你答案一樣。

麥茨勒和他的同事對(duì)能像真人專家那樣工作的搜索引擎十分感興趣,它應(yīng)當(dāng)以自然語言生成答案,并由多個(gè)文檔合成,而且像維基百科的文章一樣,以支持證據(jù)的形式備份其答案。

大型語言模型為這樣的想法奠定了一些基礎(chǔ),GPT-3 在大多數(shù)網(wǎng)絡(luò)和數(shù)百本書上都接受過培訓(xùn),它可以從多種來源中獲取信息,以自然語言回答問題。

現(xiàn)在的問題在于它無法跟蹤這些來源,也無法提供證據(jù)來支持這些答案。我們無法判斷 GPT-3 是在模仿可信賴的信息還是虛假信息,或者只是散播自己的廢話。

麥茨勒和他的同事們稱語言模型為 Dilettantes——“人們以為它懂的很多,但實(shí)際上它的知識(shí)很膚淺?!?/p>

他們聲稱,解決方案是構(gòu)建和培訓(xùn)未來的 BERT 和 GPT-3,以保留其單詞來源的記錄。目前尚無此類模型能夠做到這一點(diǎn),但原則上是可行的,并且朝著這個(gè)方向的早期工作也已被提上日程。

來自英國(guó)謝菲爾德大學(xué)研究網(wǎng)絡(luò)信息檢索的張子琦說,在不同的搜索領(lǐng)域,從響應(yīng)用戶查詢、到總結(jié)文檔、再到結(jié)構(gòu)化信息,已經(jīng)有了數(shù)十年的發(fā)展。

但是,這些技術(shù)都沒有徹底改革過搜索,因?yàn)樗鼈兠總€(gè)都只是解決特定的問題而無法被通用化。他說,這篇論文中提到的令人興奮的事情就是一些大型語言模型能夠同時(shí)完成所有這些操作。

然而,張也指出,語言模型在技術(shù)性或?qū)I(yè)學(xué)科上表現(xiàn)不佳,因?yàn)橛?xùn)練這些語言的文本中很少有這類范例。

他說:“網(wǎng)絡(luò)上關(guān)于電子商務(wù)的數(shù)據(jù)可能比有關(guān)量子力學(xué)的數(shù)據(jù)多數(shù)百倍?!?而且當(dāng)今的語言模型也偏向英語,這會(huì)使網(wǎng)絡(luò)上的非英語部分無法得到充分服務(wù)。

但張還是很喜歡這個(gè)主意,他說:“要是在過去,這么做是不可能的,因?yàn)榇笮驼Z言模型只是最近才興起的。如果成功了,它將改變我們的搜索體驗(yàn)?!?/p>

原文標(biāo)題:GPT-3或宣告新型搜索引擎的誕生:通過語言模型提問即可找到答案

文章出處:【微信公眾號(hào):DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279970
  • 語言
    +關(guān)注

    關(guān)注

    1

    文章

    97

    瀏覽量

    24502
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16093

原文標(biāo)題:GPT-3或宣告新型搜索引擎的誕生:通過語言模型提問即可找到答案

文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新AI
    發(fā)表于 07-16 15:29

    RAKsmart高性能服務(wù)器集群:驅(qū)動(dòng)AI語言模型開發(fā)的算力引擎

    RAKsmart高性能服務(wù)器集群憑借其創(chuàng)新的硬件架構(gòu)與全棧優(yōu)化能力,成為支撐大語言模型開發(fā)的核心算力引擎。下面,AI部落小編帶您了解RAKsmart如何為
    的頭像 發(fā)表于 04-15 09:40 ?245次閱讀

    Google發(fā)布最新AI模型Gemma 3

    Gemma 開放模型系列是 Google 推動(dòng)實(shí)用 AI 技術(shù)普惠大眾的重要基石。上個(gè)月,Gemma 迎來了首個(gè)生日?;赝^去年,其成果斐然:全球下載量突破 1 億,社區(qū)欣欣向榮,衍
    的頭像 發(fā)表于 03-18 09:51 ?852次閱讀

    小白學(xué)大模型:訓(xùn)練大語言模型的深度指南

    在當(dāng)今人工智能飛速發(fā)展的時(shí)代,大型語言模型(LLMs)正以其強(qiáng)大的語言理解和生成能力,改變著我們的生活和工作方式。在最近的項(xiàng)
    的頭像 發(fā)表于 03-03 11:51 ?734次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:訓(xùn)練大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的深度指南

    語言模型的解碼策略與關(guān)鍵優(yōu)化總結(jié)

    本文系統(tǒng)性地闡述了大型語言模型(LargeLanguageModels,LLMs)中的解碼策略技術(shù)原理及其實(shí)踐應(yīng)用。通過深入分析各類解碼算法的工作機(jī)制、性能特征和優(yōu)化方法,為研究者和工
    的頭像 發(fā)表于 02-18 12:00 ?587次閱讀
    大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的解碼策略與關(guān)鍵優(yōu)化總結(jié)

    文詳解視覺語言模型

    視覺語言模型(VLM)是種多模態(tài)、生成式 AI 模型,能夠理解和處理視頻、圖像和文本。
    的頭像 發(fā)表于 02-12 11:13 ?1762次閱讀
    <b class='flag-5'>一</b>文詳解視覺<b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    機(jī)器人大語言模型市場(chǎng)2028年將破千億美元

    近日,根據(jù)TrendForce集邦咨詢的最新研究成果,隨著機(jī)器技術(shù)的不斷進(jìn)步和系統(tǒng)的高度整合,它們有望從傳統(tǒng)的工業(yè)場(chǎng)景逐漸走進(jìn)人們的家庭生活。這
    的頭像 發(fā)表于 01-22 11:02 ?494次閱讀

    什么是AI查詢引擎

    AI 查詢引擎可高效處理、存儲(chǔ)和檢索大量數(shù)據(jù),以增強(qiáng)生成式 AI 模型的輸入。
    的頭像 發(fā)表于 01-10 10:00 ?1474次閱讀

    Google兩款先進(jìn)生成式AI模型登陸Vertex AI平臺(tái)

    新的 AI 模型,包括最先進(jìn)的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日,我們?cè)?Google Cloud 上進(jìn)
    的頭像 發(fā)表于 12-30 09:56 ?622次閱讀

    AI語言模型開發(fā)步驟

    開發(fā)個(gè)高效、準(zhǔn)確的大語言模型個(gè)復(fù)雜且多階段的過程,涉及數(shù)據(jù)收集與預(yù)處理、模型架構(gòu)設(shè)計(jì)、訓(xùn)練與優(yōu)化、評(píng)估與調(diào)試等多個(gè)環(huán)節(jié)。接下來,
    的頭像 發(fā)表于 12-19 11:29 ?899次閱讀

    谷歌發(fā)布“深度研究AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語言
    的頭像 發(fā)表于 12-16 09:35 ?724次閱讀

    NaVILA:加州大學(xué)與英偉達(dá)聯(lián)合發(fā)布新型視覺語言模型

    日前,加州大學(xué)的研究人員攜手英偉達(dá),共同推出了款創(chuàng)新的視覺語言模型——NaVILA。該模型在機(jī)器
    的頭像 發(fā)表于 12-13 10:51 ?686次閱讀

    語言模型開發(fā)框架是什么

    語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫(kù)。下面,AI部落小編為您介紹
    的頭像 發(fā)表于 12-06 10:28 ?527次閱讀

    如何利用大型語言模型驅(qū)動(dòng)的搜索為公司創(chuàng)造價(jià)值

    ,IlanaGolbinBlumenfeld和JacobT.Wilson等三位PwC合伙,在《如何利用大型語言模型驅(qū)動(dòng)的搜索為公司創(chuàng)造價(jià)值》書中,探討
    的頭像 發(fā)表于 10-13 08:07 ?408次閱讀
    如何利用<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>驅(qū)動(dòng)的搜索為公司創(chuàng)造價(jià)值

    2024 年 19 種最佳大型語言模型

    大型語言模型是2023年生成式人工智能熱潮背后的推動(dòng)力。然而,它們已經(jīng)存在了段時(shí)間了。LLM是黑盒AI系統(tǒng),它使用深度學(xué)習(xí)對(duì)超大數(shù)據(jù)集進(jìn)行
    的頭像 發(fā)表于 08-30 12:56 ?991次閱讀
    2024 年 19 種最佳<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>