一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟公司如何應(yīng)對(duì)用戶搜索習(xí)慣的改變?

電子工程師 ? 來源:YXQ ? 2019-05-17 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著互聯(lián)網(wǎng)的普及,搜索成為人們最常用的基本功能之一,但這背后的秘密是什么呢?近日,微軟公司介紹了他們是其如何應(yīng)對(duì)用戶搜索習(xí)慣的改變,并開源了支撐 Bing 搜索背后的算法。

搜索需求的改變

以前的網(wǎng)頁搜索功能十分簡(jiǎn)單,用戶輸入幾個(gè)詞,就會(huì)返回一系列相應(yīng)的結(jié)果頁面。如今,這些用戶可能會(huì)用手機(jī)拍照并將其放入搜索框或使用智能助手來提問,并不需要親自觸摸設(shè)備。他們可能會(huì)直接輸入一個(gè)問題,并期待一個(gè)對(duì)應(yīng)的回復(fù),而不僅僅是給出多個(gè)可能答案的網(wǎng)頁列表。

搜索需求的改變對(duì)于以往基于索引系統(tǒng),依賴關(guān)鍵字匹配給出搜索結(jié)果的傳統(tǒng)搜索引擎是一個(gè)挑戰(zhàn)。

“關(guān)鍵詞搜索算法會(huì)在人們提出問題或拍照并詢問搜索系統(tǒng)'這是什么?' 時(shí)失效”,微軟 Bing 搜索和 AI 團(tuán)隊(duì)的項(xiàng)目經(jīng)理 Rangan Majumder 說到。

當(dāng)然,緊跟用戶的搜索偏好并不是新鮮事,自從網(wǎng)絡(luò)搜索功能出現(xiàn)以來,這一直是一場(chǎng)博弈。但現(xiàn)在,由于人工智能的發(fā)展,包括微軟在人工智能方向取得進(jìn)步,越來越容易滿足這些不斷變化的需求。

“人工智能正在使我們的產(chǎn)品更加符合人的思考習(xí)慣,”Majumder 說, “但在以前人們不得不思考,'當(dāng)我使用計(jì)算機(jī)進(jìn)行搜索時(shí),如何輸入才能得到自己想要的結(jié)果?'”

微軟已經(jīng)制作完成了最先進(jìn)的人工智能工具之一,并已經(jīng)在 GitHub 上開源,它還將通過微軟的 AI 實(shí)驗(yàn)室發(fā)布這些工具的用戶示例技術(shù)和介紹視頻

這種被稱為空間分治樹與圖(Space Partition Tree And Graph, SPTAG)的算法,允許用戶利用深度學(xué)習(xí)模型來在毫秒內(nèi)搜索數(shù)十億條信息(或稱矢量)。反過來,這意味著他們可以更快地向用戶提供更匹配的結(jié)果。

矢量搜索相較于關(guān)鍵字搜索,可以更容易的按照內(nèi)容得到搜索結(jié)果。例如,如果用戶鍵入“巴黎鐵塔有多高?”Bing 可以返回一個(gè)自然語言結(jié)果告訴用戶艾菲爾鐵塔是 1,063 英尺,即使“搜索查詢”中沒有出現(xiàn)“Eiffel”這個(gè)詞,而“tall”這個(gè)詞也不會(huì)出現(xiàn)在結(jié)果中。

微軟將矢量搜索應(yīng)用于 Bing 搜索引擎,該技術(shù)可以幫助 Bing 更好地理解數(shù)十億網(wǎng)絡(luò)搜索背后的意圖,并在數(shù)十億網(wǎng)頁中找到最匹配的結(jié)果。

使用矢量進(jìn)行更好的搜索

矢量的本質(zhì)上是單詞、圖像像素或其他數(shù)據(jù)點(diǎn)的數(shù)字表示,它有助于捕獲某條數(shù)據(jù)實(shí)際的意義。由于深度學(xué)習(xí)技術(shù)的進(jìn)步,微軟認(rèn)為可以開始使用這些向量來理解和表示搜索意圖。一旦將數(shù)據(jù)點(diǎn)分配給某條數(shù)據(jù),就可以排列或映射這些向量,其中排列地靠前的數(shù)字表示相似性。這些近端結(jié)果會(huì)顯示給用戶,從而提升搜索結(jié)果。當(dāng)公司工程師注意到用戶搜索模式有異常趨勢(shì)時(shí),Bing 使用的矢量搜索背后的技術(shù)就會(huì)啟動(dòng)。

“在分析我們的日志時(shí),團(tuán)隊(duì)發(fā)現(xiàn)搜索查詢字符越來越長(zhǎng),”Majumder 說。這表明用戶提出了更多問題,對(duì)于之前的搜索問題進(jìn)行更多解釋,對(duì)關(guān)鍵字搜索的體驗(yàn)不佳,或者在描述抽象事物時(shí)“試圖像計(jì)算機(jī)一樣思考”。這些對(duì)用戶來說都是不自然和不方便的。

通過 Bing 搜索,矢量化工作已經(jīng)擴(kuò)展到搜索引擎中超過 1500 億條數(shù)據(jù),來提升傳統(tǒng)關(guān)鍵字匹配算法的效果,主要包括單個(gè)單詞、字符、網(wǎng)頁代碼段、完整查詢和其他媒體信息。一旦用戶進(jìn)行搜索后,Bing 可以掃描索引向量并提供最佳的匹配結(jié)果。矢量分配使用深度學(xué)習(xí)技術(shù)進(jìn)行訓(xùn)練,然后持續(xù)改進(jìn)。模型會(huì)在搜索后考慮用戶最終點(diǎn)擊的輸入,以便更好地理解搜索的含義。

微軟專家表示,雖然矢量化媒體和搜索數(shù)據(jù)的想法并不新鮮,但最近才有可能在大規(guī)模搜索引擎(如 Bing)上使用它。“Bing 每天會(huì)處理數(shù)十億個(gè)文檔,現(xiàn)在的想法是我們可以將這些條目表示為向量,并在 1000 億個(gè)以上的大規(guī)模索引中進(jìn)行搜索,以便在 5 毫秒內(nèi)找到最匹配結(jié)果?!蔽④?Bing 團(tuán)隊(duì)程序經(jīng)理 Jeffrey Zhu 表示。

為了更直觀的描述這一點(diǎn),Majumder 詳細(xì)解釋道:一堆可以延伸到月球的 1500 億張的名片中,眨眼之間,可在使用了 SPTAG 算法的 Bing 搜索里一個(gè)接一個(gè)地找到 10 張不同的名片。

搜索算法 SPTAG 及項(xiàng)目簡(jiǎn)介

該項(xiàng)目庫假設(shè)使用向量來表示樣本,并且可以使用 L2 距離或余弦距離來比較向量。為查詢返回的向量是與查詢向量具有最小 L2 距離或余弦距離的向量。

SPTAG 提供兩種方法:kd-tree 和相關(guān)鄰域圖(SPTAG-KDT)與平衡 k-means 樹和相關(guān)鄰域圖(SPTAG-BKT)。 SPTAG-KDT 在索引構(gòu)建成本上更便宜,而 SPTAG-BKT 在高維數(shù)據(jù)中的搜索精度方面更好。

算法流程

SPTAG 的靈感來自 NGS 方法[WangL12]。 它包含兩個(gè)基本模塊:索引構(gòu)建器和搜索器。 RNG 建立在 k 近鄰圖[WangWZTG12,WangWJLZZH14]上,用于提高連接度。平衡的 k 均值樹是用于替換 kd 樹,以避免在高維向量中,kd 樹對(duì)距離估計(jì)不準(zhǔn)確帶來的束縛。搜索首先在空間分治樹中搜索,以找到可以在 RNG 中開始搜索的若干種子數(shù),然后迭代地在樹和圖中進(jìn)行搜索。

強(qiáng)調(diào)

最新更新:支持在線矢量刪除和插入

分布式服務(wù):在多臺(tái)計(jì)算機(jī)上搜索

構(gòu)建

環(huán)境配置

安裝

它將在代碼目錄中生成一個(gè) Release 文件夾,其中包含所有構(gòu)建目標(biāo)。

它將在構(gòu)建目錄中生成 SPTAGLib.sln。 在 Visual Studio(至少 2015 年版本)中編譯ALL_BUILD 項(xiàng)目將生成一個(gè)包含所有構(gòu)建目標(biāo)的 Release 目錄。

驗(yàn)證

運(yùn)行 Release 文件夾中的 test(或 Test.exe)以驗(yàn)證所有測(cè)試。

未來

將矢量用于視覺、音頻搜索

Bing 團(tuán)隊(duì)表示,他們希望開源產(chǎn)品以用于企業(yè)或面向消費(fèi)者的應(yīng)用程序,從而識(shí)別基于音頻片段的語言或者用于圖像繁多的服務(wù),例如讓人們拍攝鮮花等照片的應(yīng)用程序,然后確定它是什么類型的花。對(duì)于這類應(yīng)用,緩慢或不相關(guān)的搜索體驗(yàn)容易失去用戶。

“甚至需要幾秒鐘的搜索都會(huì)使應(yīng)用程序無法使用,”Majumder 指出。該團(tuán)隊(duì)還希望研究人員和學(xué)者能夠利用它來探索其他領(lǐng)域的搜索突破。“我們才開始在這個(gè)深度上探索矢量搜索的真正可能性”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6685

    瀏覽量

    105718
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11249

    瀏覽量

    106365

原文標(biāo)題:千億級(jí)照片,毫秒間匹配最佳結(jié)果,微軟開源Bing搜索背后的關(guān)鍵算法

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    微軟將投資7億美元增強(qiáng)波蘭網(wǎng)絡(luò)安全

    微軟公司近日宣布,計(jì)劃在波蘭追加7億美元投資,旨在與波蘭軍隊(duì)攜手提升波蘭的網(wǎng)絡(luò)安全水平。
    的頭像 發(fā)表于 02-18 15:13 ?622次閱讀

    微軟遭法國反壟斷機(jī)構(gòu)調(diào)查

    近日,據(jù)彭博社報(bào)道,微軟公司正面臨法國反壟斷機(jī)構(gòu)的深入調(diào)查。此次調(diào)查的核心關(guān)注點(diǎn)在于,微軟是否在向較小競(jìng)爭(zhēng)對(duì)手授權(quán)使用必應(yīng)搜索技術(shù)時(shí),存在故意降低搜索結(jié)果質(zhì)量的行為。 據(jù)知情人士透露,
    的頭像 發(fā)表于 02-12 11:07 ?555次閱讀

    微軟面臨法國反壟斷機(jī)構(gòu)調(diào)查

    據(jù)媒體報(bào)道,微軟目前正在接受法國反壟斷機(jī)構(gòu)的深入調(diào)查。此次調(diào)查的核心關(guān)注點(diǎn)在于,微軟是否在搜索引擎聯(lián)盟市場(chǎng)中濫用其市場(chǎng)支配地位。 知情人士透露,法國監(jiān)管機(jī)構(gòu)正在仔細(xì)評(píng)估微軟的行為,特別
    的頭像 發(fā)表于 02-11 10:57 ?588次閱讀

    微軟Office引入AI助手Copilot并漲價(jià)

    微軟公司近日正式宣布,將在其旗下知名的Office應(yīng)用程序系列中,引入全新的AI助手Copilot。這一革命性的改變意味著,用戶將在Word、Excel、PowerPoint、Outlook以及
    的頭像 發(fā)表于 01-18 11:29 ?965次閱讀

    微軟或已放棄在Windows 11顯示不兼容水印計(jì)劃

    近日,知名科技媒體Windows Latest發(fā)布了一篇博文,引發(fā)了業(yè)界對(duì)微軟Windows 11系統(tǒng)更新策略的廣泛關(guān)注。據(jù)該博文報(bào)道,微軟公司似乎已經(jīng)放棄了在Windows 11系統(tǒng)中顯示不兼容
    的頭像 發(fā)表于 12-25 14:43 ?580次閱讀

    微軟股東投票反對(duì)配置比特幣

    比特幣的大漲似乎吸引了很多眼球,似乎連微軟也不例外,NCPPR曾提議微軟公司用1%到5%的利潤(rùn)購買比特幣,投資獲得的收益可以對(duì)沖通脹。但是微軟還是相對(duì)謹(jǐn)慎的拒絕了。 此前微軟董事會(huì)早些
    的頭像 發(fā)表于 12-11 14:30 ?1642次閱讀

    微軟預(yù)覽版Copilot Vision AI功能上線

    微軟公司近日宣布,將面向美國地區(qū)的Copilot Pro用戶推出預(yù)覽版的Copilot Vision AI功能。這一創(chuàng)新功能旨在通過人工智能技術(shù),進(jìn)一步提升用戶的網(wǎng)頁瀏覽體驗(yàn)。 Copilot
    的頭像 發(fā)表于 12-09 14:38 ?633次閱讀

    微軟否認(rèn)使用用戶數(shù)據(jù)訓(xùn)練AI模型

    近日,微軟公司正式否認(rèn)了一項(xiàng)關(guān)于其使用Microsoft 365應(yīng)用程序中客戶數(shù)據(jù)來訓(xùn)練人工智能模型的指控。這一聲明旨在澄清近期在社交媒體上流傳的某些用戶的疑慮和誤解。 此前,部分用戶在社交媒體平臺(tái)
    的頭像 發(fā)表于 12-02 10:33 ?448次閱讀

    微軟高管談AI將如何改變工作方式

    企業(yè)領(lǐng)導(dǎo)者們渴望了解AI將如何改變工作方式,微軟愿意為他們提供所需的幫助。在整個(gè)公司范圍內(nèi),智能 Copilot 副駕駛(國際版)已成為我們提升工作效率、重塑涵蓋客戶服務(wù)至銷售等多個(gè)環(huán)節(jié)的業(yè)務(wù)流程的重要工具。而自主智能體技術(shù)的引
    的頭像 發(fā)表于 11-15 14:00 ?679次閱讀

    微軟Windows 11新版記事本應(yīng)用上線測(cè)試:AI重寫功能亮相

    微軟公司于11月7日正式宣布,針對(duì)Canary和Dev頻道的Windows Insider項(xiàng)目成員,現(xiàn)已開放Windows 11新版記事本應(yīng)用的測(cè)試。此次更新不僅帶來了用戶翹首以盼的AI重寫內(nèi)容功能,還顯著優(yōu)化了應(yīng)用的啟動(dòng)速度,為用戶
    的頭像 發(fā)表于 11-07 15:07 ?896次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評(píng)的ChatGPT平臺(tái)添加了一項(xiàng)全新的搜索功能。 據(jù)悉,這項(xiàng)被命名為“ChatGPT搜索”的新功能,將為用戶帶來前所未有的搜索體驗(yàn)。以
    的頭像 發(fā)表于 11-04 10:34 ?677次閱讀

    微軟終止中國大陸個(gè)人Azure OpenAI服務(wù),為國內(nèi)大模型帶來機(jī)遇

    2024年10月17日,微軟公司宣布將在中國大陸地區(qū)停止面向個(gè)人用戶的Azure OpenAI服務(wù)。這一決定緊隨OpenAI于2024年7月宣布終止對(duì)中國大陸提供API服務(wù)的步伐,為國內(nèi)的人工智能大模型市場(chǎng)騰出了新的發(fā)展空間。
    的頭像 發(fā)表于 10-28 14:17 ?1656次閱讀

    科技看點(diǎn):微軟將審議比特幣投資提案 2024年烏鎮(zhèn)峰會(huì)AI“含量”高

    給大家分享一些科技巨頭的最新消息,比如微軟;還有一些業(yè)界重大科技新聞。 微軟將審議比特幣投資提案 據(jù)外媒報(bào)道微軟公司將在12月10日的年度股東大會(huì)上“評(píng)估投資比特幣”的提案。微軟表示“
    的頭像 發(fā)表于 10-25 16:49 ?2415次閱讀

    微軟推出Windows 11九月更新:增強(qiáng)體驗(yàn),添加多項(xiàng)便捷新功能

    微軟公司于9月26日正式推出了針對(duì)Windows 11系統(tǒng)的最新可選更新KB5043145,此次更新精心設(shè)計(jì)了多項(xiàng)改進(jìn)與創(chuàng)新功能,旨在為用戶帶來更加卓越的操作體驗(yàn)。具體而言,對(duì)于運(yùn)行Windows
    的頭像 發(fā)表于 09-27 15:55 ?1540次閱讀

    微軟計(jì)劃在搜索引擎Bing中引入AI摘要功能

    近期,科技界傳來新動(dòng)向,微軟緊隨百度與谷歌的步伐,宣布計(jì)劃在其搜索引擎Bing中引入先進(jìn)的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗(yàn)。
    的頭像 發(fā)表于 07-26 14:23 ?773次閱讀