一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

搜索引擎的起源之科學(xué)史話克倫·施拜克·瓊斯對網(wǎng)絡(luò)搜索的貢獻(xiàn)

工程師 ? 來源:綜合自科技日報 ? 作者:綜合自科技日報 ? 2020-11-20 15:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科學(xué)史話 克倫·施拜克·瓊斯: 每次網(wǎng)絡(luò)搜索背后 都離不開她的貢獻(xiàn)

克倫·施拜克·瓊斯(Karen Sp?rck Jones)1935年8月26日生于英國哈德斯菲爾德市,一個紡織業(yè)較發(fā)達(dá)的城市。在她小時候,她的父親在大學(xué)里擔(dān)任化學(xué)講師,晚上還要打工掙錢;母親是挪威人,曾去倫敦為挪威流亡政府工作。由于父母都顧不上照看她,便將她托付給鄉(xiāng)間的一戶人家。在這樣的生長環(huán)境中,瓊斯從小便鍛煉出了一定的獨立性。

從11歲到18歲這7年間,瓊斯就讀于一所高水平的文法女校,12歲時,她發(fā)愿要上劍橋大學(xué),后終于如愿以償。

1956年,她在劍橋大學(xué)獲得歷史學(xué)專業(yè)的文學(xué)學(xué)士學(xué)位。由于對哲學(xué)的興趣,瓊斯又繼續(xù)讀了一年哲學(xué)。1957年,她加入了劍橋語言研究所,開始接觸計算機(jī)在語言研究方面的應(yīng)用。在此工作期間,她認(rèn)識了Roger Needham(1935—2003,計算機(jī)科學(xué)家,英國皇家學(xué)會會員),兩人于1958年結(jié)婚。1964年,她在劍橋大學(xué)獲得哲學(xué)博士學(xué)位,但博士論文導(dǎo)師對她的幫助不大,她基本上是獨立打拼,編程也是自學(xué)的。1968年,瓊斯成為劍橋大學(xué)計算機(jī)實驗室的全職工作人員,從此以后她在這里耕耘了近50載,一直從事計算語言學(xué)和信息檢索研究。

她在計算語言學(xué)和信息檢索兩個領(lǐng)域都作出了杰出貢獻(xiàn)。在信息檢索方面,早在1958年,她就與人合著了相關(guān)文章。她的最重要貢獻(xiàn)當(dāng)數(shù)1972年提出的逆文本頻率指數(shù)(IDF)的概念。這個概念的意思是:如果詞w在一篇文檔d中出現(xiàn)的頻率高,并且在其他文檔中很少出現(xiàn),則可以認(rèn)為詞w具有很好的區(qū)分能力,可以把文章d和其他文章較好地區(qū)分開來。IDF是互聯(lián)網(wǎng)搜索引擎普遍采用的思路??梢哉f,沒有瓊斯的早年貢獻(xiàn),就沒有谷歌搜索引擎日后的成就。

在計算語言學(xué)方面,她1963年完成的博士論文至今仍有價值。該文將統(tǒng)計進(jìn)路(或曰機(jī)器學(xué)習(xí)進(jìn)路)與已有資源(做在穿孔卡片上的敘詞表)結(jié)合起來,取得了領(lǐng)先于時代的成果。此外,她在計算機(jī)自動摘要、結(jié)構(gòu)化數(shù)據(jù)庫的界面、對話、語義學(xué)等多個主題上均有所建樹。

除了本人的學(xué)術(shù)研究外,她還通過學(xué)術(shù)社團(tuán)的活動大大推進(jìn)了本領(lǐng)域的進(jìn)步。尤其是1994年她擔(dān)任計算語言學(xué)學(xué)會(ACL)會長期間。計算語言學(xué)學(xué)會是國際性的社團(tuán),當(dāng)時多數(shù)會員是美國學(xué)者,她接手學(xué)會時,學(xué)會的財務(wù)狀況不佳,原來的司庫又去世了,一時半會兒招聘不到新的司庫,在這種情況下,瓊斯又要統(tǒng)籌安排學(xué)會的學(xué)術(shù)活動,又要管賬,忙得一塌糊涂。那一陣子是ACL苦痛掙扎的過渡期,在她的有力領(lǐng)導(dǎo)下,ACL走出了困境。除了ACL外,她還是另外好幾個學(xué)會的會士。2000—2002年期間,她擔(dān)任過英國科學(xué)院副院長。在英國有兩所科學(xué)院:英國皇家學(xué)會相當(dāng)于自然科學(xué)領(lǐng)域的科學(xué)院,而英國科學(xué)院是人文社會科學(xué)領(lǐng)域的科學(xué)院。由于語言學(xué)這個大類屬于人文學(xué)科,瓊斯就憑借其在計算語言學(xué)的成就當(dāng)選為英國科學(xué)院的院士。

瓊斯共獲得過7個重要獎項,包括2004年獲得的“計算語言學(xué)學(xué)會終生成就獎”和2007年獲得的“英國計算機(jī)學(xué)會勒芙蕾絲獎?wù)隆保ò⑦_(dá)。勒芙蕾絲是英國大詩人拜倫的女兒,計算機(jī)程序的創(chuàng)始人)。

她2002年辦理了退休手續(xù),但繼續(xù)在實驗室工作。直到2007年4月4日去世前不久,實驗室里仍有她的身影。

2001年4月10日,電氣電子工程師學(xué)會(IEEE)歷史研究中心的Janet Abbate女士采訪了瓊斯。在接受采訪時她說:“人人都在談職業(yè)生涯之類的東西。從某種意義上說,我做到了一路向前走,但其實那時并沒有明顯的路徑。你得利用一切存在著的機(jī)會。早年的時候,對于女性,即使是在劍橋,工作機(jī)會也是極其有限的。看看現(xiàn)在的年輕女性,我是十分羨慕。現(xiàn)在沒有多少女性擁有‘我能行’的心態(tài),但她們其實擁有實現(xiàn)‘我能行’的機(jī)會,而我們那時根本就沒有這樣的機(jī)會?!?/p>

希望我們中國的職業(yè)女性以瓊斯為榜樣,抓住機(jī)會,奮力前行。

(克倫·施拜克·瓊斯 圖片來源:劍橋大學(xué)網(wǎng)站)

概述搜索引擎的起源

1.搜索引擎的起源

1990年,加拿大麥吉爾大學(xué)(University ofMcGill)計算機(jī)學(xué)院的師生開發(fā)出Archie。當(dāng)時,萬維網(wǎng)(World Wide Web)還沒有出現(xiàn),人們通過FTP來共享交流資源。Archie能定期搜集并分析FTP服務(wù)器上的文件名信息,提供查找分別在各個FTP主機(jī)中的文件。用戶必須輸入精確的文件名進(jìn)行搜索,Archie告訴用戶哪個FTP服務(wù)器能下載該文件。雖然Archie搜集的信息資源不是網(wǎng)頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務(wù)。所以,Archie被公認(rèn)為現(xiàn)代搜索引擎的鼻祖。

2.搜索引擎的發(fā)展

第一階段

Excite的歷史可以上溯到1993年2月,6個Stanford University(斯坦福大學(xué))大學(xué)生的想法是分析字詞關(guān)系,以對互聯(lián)網(wǎng)上的大量信息作更有效的檢索。到1993年中,這已是一個完全投資項目,他們還發(fā)布了一個供webmasters在自己網(wǎng)站上使用的搜索軟件版本,后來被叫做Excite for Web Servers。注:Excite后來曾以概念搜索聞名,2002年5月,被Infospace收購的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile

第二階段

1994年4月,斯坦福大學(xué)的兩名博士生,美籍華人楊致遠(yuǎn)和David Filo共同創(chuàng)辦了Yahoo!。隨著訪問量和收錄鏈接數(shù)的增長,Yahoo目錄開始支持簡單的數(shù)據(jù)庫搜索。因為Yahoo!的數(shù)據(jù)是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。Yahoo!中收錄的網(wǎng)站,因為都附有簡介信息,所以搜索效率明顯提高。注:Yahoo以后陸續(xù)有 Altavista、Inktomi、Google提供搜索引擎服務(wù)Yahoo?。瓗缀醭蔀?0世紀(jì)90年代的因特網(wǎng)的代名詞。

第三階段

1995年,一種新的搜索引擎形式出現(xiàn)了——元搜索引擎(Meta Search Engine)。用戶只需提交一次搜索請求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個預(yù)先選定的獨立搜索引擎,并將從各獨立搜索引擎返回的所有查詢結(jié)果,集中起來處理后再返回給用戶。第一個元搜索引擎,是Washington大學(xué)碩士生 Eric Selberg 和 Oren Etzioni的 Metacrawler。元搜索引擎概念上非常好聽,但搜索效果始終不理想,所以沒有哪個元搜索引擎有過強(qiáng)勢地位。

第四階段

智能檢索的產(chǎn)生:它利用分詞詞典、同義詞典,同音詞典改善檢索效果,進(jìn)一步還可在知識層面或者說概念層面上輔助查詢,通過主題詞典、上下位詞典、相關(guān)同級詞典檢索處理形成一個知識體系或概念網(wǎng)絡(luò),給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果。?

綜合自科技日報 ; 參考資料: 《網(wǎng)絡(luò)營銷》 楊路明等編著 機(jī)械工業(yè)出版社

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7662

    瀏覽量

    90768
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7814

    瀏覽量

    90926
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8502

    瀏覽量

    134592
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微軟面臨法國反壟斷機(jī)構(gòu)調(diào)查

    據(jù)媒體報道,微軟目前正在接受法國反壟斷機(jī)構(gòu)的深入調(diào)查。此次調(diào)查的核心關(guān)注點在于,微軟是否在搜索引擎聯(lián)盟市場中濫用其市場支配地位。 知情人士透露,法國監(jiān)管機(jī)構(gòu)正在仔細(xì)評估微軟的行為,特別是其是否向那些
    的頭像 發(fā)表于 02-11 10:57 ?589次閱讀

    OpenAI免費開放ChatGPT搜索功能

    近日,OpenAI宣布了一項重大決策:向所有用戶免費開放ChatGPT搜索功能。這一舉措無疑將為用戶帶來更加高效、智能的搜索體驗。 與谷歌等傳統(tǒng)搜索引擎的收錄模式相比,ChatGPT搜索
    的頭像 發(fā)表于 02-06 14:35 ?502次閱讀

    javascript:void(0) 是否影響SEO優(yōu)化

    使用 javascript:void(0) 確實可能對SEO優(yōu)化產(chǎn)生負(fù)面影響 。以下是關(guān)于 javascript:void(0) 對SEO影響的具體分析: 搜索引擎爬蟲的理解問題 搜索引擎爬蟲(如
    的頭像 發(fā)表于 12-31 16:08 ?559次閱讀

    HTTP 協(xié)議對于SEO優(yōu)化的影響

    搜索引擎優(yōu)化(SEO)是提高網(wǎng)站在搜索引擎中的可見性和排名的過程。HTTP協(xié)議作為互聯(lián)網(wǎng)通信的基礎(chǔ),對SEO有著深遠(yuǎn)的影響。 1. HTTP狀態(tài)碼 HTTP狀態(tài)碼是服務(wù)器響應(yīng)客戶端請求的結(jié)果。這些
    的頭像 發(fā)表于 12-30 09:29 ?600次閱讀

    蘋果為谷歌支付數(shù)十億美元辯護(hù),參與搜索案反壟斷審判

    近日,蘋果公司已正式要求參與谷歌即將在美國舉行的在線搜索反壟斷審判,此舉旨在為其與谷歌之間的收入分成協(xié)議進(jìn)行辯護(hù)。該協(xié)議使得谷歌成為Safari瀏覽器的默認(rèn)搜索引擎,而谷歌每年因此向蘋果支付數(shù)十
    的頭像 發(fā)表于 12-26 10:41 ?502次閱讀

    SSR的優(yōu)勢和劣勢分析

    SSR(Server-Side Rendering,服務(wù)器端渲染)的優(yōu)勢和劣勢分析如下: SSR的優(yōu)勢 SEO友好 : 由于搜索引擎爬蟲的性質(zhì),更容易識別和抓取服務(wù)端渲染的頁面內(nèi)容,因此提升了網(wǎng)站
    的頭像 發(fā)表于 11-18 11:27 ?1754次閱讀

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?1208次閱讀

    阿里國際推出B2B領(lǐng)域AI搜索引擎Accio

    近日,阿里國際宣布正式進(jìn)軍AI搜索領(lǐng)域,并面向全球商家推出了首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品的推出,標(biāo)志著阿里國際在電子商務(wù)和人工智能技術(shù)結(jié)合方面邁出了重要一步。 Accio
    的頭像 發(fā)表于 11-14 11:47 ?891次閱讀

    租用多ip云服務(wù)器可以帶來哪些好處?應(yīng)用場景有哪些?

    。 2、避免共享ip風(fēng)險: 在共享ip環(huán)境中,如果同一IP下的其他網(wǎng)站受到攻擊或被搜索引擎懲罰,可能會影響你的網(wǎng)站。使用獨立的ip地址可以降低這種風(fēng)險。 3、提高安全性: 獨立的ip地址可以減少遭受DDoS攻擊和其他網(wǎng)絡(luò)攻擊的風(fēng)險,因為攻擊者更難將
    的頭像 發(fā)表于 11-04 11:33 ?487次閱讀

    OpenAI推出ChatGPT搜索功能

    查找網(wǎng)絡(luò)信息時,往往需要通過傳統(tǒng)的搜索引擎進(jìn)行檢索,然后從中篩選出有價值的內(nèi)容。而現(xiàn)在,有了ChatGPT搜索,用戶可以更加便捷地獲取所需信息。 OpenAI表示,ChatGPT搜索
    的頭像 發(fā)表于 11-04 10:34 ?677次閱讀

    Meta開發(fā)新搜索引擎,減少對谷歌和必應(yīng)的依賴

    近日,Meta正在積極進(jìn)軍人工智能領(lǐng)域,并試圖跟上OpenAI的發(fā)展步伐。為實現(xiàn)這一目標(biāo),Meta正在開發(fā)一款全新的搜索引擎,該搜索引擎具備網(wǎng)絡(luò)爬蟲功能,能夠為用戶提供有關(guān)時事的對話答案,而這些答案
    的頭像 發(fā)表于 10-29 11:49 ?798次閱讀

    月訪問量超2億,增速113%!360AI搜索成為全球增速最快的AI搜索引擎

    與傳統(tǒng)搜索引擎不同,作為AI原生搜索引擎的360AI搜索基于公開網(wǎng)絡(luò)、知識庫、大模型三大支柱。借助首創(chuàng)的 CoE 技術(shù)架構(gòu),360AI搜索
    的頭像 發(fā)表于 09-09 13:44 ?872次閱讀
    月訪問量超2億,增速113%!360AI<b class='flag-5'>搜索</b>成為全球增速最快的AI<b class='flag-5'>搜索引擎</b>

    恒訊科技分析:香港站群服務(wù)器為什么要做偽靜態(tài)處理呢?

    提高搜索引擎優(yōu)化(SEO)效果:偽靜態(tài)處理可以使得動態(tài)網(wǎng)頁URL看起來像是靜態(tài)網(wǎng)頁的URL,這有助于搜索引擎更好地索引網(wǎng)站內(nèi)容。搜索引擎通常偏好靜態(tài)網(wǎng)頁,因為它們認(rèn)為靜態(tài)網(wǎng)頁更穩(wěn)定、內(nèi)
    的頭像 發(fā)表于 07-31 12:49 ?521次閱讀

    OpenAI推出SearchGPT原型,正式向Google搜索引擎發(fā)起挑戰(zhàn)

    在人工智能領(lǐng)域的持續(xù)探索中,OpenAI 邁出了重大一步,發(fā)布了其最新的 SearchGPT 原型,直接瞄準(zhǔn)了 Google 的核心業(yè)務(wù)——搜索引擎。這一舉動不僅標(biāo)志著 OpenAI 在技術(shù)上的又一次飛躍,也預(yù)示著搜索引擎市場即將迎來一場前所未有的變革。
    的頭像 發(fā)表于 07-26 15:11 ?820次閱讀

    微軟計劃在搜索引擎Bing中引入AI摘要功能

    近期,科技界傳來新動向,微軟緊隨百度與谷歌的步伐,宣布計劃在其搜索引擎Bing中引入先進(jìn)的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗。
    的頭像 發(fā)表于 07-26 14:23 ?775次閱讀