一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

“現(xiàn)代版羅塞塔石碑”,MIT&谷歌大腦用AI破解失傳的古代文字

jmiy_worldofai ? 來源:YXQ ? 2019-07-10 17:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

漫漫塵埃下,掩藏了許多曾經(jīng)輝煌燦爛古代文明,但我們現(xiàn)在卻無法清晰地知道,這些地方究竟發(fā)生了什么。

搞懂這些歷史的最佳方式,就是找到他們的文字記載。However,記載文字的石碑可以被考古學家們挖出來,但這些古文字究竟啥意思,現(xiàn)代的人們看不懂,需要語言學家們耗盡青春來推測。

現(xiàn)在,MIT CSAIL和谷歌大腦的研究者出手了,他們用機器學習破譯了烏加里特文和線性文字B。

△ 烏加里特王宮

烏加里特文,Ugaritic,是一種楔形文字,屬于閃米特語族。從字面上來看,就知道它是一個叫做烏加里特(Ugarit)的文明使用的語言,這個文明位于當今地中海沿岸的敘利亞,在公元前6000年前后就初現(xiàn)蹤跡,在公元前1190年前后滅亡。

△ 烏加里特文

線性文字B,Linear B,由一種人類還沒有破譯出來的線性文字A演化而來,主要存活于公元前1500年到公元前1200年的克里特島和希臘南部,是希臘語的一種古代書寫形式。

△ 線性文字B

研究者們利用同一語族內(nèi)不同語言之間的聯(lián)系,用機器學習的方法來破譯這兩種失傳的語言,這是破譯古代語言的新方法,也將對羅曼語族的語言學研究有巨大的影響和提升。

這個方法讓許多人驚嘆:

簡直是現(xiàn)代版的羅塞塔石碑!

PS,羅塞塔石碑是一塊用3種語言寫了同一個內(nèi)容的石碑,幫助語言學家們讀懂古文字。

希望能先把動物和植物的語言破譯了,可以發(fā)現(xiàn)打開新世界的大門。

人類語言總相通

這項研究的核心方法,是借助人類語言的相似性。

比如,知乎用戶@拉隊短 在介紹歐洲語言相似性的時候,舉了這么個栗子:

句子“那是六月末潮濕陰沉的一個夏日?!?/p>

英語:It was a humid, grey summer day at the end of June.

丹麥語:Det var en fugtig, gr? sommerdag i slutningen af juni.

瑞典語:Det var en fuktig, gr? sommardag i slutet av juni.

挪威語:Det var en fuktig, gr? sommerdag i slutten av juni.

冰島語:Tae var rakur, grár sumardagur í lok júní.

看,長得差不多嘛,畢竟同屬印歐語系日耳曼語族,單詞的分布位置、句子的結(jié)構(gòu)都很相似,如果你能看懂一種語言,就能大致猜測和它“血緣”關系近的另一種語言。

模型訓練

為了破解這兩種文字,研究者們提出了一個基于字符的seq2seq模型。

模型主要包含通用字符嵌入、剩余連接、單調(diào)排列正則化幾個部分。

其中,線性文字B的字母和希臘文需要進行對應。

之后,借助神經(jīng)解密算法,在具有不同語言特征的多種語言中提供強大的性能。

你懂的語言,和你不懂的語言

在算法模型的基礎之下,需要的語料庫除了待破解的烏加里特文和線性文字B,還需要一些現(xiàn)在的人類能看懂的語言。

研究團隊選擇了羅曼語族的數(shù)據(jù)庫,包含意大利語、西班牙語和葡萄牙語三種語言的同源語音轉(zhuǎn)錄,需要對它們進行同源檢測。

因此,數(shù)據(jù)集就用到上面這些,Symbols指的是語言中的字符,Token則是語言學中類似于單詞的存在。

準確率

運行成果還不錯,烏加里特文在無噪聲條件下優(yōu)于現(xiàn)有方法3.1%,在有噪聲條件下優(yōu)于現(xiàn)在的貝葉斯方法5.5%。

而線性文字B,在無噪聲條件下準確率高達84.7%,在更具挑戰(zhàn)性的LinearB名稱數(shù)據(jù)集中達到67.3%的準確度。

在羅曼語族同源識別任務中,西班牙語準確度提升3.4%,葡萄牙語提升1.6%。

線性文字B的祖先,線性文字A還沒有被人類破譯,它被譽為考古界圣杯。

未來,在這項研究起作用的情況下,或許可以像借助羅曼語族三種語言的數(shù)據(jù)庫一樣,直接用機器借助其他已知的人類語言,實現(xiàn)暴力破解。

想破腦殼的語言學家們,可以把工作重心放到別的事情上了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    108091
  • MIT
    MIT
    +關注

    關注

    3

    文章

    254

    瀏覽量

    24410

原文標題:MIT&谷歌大腦用AI破解失傳的古代文字,被稱“現(xiàn)代版羅塞塔石碑”丨ACL 2019

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    德與施瓦茨發(fā)布全新UDS系列數(shù)字萬

    德與施瓦茨(以下簡稱“R&S”)推出全新R&S UDS數(shù)字萬表系列。該緊湊型儀器系列可同步顯示三項測量結(jié)果,配備多樣化測量功能及多種遠程控制接口。產(chǎn)品提供5?位和6
    的頭像 發(fā)表于 07-03 18:18 ?850次閱讀

    怎么labview實現(xiàn)語音轉(zhuǎn)文字

    請問怎么labview實現(xiàn)語音轉(zhuǎn)文字
    發(fā)表于 07-01 16:27

    飛騰軟件支持平臺即將正式上線AI智能大腦

    遇到棘手的技術問題卻無人解答?搜索文檔耗時長?飛騰軟件支持平臺即將正式上線AI智能大腦,讓技術難題實現(xiàn)“秒回應”!
    的頭像 發(fā)表于 06-13 11:37 ?416次閱讀

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    []() 2025年3月19日——Banana Pi 今日正式發(fā)布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步發(fā)布的最新
    發(fā)表于 03-19 17:54

    德與施瓦茨推出CMX500 AI腳本助手

    德與施瓦茨(以下簡稱“R&S”)推出CMX500 AI腳本助手,這是一款革新移動設備測試的全新解決方案。
    的頭像 發(fā)表于 03-05 16:09 ?459次閱讀

    Meta非入侵式腦機技術:AI讀取大腦信號打字準確率80%

    腦機技術主要通過AI模型與特定硬件的結(jié)合,將用戶的大腦信號映射成具體的鍵盤字符。該技術的準確率高達約80%,能夠準確判斷用戶在“敲擊”的按鍵,從而實現(xiàn)文字輸入。 值得注意的是,這項設備完全依靠外部腦機讀取用戶的
    的頭像 發(fā)表于 02-11 15:45 ?655次閱讀

    谷歌Gemini AI目標年底用戶達5億

    近日,谷歌CEO桑達爾·皮查伊在內(nèi)部會議上向員工透露,他對公司自主研發(fā)的Gemini AI技術充滿信心,認為其能力已經(jīng)超越了當前的競爭對手。這一表態(tài)不僅彰顯了谷歌AI領域的雄心壯志,
    的頭像 發(fā)表于 01-18 11:30 ?906次閱讀

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領英頁面上的透露,谷歌
    的頭像 發(fā)表于 01-13 14:40 ?709次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對卷積核優(yōu)化的思考。 GPU的存儲體系采用了獨特的倒金字結(jié)構(gòu),在我看來這是其計算性能的關鍵。大容量寄存器設計破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機制巧妙解決了內(nèi)存帶寬限制。NVIDIA GPU
    發(fā)表于 11-24 17:12

    機場運營商Fraport與德與施瓦茨簽訂合作協(xié)議

    德與施瓦茨(以下簡稱“R&S”)與Fraport合作,對法蘭克福機場的旅客安檢站進行現(xiàn)代化改造,安裝 100 臺新安檢掃描儀。
    的頭像 發(fā)表于 11-22 16:17 ?704次閱讀

    科技先進制程AI賦能中心&校企聯(lián)合實驗室落戶蘇州

    近年來,隨著全球半導體產(chǎn)業(yè)的高速發(fā)展和中國自主研發(fā)技術的不斷突破,國產(chǎn)先進制程技術的自主化進程成為了推動產(chǎn)業(yè)變革的重要課題。喆科技先進制程AI賦能中心的啟動,以及與南京大學的深度合作,正是對這一
    的頭像 發(fā)表于 10-21 14:17 ?580次閱讀
    喆<b class='flag-5'>塔</b>科技先進制程<b class='flag-5'>AI</b>賦能中心&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;校企聯(lián)合實驗室落戶蘇州

    智芯簽約儀式暨喆科技半導體AI創(chuàng)新總部啟動儀式圓滿舉辦

    科技將繼續(xù)秉持“學習、創(chuàng)新、當責、共贏”的企業(yè)文化,加強人才培養(yǎng)與引進,建立一支專業(yè)高效的團隊,為客戶提供最優(yōu)質(zhì)的服務和支持。同時,喆科技期待與更多合作伙伴攜手,共同探索半導體和工業(yè)AI領域的無限可能,為推動“世界光谷”半
    的頭像 發(fā)表于 09-02 11:04 ?429次閱讀
    喆<b class='flag-5'>塔</b>智芯簽約儀式暨喆<b class='flag-5'>塔</b>科技半導體<b class='flag-5'>AI</b>創(chuàng)新總部啟動儀式圓滿舉辦

    pcb板樹脂孔和油墨孔的區(qū)別?

    PCB板樹脂孔和油墨孔的區(qū)別主要體現(xiàn)在以下幾個方面: 1. 飽滿度與質(zhì)量 樹脂孔:樹脂孔工藝通過使用環(huán)氧樹脂填平過孔,并在表面進行磨平和鍍銅處理,以確保孔內(nèi)填充飽滿。這種工藝解
    的頭像 發(fā)表于 08-30 17:13 ?3493次閱讀

    Character.AI創(chuàng)始人加入谷歌,被買斷的股票估值25億美元

    根據(jù)彭博社于8月3日的最新報道顯示,Character.AI人工智能獨角獸公司的創(chuàng)始人和核心研發(fā)人員諾姆·沙澤爾先生(Noam Shazeer)、丹尼爾·德·弗雷斯先生(Daniel De Freitas)及所在科研團隊的部分成員,已于近日正式加入
    的頭像 發(fā)表于 08-03 16:55 ?3356次閱讀

    谷歌推出旗下AI智能體管理項目Project Oscar

    在近日于印度班加爾盛大舉行的2024 I/O Connect開發(fā)者活動上,谷歌公司隆重推出了Project Oscar項目,這一創(chuàng)新舉措標志著開源軟件項目管理領域迎來了AI智能體的全面賦能
    的頭像 發(fā)表于 07-19 16:07 ?961次閱讀