一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

換個角度來聊機器翻譯

電子工程師 ? 來源:lq ? 2019-04-24 13:55 ? 次閱讀

公元652年,玄奘在慈恩寺西院建造了大雁塔,用于收藏他從天竺帶回來的657部佛經(jīng)經(jīng)卷,之后的12年里玄奘一直在此翻譯佛經(jīng)。

當巴別塔出現(xiàn)的時候,人類開始有了不同的語言,而大雁塔出現(xiàn)的時候,人類已經(jīng)在不同的語言中開始翻譯。

這周的課程,我們來講一個同學們都比較熟悉的知識點——機器翻譯。

之前咱們AI大學劉俊華導師從“三大核心翻譯技術”的角度,給大家普及了基于規(guī)則的翻譯方法(RMT)、基于統(tǒng)計的翻譯方法(SMT)、基于神經(jīng)網(wǎng)絡的翻譯方法(NMT)的三種翻譯技術的相應原理。

今天我們換個角度來聊機器翻譯,從歷史角度來看看這個比人工智能概念誕生還早的自然語言處理任務。

機器翻譯發(fā)展歷史圖譜

一、從傳說開始的故事

《圣經(jīng)》中記載了這樣一個故事:

人類曾經(jīng)聯(lián)合起來興建能通往天堂的高塔——巴別塔,為了阻止人類的計劃,上帝讓人類說不同的語言,使人類相互之間不能溝通,計劃因此失敗,人類自此各散東西。

實現(xiàn)不同語種之間的無障礙溝通,一直都是人類終極夢想之一。

在認識到不眠不休窮盡人類一生的力量,也只能掌握幾十種語言時,很多科學家開始思考,是不是可以用機器來幫助人們?nèi)ソ鉀Q溝通問題?

這一問題在1933年首次得到了答案,蘇聯(lián)科學家Peter Troyanskii向蘇聯(lián)科學院介紹了能將一種語言翻譯成另一種語言的機器。

這個法明很簡單,在當時并未受到蘇聯(lián)政府的重視,他們覺得這臺擁有各種語言卡片的機器沒有實際作用。

Troyanskii用20多年的時間將這臺翻譯機器發(fā)明出來,后死于心絞痛。

我們今天能如此清晰的復述這段故事,是因為在1956年蘇聯(lián)2位科學家發(fā)現(xiàn)了Troyanskii所創(chuàng)造的翻譯機器,并將它公之于世。

如果不是這樣,或許我們到現(xiàn)在都不會知道,早在1933年就有人想過將語言卡片、打字機、老式膠片組合在一起,發(fā)明一臺翻譯機器。

Troyanskii發(fā)明的翻譯機器簡化圖

二、萌芽于冷戰(zhàn)中的軍備競賽

正像計算機是被戰(zhàn)爭催生出一樣,機器翻譯技術的萌芽也與軍事有關。

1947年杜魯門主義出臺,美蘇冷戰(zhàn)正式開始,對于俄文情報資料的翻譯,需求量很大。

1954年,美國喬治敦大學在IBM公司協(xié)同下用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開了機器翻譯研究的序幕。

當時的系統(tǒng),僅能容納250個單詞,遵循6條語法規(guī)則,翻譯49個句子。

但這一切已足以點燃科學家們的激情,機器翻譯成功引起了蘇聯(lián)、日本和歐洲國家的研究興趣。一時間,各國政府紛紛撥款,全球機器翻譯熱潮興起。

然而,技術的發(fā)展都是曲折艱難的,和這種狂熱的關注相比機器翻譯的研究進展著實緩慢,美國科學院成立了語言自動處理咨詢委員會(ALPAC)于1966年公布了一份名為《語言與機器》的報告,該研究否認機器翻譯可行性,機器翻譯研究進入蕭條期。

雖然這一階段的機器翻譯發(fā)展并不順利,但還是為現(xiàn)代自然語言處理技術打下了堅實的基礎。

三、20世紀末的又一次興起

20世紀70年代IBM沃森實驗室的賈里尼克,他提出了基于統(tǒng)計的語音識別框架,這個框架對語音和語言處理都有著深遠影響,它從根本上使得語音識別有實用的可能。從此,自然語言處理開始走上統(tǒng)計方法之路。

1993年,IBM的Brown等提出基于詞對齊的統(tǒng)計翻譯模型,基于語料庫的方法開始盛行,標志著第二代機器翻譯技術——「基于統(tǒng)計的機器翻譯」開始興起,其核心在于設計概率模型對翻譯過程建模。

統(tǒng)計機器翻譯避開了語言規(guī)則,使用大量的雙語文本,建立兩種語言的平行語料庫,雖然避開了繁雜的語法規(guī)則,但需要大規(guī)模的語料庫,這在當時非常難以實現(xiàn)。

2014年谷歌和蒙特利爾大學提出的第三代機器翻譯技術,也就是基于端到端的神經(jīng)機器翻譯,標志著第三代機器翻譯技術的到來。

2016年月28日,谷歌發(fā)布新的神經(jīng)機器翻譯系統(tǒng)GNMT,同時支持PC端和移動端,這項服務背后的核心算法是基于短語的機器翻譯。

同時期國內(nèi)科技企業(yè)在機器翻譯上的進展也非常迅速,以語音和語義理解見長的科大訊飛在2014年國際口語翻譯大賽IWSLT上獲得中英和英中兩個翻譯方向的全球第一名,在2015年又在由美國國家標準技術研究院組織的機器翻譯大賽中取得全球第一的成績。

自此,神經(jīng)機器翻譯開始大規(guī)模走向應用。

四、重建巴別塔之路

從1993年到2019年,機器翻譯技術發(fā)展了80多年,巴別塔的傳說已經(jīng)成了過去,我們今天重溫機器翻譯的發(fā)展歷史,并不是為了再去修建一座真的「通天塔」,而是想讓同學們更加深刻地了解機器翻譯這門學科。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48477

    瀏覽量

    245193
  • 機器翻譯
    +關注

    關注

    0

    文章

    140

    瀏覽量

    15095
  • 自然語言處理

    關注

    1

    文章

    625

    瀏覽量

    13938

原文標題:A.I.公開課預告 | 機器翻譯的光榮與夢想

文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI助力實時翻譯耳機

    你是否曾經(jīng)因為語言障礙而無法與外國人順暢交流?或者在旅行中因為語言不通而錯過了一些精彩的經(jīng)歷?現(xiàn)在,隨著AI技術的發(fā)展,實時翻譯耳機可以幫你輕松解決這些問題。 1 什么是實時翻譯耳機 實時翻譯耳機
    的頭像 發(fā)表于 01-24 11:14 ?1179次閱讀
    AI助力實時<b class='flag-5'>翻譯</b>耳機

    從市場角度解讀機器人核心關鍵技術

    從講機器人發(fā)展史--機器人技術層面上升到從場景從市場談人工智能機器人核心關鍵技術的階段了。對于人工智能機器人來說,若從技術
    的頭像 發(fā)表于 12-25 15:20 ?664次閱讀
    從市場<b class='flag-5'>角度</b>解讀<b class='flag-5'>機器</b>人核心關鍵技術

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    01. 工具介紹 aicode.llmworld.net 問丫·碼語翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語言之間的翻譯,包括計算機語言到自然語言。 02.
    的頭像 發(fā)表于 12-09 11:11 ?773次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    ASR技術的未來發(fā)展趨勢 ASR系統(tǒng)常見問題及解決方案

    體現(xiàn)在以下幾個方面: 更高的準確率 :隨著深度學習技術的發(fā)展,ASR系統(tǒng)的準確率將不斷提高,尤其是在嘈雜環(huán)境下的表現(xiàn)。 多語言和方言支持 :ASR技術將支持更多的語言和方言,以適應全球化的需求。 實時翻譯 :ASR技術將與機器翻譯技術結合,實現(xiàn)實時語音
    的頭像 發(fā)表于 11-18 15:20 ?2282次閱讀

    谷景科普工字電感換個比原來大的行嗎

    就想更換個比原來的工字電感,希望通過這種方式改善電路的性能。那么,可以直接更換比原來大的嗎?更換更大尺寸的工字電感的確是具有一些優(yōu)勢的,比如大尺寸的工字電感通常
    發(fā)表于 09-16 23:11 ?0次下載

    谷景告訴你工字電感換個比原來大的行嗎

    工字電感作為電子電路的關鍵組件,我們在選擇的時候,它的封裝尺寸對于整個電路系統(tǒng)來說至關重要。在使用中,我們有時候會遇到需要更換工字電感的情況,有的人就想更換個比原來的工字電感,希望通過這種方式改善
    的頭像 發(fā)表于 08-05 10:23 ?494次閱讀

    方向角度傳感器故障怎么解決

    方向角度傳感器是一種用于測量物體相對于某個參考方向的角度的傳感器,廣泛應用于航空、航天、航海、機器人、無人駕駛等領域。當方向角度傳感器出現(xiàn)故障時,可能會影響整個系統(tǒng)的穩(wěn)定性和可靠性。
    的頭像 發(fā)表于 07-22 16:57 ?945次閱讀

    方向角度傳感器壞了有什么影響

    方向角度傳感器是一種用于測量物體方向和角度變化的傳感器,廣泛應用于航空、航天、航海、機器人、汽車、無人機等領域。當方向角度傳感器出現(xiàn)故障時,會對相關設備的正常運行產(chǎn)生嚴重影響。 一、方
    的頭像 發(fā)表于 07-22 16:06 ?793次閱讀

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領域,DeepL再次以其創(chuàng)新實力引領潮流,宣布成功推出新一代面向翻譯與編輯應用的大型語言模型。這一里程碑式的進展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位,更標志著機器翻譯技術向更高質(zhì)量、更智能化方向邁出了堅實的一步。
    的頭像 發(fā)表于 07-19 15:56 ?894次閱讀

    nlp自然語言處理基本概念及關鍵技術

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。NLP技術在機器翻譯、情感分析、語音識別
    的頭像 發(fā)表于 07-09 10:32 ?1099次閱讀

    nlp自然語言處理的應用有哪些

    的應用。以下是一些NLP的主要應用領域,以及它們在各個領域的具體應用。 機器翻譯 機器翻譯是NLP的一個重要應用領域。它利用計算機自動將一種語言的文本翻譯成另一種語言。這在全球化的今天尤為重要,因為它可以幫助人們跨越語言障礙,進
    的頭像 發(fā)表于 07-05 09:55 ?3329次閱讀

    RNN神經(jīng)網(wǎng)絡適用于什么

    領域: 語言模型和文本生成 RNN在自然語言處理(NLP)領域有著廣泛的應用,特別是在語言模型和文本生成方面。RNN可以捕捉到文本中的長距離依賴關系,從而生成更加自然、連貫的文本。例如,RNN可以用于生成新聞文章、小說、詩歌等。 機器翻譯 RNN在機器翻譯領域也取得了顯著
    的頭像 發(fā)表于 07-04 15:04 ?1308次閱讀

    從市場角度簡要解讀“人形機器人”

    從市場角度簡要解讀“人形機器人” 關于機器人,“人形機器人”應該是大家現(xiàn)階段談論較多的話題。正如一些新的客戶或朋友知道我們在做機器人,但也會
    的頭像 發(fā)表于 06-29 16:30 ?1109次閱讀

    從市場角度簡要解讀“人形機器人”

    從市場角度簡要解讀“人形機器人”關于機器人,“人形機器人”應該是大家現(xiàn)階段談論較多的話題。正如一些新的客戶或朋友知道我們在做機器人,但也會進
    的頭像 發(fā)表于 06-29 08:14 ?643次閱讀
    從市場<b class='flag-5'>角度</b>簡要解讀“人形<b class='flag-5'>機器</b>人”

    開源項目!設計一款智能手語翻譯眼鏡

    ,還促進了不同能力者之間的理解和共情。 硬件方面,項目選擇了樹莓派Zero 2 W作為核心計算單元,結合了高性能的攝像頭模塊捕捉精確的手勢動作。軟件方面,通過VIAM平臺集成了智能機器的管理和機器
    發(fā)表于 05-20 15:59