一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google:將AI 應(yīng)用到語(yǔ)言翻譯上,進(jìn)而彌平語(yǔ)言不通的問(wèn)題

yrlT_lianggezhi ? 2018-01-29 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google 的使命是匯集全球資訊,并且讓所有人都能使用這些資訊,不過(guò)要能理解各式資訊,最困難的就是語(yǔ)言隔閡,因此在東京舉辦#MadeWithAI 亞太區(qū)媒體活動(dòng)請(qǐng)來(lái)了Google 語(yǔ)言研究計(jì)畫總經(jīng)理Linne Ha 來(lái)談?wù)勗趺磳I 應(yīng)用到語(yǔ)言翻譯上,進(jìn)而彌平語(yǔ)言不通的問(wèn)題。

受惠于智慧型手機(jī)的普及,網(wǎng)路人口在最近這幾年高速成長(zhǎng),不過(guò)網(wǎng)路上有接近50% 的內(nèi)容仍是以英文為主,對(duì)于非以英文為母語(yǔ)的人來(lái)說(shuō),想要獲得資料就多了一道門檻,能讓每個(gè)人自在的用自己的原生語(yǔ)言在網(wǎng)路上搜集或提供資料是Google 的目標(biāo),因此在推動(dòng)語(yǔ)言翻譯或發(fā)展上Google 做了非常多的努力。

▲Google語(yǔ)言研究計(jì)畫總經(jīng)理Linne Ha。

推動(dòng)各種語(yǔ)言上網(wǎng),統(tǒng)一碼(Unicode)是重點(diǎn)

不同語(yǔ)言要能在網(wǎng)路上流動(dòng),最重要的就是該語(yǔ)言要能被閱讀,若是出現(xiàn)亂碼或空白文字就容易成為閱讀或理解的障礙,因此Google 長(zhǎng)期和統(tǒng)一碼(Unicode)聯(lián)盟合作,鼓勵(lì)更多國(guó)家利用統(tǒng)一碼的編碼系統(tǒng)上網(wǎng),例如Google 大力鼓勵(lì)緬甸不要再使用非統(tǒng)一碼的字型。

有了統(tǒng)一碼這項(xiàng)文字系統(tǒng)后,電腦文字編碼就有了一套標(biāo)準(zhǔn),下一個(gè)挑戰(zhàn)就是要確保自行能正確地被轉(zhuǎn)為網(wǎng)路或手機(jī)上的文字,去年Google 推出開(kāi)放的Noto 字型,可以支援800 種語(yǔ)言、11 億個(gè)文字,可呈現(xiàn)各式各樣的文字。

但這樣還不夠,雖然文字能呈現(xiàn),但卻不是每個(gè)人都知道如何輸入文字,因此除了Gboard 提供300 多種鍵盤、 97 種手寫系統(tǒng)、語(yǔ)音輸入等方法讓使用者可以依照自己方便的方式來(lái)輸入文字。

在開(kāi)發(fā)手寫系統(tǒng)上,Google 也花了一番心力,由于每個(gè)人的字跡都不同,因此Google 導(dǎo)入人工智慧技術(shù),搜集很多自愿者的手寫范本,讓機(jī)器學(xué)習(xí)來(lái)辨認(rèn)文字和書寫風(fēng)格,進(jìn)而達(dá)到更精確的手寫辨識(shí)。語(yǔ)音輸入方面則是透過(guò)GOOG-411 的服務(wù)來(lái)搜集語(yǔ)音資料,類似我們的查號(hào)臺(tái),當(dāng)有人打電話進(jìn)去問(wèn)問(wèn)題查電話,GOOG-411 就會(huì)幫忙轉(zhuǎn)接,在這樣的過(guò)程中Google 建立了大量的語(yǔ)音資料庫(kù)范本,英文語(yǔ)音搜集還算滿順利的。不過(guò)其他語(yǔ)言就沒(méi)這么容易了,雖然說(shuō)Google 有和專門經(jīng)營(yíng)文字和語(yǔ)音資料庫(kù)的業(yè)者合作,但有些語(yǔ)言本身的資料庫(kù)就較少,例如廣東話,因此Google 又開(kāi)啟了下一階段的任務(wù)。

語(yǔ)音搜尋實(shí)驗(yàn),搜集準(zhǔn)確的語(yǔ)音資料

既然缺乏語(yǔ)音資料,Google 就開(kāi)始想方法來(lái)搜集各種語(yǔ)言的語(yǔ)音訊息,比方說(shuō)2010 年Google 推出了荷蘭語(yǔ)的Word of Mouth 計(jì)畫,提供參與實(shí)驗(yàn)的使用者手機(jī)來(lái)搜集他們和親友間的對(duì)話樣本,進(jìn)而得到準(zhǔn)確的語(yǔ)音資料。

有了語(yǔ)音資料之后下個(gè)問(wèn)題則是口音和俗語(yǔ),關(guān)于這方面的資料目前Google 仍正在努力發(fā)展中,不過(guò)經(jīng)過(guò)過(guò)去這么長(zhǎng)一段時(shí)間的努力,到2012 年之后,語(yǔ)音搜尋已可支援到50 種語(yǔ)言,Google 也導(dǎo)入了深度神經(jīng)網(wǎng)路提升語(yǔ)音辨識(shí)的準(zhǔn)確性,今年則再新增30 多種的語(yǔ)音輸入,甚至包含了非洲兩種主要語(yǔ)言,斯瓦希里語(yǔ)(Swahili)和阿姆哈拉語(yǔ)(Amharic),對(duì)于彌平語(yǔ)言隔閡來(lái)說(shuō),這是一個(gè)重要的里程碑。

怎么將機(jī)器學(xué)習(xí)應(yīng)用在語(yǔ)音服務(wù)上

既然有了機(jī)器學(xué)習(xí)這項(xiàng)技術(shù),也就意味著Google 能透過(guò)演算以及建構(gòu)更有效的模型來(lái)解決語(yǔ)音辨識(shí)問(wèn)題。

Google 這回用了一個(gè)超級(jí)低成本的預(yù)算(2000 美金)來(lái)增加孟加拉語(yǔ)的文字轉(zhuǎn)語(yǔ)音服務(wù),首先先準(zhǔn)備一套麥克風(fēng)、USB 轉(zhuǎn)接器和前置聲音放大器,并建立一組便攜式的錄音工作室「ChitChat」讓實(shí)驗(yàn)者可以錄音。

工具有了,下一步就是找來(lái)15 名孟加拉的Googler,錄制了2000 多個(gè)從維基百科擷取出來(lái)的孟加拉語(yǔ)和英語(yǔ),實(shí)驗(yàn)者每隔30 分鐘至60 分鐘就錄制250 多個(gè)句子,平衡的混音成幾個(gè)不同的聲音后,再交給Google 社群投票看看大家最偏好哪一個(gè)聲音,最終產(chǎn)出的聲學(xué)模型剛好就可以代表平均型的人聲,成功推出了孟加拉語(yǔ)的文字轉(zhuǎn)語(yǔ)音服務(wù)。

除了把更多語(yǔ)言放到網(wǎng)路上,Google 也著手發(fā)展方言領(lǐng)域,像是英文就分成美式英文、英式英文、澳洲英文等等,最近Google 正著手處理新加坡式英語(yǔ),另外,西班牙語(yǔ)、阿拉伯語(yǔ)也是Google 努力的方向。

Google 的中文語(yǔ)音什么時(shí)候會(huì)有更多突破?

至于***人最常用的中文呢?Google 語(yǔ)言研究計(jì)畫總經(jīng)理Linne Ha 不諱言,中文真的是很有挑戰(zhàn)的語(yǔ)言,比方說(shuō)中國(guó)人說(shuō)著中文、寫著簡(jiǎn)體中文,***人說(shuō)也說(shuō)著中文、但寫的是繁體中文,香港人寫的也是繁體中文、不過(guò)說(shuō)的是廣東話,繁體中文、簡(jiǎn)體中文、廣東話間各有連結(jié)但又不盡相似。

過(guò)去Google 是使用「單一語(yǔ)言模式」來(lái)處理,比方說(shuō)***人說(shuō)的中文就套用繁體中文資料庫(kù),香港人說(shuō)廣東話則套用另外一個(gè)繁體中文資料庫(kù),但這樣的語(yǔ)音辨識(shí)效果發(fā)展有限,近期Google 嘗試著將相近的語(yǔ)言加進(jìn)同一個(gè)模型中,目前的實(shí)驗(yàn)結(jié)果還不錯(cuò)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1789

    瀏覽量

    59047
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279999
  • 語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    97

    瀏覽量

    24503

原文標(biāo)題:【Google 談人工智慧】有了機(jī)器學(xué)習(xí)后,語(yǔ)言還會(huì)是隔閡嗎

文章出處:【微信號(hào):lianggezhizi,微信公眾號(hào):兩個(gè)質(zhì)子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    CC-Link IE 轉(zhuǎn) Modbus TCP,閥門通訊的“雙語(yǔ)翻譯官”

    在工業(yè)自動(dòng)化現(xiàn)場(chǎng),設(shè)備間的“語(yǔ)言不通”是工程師們時(shí)常遇到的挑戰(zhàn)。例如,一套先進(jìn)的控制系統(tǒng)可能采用高速的 CC-Link IE 網(wǎng)絡(luò),而現(xiàn)場(chǎng)大量的閥門、儀表卻只支持經(jīng)典的 Modbus TCP 協(xié)議
    的頭像 發(fā)表于 07-09 09:46 ?128次閱讀

    【教程】使用NS1串口服務(wù)器對(duì)接智普清言免費(fèi)AI語(yǔ)言模型

    AI語(yǔ)言模型可以幫助我們解決各種問(wèn)題,如翻譯、寫文案、創(chuàng)作詩(shī)歌、解決數(shù)學(xué)問(wèn)題、情感陪伴等等。今天教大家如何使用NS1串口服務(wù)器模塊實(shí)現(xiàn)對(duì)接智普清言AI
    的頭像 發(fā)表于 06-12 19:33 ?222次閱讀
    【教程】使用NS1串口服務(wù)器對(duì)接智普清言免費(fèi)<b class='flag-5'>AI</b>大<b class='flag-5'>語(yǔ)言</b>模型

    TDE工業(yè)網(wǎng)關(guān):智能制造時(shí)代的“數(shù)據(jù)翻譯官”

    在工業(yè)4.0時(shí)代,工廠里的傳感器、PLC、機(jī)器人等設(shè)備每分每秒都在產(chǎn)生海量數(shù)據(jù)。然而,這些設(shè)備往往“語(yǔ)言不通”——不同的通信協(xié)議、接口標(biāo)準(zhǔn)讓數(shù)據(jù)孤島問(wèn)題突出。如何讓這些數(shù)據(jù)高效流動(dòng),并轉(zhuǎn)化為生產(chǎn)決策?答案就是天拓四方TDE工業(yè)網(wǎng)關(guān)。
    的頭像 發(fā)表于 03-20 16:12 ?393次閱讀

    語(yǔ)言康復(fù)行業(yè)首家!陽(yáng)光語(yǔ)言正式接入DeepSeek

    2025年3月5日,陽(yáng)光語(yǔ)言上線全國(guó)首個(gè)部署DeepSeek的語(yǔ)言康復(fù)專用AI問(wèn)答系統(tǒng),該系統(tǒng)在陽(yáng)光語(yǔ)言官方微信公眾號(hào)和小程序?qū)ν饷赓M(fèi)開(kāi)放。作為一家發(fā)展幾十年的老牌機(jī)構(gòu),此番引入最新的
    的頭像 發(fā)表于 03-06 14:14 ?340次閱讀
    <b class='flag-5'>語(yǔ)言</b>康復(fù)行業(yè)首家!陽(yáng)光<b class='flag-5'>語(yǔ)言</b>正式接入DeepSeek

    Meta與UNESCO合作推動(dòng)多語(yǔ)言AI發(fā)展

    在數(shù)字環(huán)境中常被忽視的少數(shù)民族語(yǔ)言。 據(jù)Meta介紹,這項(xiàng)計(jì)劃積極尋求合作伙伴的加入,共同提供豐富的語(yǔ)言資源。合作伙伴需要貢獻(xiàn)超過(guò)10小時(shí)的語(yǔ)音錄音及其對(duì)應(yīng)的轉(zhuǎn)錄內(nèi)容,同時(shí)還需要提供豐富的書面文本以及
    的頭像 發(fā)表于 02-08 11:04 ?621次閱讀

    AI助力實(shí)時(shí)翻譯耳機(jī)

    你是否曾經(jīng)因?yàn)?b class='flag-5'>語(yǔ)言障礙而無(wú)法與外國(guó)人順暢交流?或者在旅行中因?yàn)?b class='flag-5'>語(yǔ)言不通而錯(cuò)過(guò)了一些精彩的經(jīng)歷?現(xiàn)在,隨著AI技術(shù)的發(fā)展,實(shí)時(shí)翻譯耳機(jī)可以幫你輕松解決這些問(wèn)題。 1 什么是實(shí)時(shí)
    的頭像 發(fā)表于 01-24 11:14 ?1677次閱讀
    <b class='flag-5'>AI</b>助力實(shí)時(shí)<b class='flag-5'>翻譯</b>耳機(jī)

    Auracast廣播音頻創(chuàng)新實(shí)時(shí)語(yǔ)言翻譯解決方案

    世界正朝著互聯(lián)化方向發(fā)展,但語(yǔ)言障礙仍然為全球溝通和文化交流帶來(lái)挑戰(zhàn)。作為藍(lán)牙技術(shù)聯(lián)盟的長(zhǎng)期推廣公司,東芝(Toshiba)研發(fā)出AI同聲傳譯與Auracast廣播音頻技術(shù)相結(jié)合的創(chuàng)新解決方案,為打破公共場(chǎng)所和教育環(huán)境中的
    的頭像 發(fā)表于 01-13 14:39 ?857次閱讀

    語(yǔ)言模型管理的作用

    要充分發(fā)揮語(yǔ)言模型的潛力,有效的語(yǔ)言模型管理非常重要。以下,是對(duì)語(yǔ)言模型管理作用的分析,由AI部落小編整理。
    的頭像 發(fā)表于 01-02 11:06 ?388次閱讀

    AI語(yǔ)言模型開(kāi)發(fā)步驟

    開(kāi)發(fā)一個(gè)高效、準(zhǔn)確的大語(yǔ)言模型是一個(gè)復(fù)雜且多階段的過(guò)程,涉及數(shù)據(jù)收集與預(yù)處理、模型架構(gòu)設(shè)計(jì)、訓(xùn)練與優(yōu)化、評(píng)估與調(diào)試等多個(gè)環(huán)節(jié)。接下來(lái),AI部落小編為大家詳細(xì)闡述AI語(yǔ)言模型的開(kāi)發(fā)步驟
    的頭像 發(fā)表于 12-19 11:29 ?899次閱讀

    LLMWorld上線代碼翻譯新工具——問(wèn)丫·碼語(yǔ)翻譯俠,快來(lái)體驗(yàn)!

    01. 工具介紹 aicode.llmworld.net 問(wèn)丫·碼語(yǔ)翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語(yǔ)言之間的翻譯,包括計(jì)算機(jī)
    的頭像 發(fā)表于 12-09 11:11 ?1006次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問(wèn)丫·碼語(yǔ)<b class='flag-5'>翻譯</b>俠,快來(lái)體驗(yàn)!

    語(yǔ)言模型開(kāi)發(fā)語(yǔ)言是什么

    在人工智能領(lǐng)域,大語(yǔ)言模型(Large Language Models, LLMs)背后,離不開(kāi)高效的開(kāi)發(fā)語(yǔ)言和工具的支持。下面,AI部落小編為您介紹大語(yǔ)言模型開(kāi)發(fā)所依賴的主要編程
    的頭像 發(fā)表于 12-04 11:44 ?702次閱讀

    一文理解多模態(tài)大語(yǔ)言模型——

    /understanding-multimodal-llms 在過(guò)去幾個(gè)月中, OpenVINO? 架構(gòu)師 Yury閱讀了眾多有關(guān)多模態(tài)大語(yǔ)言模型的論文和博客,在此基礎(chǔ),推薦了一篇解讀多模態(tài)大語(yǔ)言模型的最佳文章《Underst
    的頭像 發(fā)表于 12-02 18:29 ?1187次閱讀
    一文理解多模態(tài)大<b class='flag-5'>語(yǔ)言</b>模型——<b class='flag-5'>上</b>

    IMAX攜手Camb.AI實(shí)現(xiàn)影院實(shí)時(shí)語(yǔ)言翻譯

    近日,據(jù)外媒最新報(bào)道,國(guó)際知名影院品牌IMAX與總部位于迪拜的人工智能初創(chuàng)公司Camb.AI宣布達(dá)成戰(zhàn)略合作,旨在為全球影院觀眾帶來(lái)前所未有的實(shí)時(shí)語(yǔ)言翻譯體驗(yàn)。 此次合作的核心目標(biāo)是
    的頭像 發(fā)表于 11-26 13:55 ?856次閱讀

    在設(shè)備利用AI Edge Torch生成式API部署自定義大語(yǔ)言模型

    ,從而無(wú)縫地新的設(shè)備端生成式 AI 模型部署到邊緣設(shè)備。本文是 Google AI Edge 博客連載的第二篇。
    的頭像 發(fā)表于 11-14 10:23 ?1141次閱讀
    在設(shè)備<b class='flag-5'>上</b>利用<b class='flag-5'>AI</b> Edge Torch生成式API部署自定義大<b class='flag-5'>語(yǔ)言</b>模型

    DeepL推出新一代翻譯編輯大型語(yǔ)言模型

    在人工智能與語(yǔ)言處理領(lǐng)域,DeepL再次以其創(chuàng)新實(shí)力引領(lǐng)潮流,宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語(yǔ)言模型。這一里程碑式的進(jìn)展,不僅鞏固了DeepL作為頂尖語(yǔ)言人工智能公司的地位
    的頭像 發(fā)表于 07-19 15:56 ?1016次閱讀