一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于機(jī)器翻譯增加的跨語(yǔ)言機(jī)器閱讀理解算法

OSC開(kāi)源社區(qū) ? 來(lái)源:OSCHINA 社區(qū) ? 2023-12-12 10:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:阿里云云棲號(hào)

鏈接:https://my.oschina.net/yunqi/blog/10319964

近日,阿里云人工智能平臺(tái) PAI 與華南理工大學(xué)朱金輝教授團(tuán)隊(duì)、達(dá)摩院自然語(yǔ)言處理團(tuán)隊(duì)合作在自然語(yǔ)言處理頂級(jí)會(huì)議 EMNLP2023 上發(fā)表基于機(jī)器翻譯增加的跨語(yǔ)言機(jī)器閱讀理解算法 X-STA。通過(guò)利用一個(gè)注意力機(jī)制的教師來(lái)將源語(yǔ)言的答案轉(zhuǎn)移到目標(biāo)語(yǔ)言的答案輸出空間,從而進(jìn)行深度級(jí)別的輔助以增強(qiáng)跨語(yǔ)言傳輸能力。同時(shí),提出了一種改進(jìn)的交叉注意力塊,稱為梯度解纏知識(shí)共享技術(shù)。此外,通過(guò)多個(gè)層次學(xué)習(xí)語(yǔ)義對(duì)齊,并利用教師指導(dǎo)來(lái)校準(zhǔn)模型輸出,增強(qiáng)跨語(yǔ)言傳輸性能。實(shí)驗(yàn)結(jié)果顯示,我們的方法在三個(gè)多語(yǔ)言 MRC 數(shù)據(jù)集上表現(xiàn)出色,優(yōu)于現(xiàn)有的最先進(jìn)方法。

背景

大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的廣泛應(yīng)用,促進(jìn)了 NLP 各個(gè)下游任務(wù)準(zhǔn)確度大幅提升,然而,傳統(tǒng)的自然語(yǔ)言理解任務(wù)通常需要大量的標(biāo)注數(shù)據(jù)來(lái)微調(diào)預(yù)訓(xùn)練語(yǔ)言模型。但低資源語(yǔ)言缺乏標(biāo)注數(shù)據(jù)集,難以獲取。大部分現(xiàn)有的 MRC 數(shù)據(jù)集都是英文的,這對(duì)于其他語(yǔ)言來(lái)說(shuō)是一個(gè)困難。其次,不同語(yǔ)言之間存在語(yǔ)言和文化的差異,表現(xiàn)為不同的句子結(jié)構(gòu)、詞序和形態(tài)特征。例如,日語(yǔ)、中文、印地語(yǔ)和阿拉伯語(yǔ)等語(yǔ)言具有不同的文字系統(tǒng)和更復(fù)雜的語(yǔ)法系統(tǒng),這使得 MRC 模型難以理解這些語(yǔ)言的文本。

為了解決這些挑戰(zhàn),現(xiàn)有文獻(xiàn)中通常采用基于機(jī)器翻譯的數(shù)據(jù)增強(qiáng)方法,將源語(yǔ)言的數(shù)據(jù)集翻譯成目標(biāo)語(yǔ)言進(jìn)行模型訓(xùn)練。然而,在 MRC 任務(wù)中,由于翻譯導(dǎo)致的答案跨度偏移,無(wú)法直接使用源語(yǔ)言的輸出分布來(lái)教導(dǎo)目標(biāo)語(yǔ)言。

e745a39a-9816-11ee-8b88-92fbcf53809c.jpg

因此,本文提出了一種名為 X-STA 的跨語(yǔ)言 MRC 方法,遵循三個(gè)原則:共享、教導(dǎo)和對(duì)齊。共享方面,提出了梯度分解的知識(shí)共享技術(shù),通過(guò)使用平行語(yǔ)言對(duì)作為模型輸入,從源語(yǔ)言中提取知識(shí),增強(qiáng)對(duì)目標(biāo)語(yǔ)言的理解,同時(shí)避免源語(yǔ)言表示的退化。教導(dǎo)方面,本方法利用注意機(jī)制,在目標(biāo)語(yǔ)言的上下文中尋找與源語(yǔ)言輸出答案語(yǔ)義相似的答案跨度,用于校準(zhǔn)輸出答案。對(duì)齊方面,多層次的對(duì)齊被利用來(lái)進(jìn)一步增強(qiáng) MRC 模型的跨語(yǔ)言傳遞能力。通過(guò)知識(shí)共享、教導(dǎo)和多層次對(duì)齊,本方法可以增強(qiáng)模型對(duì)不同語(yǔ)言的語(yǔ)言理解能力。

算法概述

X-STA 模型框架圖如下所示:

e749d762-9816-11ee-8b88-92fbcf53809c.jpg

e75a1514-9816-11ee-8b88-92fbcf53809c.jpg

具體流程如下:

先將源語(yǔ)言的目標(biāo)數(shù)據(jù)翻譯到各個(gè)目標(biāo)語(yǔ)言,目標(biāo)語(yǔ)言的測(cè)試數(shù)據(jù)也翻譯回源語(yǔ)言。

每項(xiàng)數(shù)據(jù)包含問(wèn)題 Q 和上下文段落 C。

構(gòu)建并行語(yǔ)言對(duì) ={源語(yǔ)言訓(xùn)練數(shù)據(jù),目標(biāo)語(yǔ)言訓(xùn)練數(shù)據(jù)} 送入模型并使用反向傳播進(jìn)行模型訓(xùn)練。

將并行語(yǔ)言對(duì) ={源語(yǔ)言測(cè)試數(shù)據(jù),目標(biāo)語(yǔ)言測(cè)試數(shù)據(jù)} 送入模型獲取答案的預(yù)測(cè)。

算法精度評(píng)測(cè)

為了驗(yàn)證 X-STA 算法的有效性,我們?cè)谌齻€(gè)跨語(yǔ)言 MRC 數(shù)據(jù)集上進(jìn)行了測(cè)試,效果證明 X-STA 對(duì)精度提升明顯:

e76a67de-9816-11ee-8b88-92fbcf53809c.jpg

我們也對(duì)算法的模塊進(jìn)行了詳細(xì)有效性分析,我們可以發(fā)現(xiàn)各模塊均對(duì)模型有一定貢獻(xiàn)。

e76de5c6-9816-11ee-8b88-92fbcf53809c.jpg

為了更好地服務(wù)開(kāi)源社區(qū),這一算法的源代碼即將貢獻(xiàn)在自然語(yǔ)言處理算法框架 EasyNLP 中,歡迎 NLP 從業(yè)人員和研究者使用。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95405
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249596
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25453
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1014

    瀏覽量

    44193
  • 自然語(yǔ)言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14164

原文標(biāo)題:基于知識(shí)遷移的跨語(yǔ)言機(jī)器閱讀理解算法

文章出處:【微信號(hào):OSC開(kāi)源社區(qū),微信公眾號(hào):OSC開(kāi)源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器翻譯三大核心技術(shù)原理 | AI知識(shí)科普

    、雞同鴨講,這一點(diǎn)機(jī)器翻譯還是可以做到的!01機(jī)器翻譯和巴別塔的傳說(shuō)《圣經(jīng)》中記載了這樣一個(gè)故事:人類曾經(jīng)聯(lián)合起來(lái)興建能通往天堂的高塔——巴別塔,為了阻止人類的計(jì)劃,上帝讓人類說(shuō)不同的語(yǔ)言,使人類
    發(fā)表于 07-06 10:30

    機(jī)器翻譯三大核心技術(shù)原理 | AI知識(shí)科普 2

    了額外的機(jī)制——注意力機(jī)制,來(lái)幫助我們進(jìn)行調(diào)序。下面我們用一張示意圖來(lái)看一下,基于RNN的神經(jīng)機(jī)器翻譯的流程:首先我們通過(guò)分詞得到輸入源語(yǔ)言詞序列,接下來(lái)每個(gè)詞都用一個(gè)詞向量進(jìn)行表示,得到相應(yīng)的詞向量序列
    發(fā)表于 07-06 10:46

    神經(jīng)機(jī)器翻譯的方法有哪些?

    目前,神經(jīng)機(jī)器翻譯(NMT)已經(jīng)成為在學(xué)術(shù)界和工業(yè)界最先進(jìn)的機(jī)器翻譯方法。最初的這種基于編碼器-解碼器架構(gòu)的機(jī)器翻譯系統(tǒng)都針對(duì)單個(gè)語(yǔ)言對(duì)進(jìn)行翻譯
    發(fā)表于 11-23 12:14

    阿里巴巴機(jī)器翻譯在跨境電商場(chǎng)景下的應(yīng)用和實(shí)踐

    摘要: ?本文將與大家分享機(jī)器翻譯相關(guān)背景知識(shí),再深入介紹機(jī)器翻譯在阿里生態(tài)中的具體應(yīng)用實(shí)踐,介紹基于機(jī)器翻譯技術(shù)搭建的一套完善的電商多語(yǔ)言解決方案,最后將會(huì)從技術(shù)角度介紹阿里
    發(fā)表于 07-31 17:22 ?634次閱讀
    阿里巴巴<b class='flag-5'>機(jī)器翻譯</b>在跨境電商場(chǎng)景下的應(yīng)用和實(shí)踐

    換個(gè)角度來(lái)聊機(jī)器翻譯

    同時(shí)期國(guó)內(nèi)科技企業(yè)在機(jī)器翻譯上的進(jìn)展也非常迅速,以語(yǔ)音和語(yǔ)義理解見(jiàn)長(zhǎng)的科大訊飛在2014年國(guó)際口語(yǔ)翻譯大賽IWSLT上獲得中英和英中兩個(gè)翻譯方向的全球第一名,在2015年又在由美國(guó)國(guó)家
    的頭像 發(fā)表于 04-24 13:55 ?3729次閱讀
    換個(gè)角度來(lái)聊<b class='flag-5'>機(jī)器翻譯</b>

    科大訊飛機(jī)器翻譯首次達(dá)到專業(yè)譯員水平 機(jī)器閱讀超越人類平均水平

    機(jī)器翻譯首次達(dá)到專業(yè)譯員水平。去年11月,科大訊飛機(jī)器翻譯系統(tǒng)參加CATTI全國(guó)翻譯專業(yè)資格(水平)科研測(cè)試,達(dá)到英語(yǔ)二級(jí)《口譯實(shí)務(wù)(交替?zhèn)髯g類)》和三級(jí)《口譯實(shí)務(wù)》合格標(biāo)準(zhǔn),二級(jí)是專業(yè)譯員水平
    的頭像 發(fā)表于 05-24 08:41 ?8746次閱讀

    機(jī)器翻譯走紅的背后是什么

    未來(lái)需要新的算法和語(yǔ)義層面的綜合性突破,促進(jìn)機(jī)器翻譯產(chǎn)品的迭代和產(chǎn)業(yè)全面升級(jí)。
    發(fā)表于 07-14 10:02 ?1149次閱讀

    MIT和谷歌開(kāi)發(fā)失傳語(yǔ)言機(jī)器翻譯系統(tǒng)

    注釋數(shù)據(jù)庫(kù)和讓機(jī)器從中學(xué)習(xí)的技術(shù)讓語(yǔ)言學(xué)習(xí)發(fā)生了革命性變化,這使得機(jī)器翻譯變得越來(lái)越普遍。
    發(fā)表于 07-17 10:56 ?728次閱讀

    未來(lái)機(jī)器翻譯會(huì)取代人工翻譯

    所謂機(jī)器翻譯,就是利用計(jì)算機(jī)將一種自然語(yǔ)言(源語(yǔ)言)轉(zhuǎn)換為另一種自然語(yǔ)言(目標(biāo)語(yǔ)言)的過(guò)程。它是計(jì)算語(yǔ)言
    的頭像 發(fā)表于 12-29 10:12 ?5282次閱讀

    語(yǔ)言翻譯新范式的工作:機(jī)器翻譯界的BERT

    思想就是打造“機(jī)器翻譯界的BERT”,通過(guò)預(yù)訓(xùn)練技術(shù)再在具體語(yǔ)種上微調(diào)即可達(dá)到領(lǐng)先的翻譯效果,其在32個(gè)語(yǔ)種上預(yù)訓(xùn)練出的統(tǒng)一模型在47個(gè)翻譯測(cè)試集上取得了全面顯著的提升。 目錄 機(jī)器翻譯
    的頭像 發(fā)表于 03-31 17:24 ?3338次閱讀
    多<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>翻譯</b>新范式的工作:<b class='flag-5'>機(jī)器翻譯</b>界的BERT

    基于短語(yǔ)的漢語(yǔ)維吾爾語(yǔ)機(jī)器翻譯系統(tǒng)

    ,對(duì)詞級(jí)粒度、詞干級(jí)粒度、最大詞干級(jí)粒度、詞干詞綴級(jí)粒度、詞干-詞尾級(jí)粒度的漢維平行語(yǔ)料庫(kù)進(jìn)行對(duì)比實(shí)驗(yàn),研究不同粒度的維吾爾語(yǔ)對(duì)漢維機(jī)器翻譯中的詞語(yǔ)對(duì)齊質(zhì)量和語(yǔ)言模型質(zhì)量的影響。實(shí)驗(yàn)結(jié)果表明,在上述5種粒度的維
    發(fā)表于 05-11 15:34 ?9次下載

    基于DNN與規(guī)則學(xué)習(xí)的機(jī)器翻譯算法綜述

    基于DNN與規(guī)則學(xué)習(xí)的機(jī)器翻譯算法綜述
    發(fā)表于 06-29 15:44 ?33次下載

    借助機(jī)器翻譯來(lái)生成偽視覺(jué)-目標(biāo)語(yǔ)言對(duì)進(jìn)行語(yǔ)言遷移

    然而之前的基于機(jī)器翻譯的CCR工作大多忽略了這個(gè)問(wèn)題,它們通常使用大規(guī)模的預(yù)訓(xùn)練模型在通過(guò)機(jī)器翻譯得到的大規(guī)模多語(yǔ)言視覺(jué)-語(yǔ)言語(yǔ)料庫(kù)上進(jìn)行大規(guī)模預(yù)訓(xùn)練,并且只關(guān)注于視覺(jué)-目標(biāo)
    的頭像 發(fā)表于 10-14 14:59 ?1152次閱讀

    語(yǔ)言模型的多語(yǔ)言機(jī)器翻譯能力分析

    以ChatGPT為代表的大語(yǔ)言模型(Large Language Models, LLM)在機(jī)器翻譯(Machine Translation, MT)任務(wù)上展現(xiàn)出了驚人的潛力。
    的頭像 發(fā)表于 05-17 09:56 ?2820次閱讀
    大<b class='flag-5'>語(yǔ)言</b>模型的多<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>機(jī)器翻譯</b>能力分析

    機(jī)器翻譯研究進(jìn)展

    機(jī)器翻譯使用計(jì)算機(jī)將一種語(yǔ)言翻譯成另一種語(yǔ)言,具有低成本、高效率和高翻譯質(zhì)量等優(yōu)勢(shì),在語(yǔ)音翻譯
    的頭像 發(fā)表于 07-06 11:19 ?1274次閱讀
    <b class='flag-5'>機(jī)器翻譯</b>研究進(jìn)展