一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹三個(gè)NLP領(lǐng)域的熱門詞匯

8g3K_AI_Thinker ? 來(lái)源:lp ? 2019-04-17 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:在過(guò)去的一段時(shí)間,自然語(yǔ)言處理領(lǐng)域取得了許多重要的進(jìn)展,Transformer、BERT、無(wú)監(jiān)督機(jī)器翻譯,這些詞匯仿佛在一夜之間就進(jìn)入了人們的視野。你知道它們具體都是什么意思嗎?今天,我們就將為大家介紹三個(gè)NLP領(lǐng)域的熱門詞匯。

Transformer

Transformer 在2017年由Google在題為《Attention Is All You Need》的論文中提出。Transformer 是一個(gè)完全基于注意力機(jī)制的編解碼器模型,它拋棄了之前其它模型引入注意力機(jī)制后仍然保留的循環(huán)與卷積結(jié)構(gòu),而采用了自注意力(Self-attention)機(jī)制,在任務(wù)表現(xiàn)、并行能力和易于訓(xùn)練性方面都有大幅的提高。

在 Transformer 出現(xiàn)之前,基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯模型多數(shù)都采用了 RNN 的模型架構(gòu),它們依靠循環(huán)功能進(jìn)行有序的序列操作。雖然 RNN 架構(gòu)有較強(qiáng)的序列建模能力,但是存在訓(xùn)練速度慢,訓(xùn)練質(zhì)量低等問(wèn)題。

與基于 RNN 的方法不同,Transformer 模型中沒有循環(huán)結(jié)構(gòu),而是把序列中的所有單詞或者符號(hào)并行處理,同時(shí)借助自注意力機(jī)制對(duì)句子中所有單詞之間的關(guān)系直接進(jìn)行建模,而無(wú)需考慮各自的位置。

具體而言,如果要計(jì)算給定單詞的下一個(gè)表征,Transformer 會(huì)將該單詞與句子中的其它單詞一一對(duì)比,并得出這些單詞的注意力分?jǐn)?shù)。注意力分?jǐn)?shù)決定其它單詞對(duì)給定詞匯的語(yǔ)義影響。之后,注意力分?jǐn)?shù)用作所有單詞表征的平均權(quán)重,這些表征輸入全連接網(wǎng)絡(luò),生成新表征。

由于 Transformer 并行處理所有的詞,以及每個(gè)單詞都可以在多個(gè)處理步驟內(nèi)與其它單詞之間產(chǎn)生聯(lián)系,它的訓(xùn)練速度比 RNN 模型更快,在翻譯任務(wù)中的表現(xiàn)也比 RNN 模型更好。

除了計(jì)算性能和更高的準(zhǔn)確度,Transformer 另一個(gè)亮點(diǎn)是可以對(duì)網(wǎng)絡(luò)關(guān)注的句子部分進(jìn)行可視化,尤其是在處理或翻譯一個(gè)給定詞時(shí),因此可以深入了解信息是如何通過(guò)網(wǎng)絡(luò)傳播的。

之后,Google的研究人員們又對(duì)標(biāo)準(zhǔn)的 Transformer 模型進(jìn)行了拓展,采用了一種新型的、注重效率的時(shí)間并行循環(huán)結(jié)構(gòu),讓它具有通用計(jì)算能力,并在更多任務(wù)中取得了更好的結(jié)果。

改進(jìn)的模型(Universal Transformer)在保留Transformer 模型原有并行結(jié)構(gòu)的基礎(chǔ)上,把 Transformer 一組幾個(gè)各異的固定的變換函數(shù)替換成了一組由單個(gè)的、時(shí)間并行的循環(huán)變換函數(shù)構(gòu)成的結(jié)構(gòu)。

相比于 RNN一個(gè)符號(hào)接著一個(gè)符號(hào)從左至右依次處理序列,Universal Transformer 和 Transformer 能夠一次同時(shí)處理所有的符號(hào),但 Universal Transformer 接下來(lái)會(huì)根據(jù)自注意力機(jī)制對(duì)每個(gè)符號(hào)的解釋做數(shù)次并行的循環(huán)處理修飾。

Universal Transformer 中時(shí)間并行的循環(huán)機(jī)制不僅比 RNN 中使用的串行循環(huán)速度更快,也讓 Universal Transformer 比標(biāo)準(zhǔn)的前饋 Transformer 更加強(qiáng)大。

預(yù)訓(xùn)練 Pre-train

目前神經(jīng)網(wǎng)絡(luò)在進(jìn)行訓(xùn)練的時(shí)候基本都是基于后向傳播(Back Propagation,BP)算法,通過(guò)對(duì)網(wǎng)絡(luò)模型參數(shù)進(jìn)行隨機(jī)初始化,然后利用優(yōu)化算法優(yōu)化模型參數(shù)。

但是在標(biāo)注數(shù)據(jù)很少的情況下,通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練出的模型往往精度有限,“預(yù)訓(xùn)練”則能夠很好地解決這個(gè)問(wèn)題,并且對(duì)一詞多義進(jìn)行建模。

預(yù)訓(xùn)練是通過(guò)大量無(wú)標(biāo)注的語(yǔ)言文本進(jìn)行語(yǔ)言模型的訓(xùn)練,得到一套模型參數(shù),利用這套參數(shù)對(duì)模型進(jìn)行初始化,再根據(jù)具體任務(wù)在現(xiàn)有語(yǔ)言模型的基礎(chǔ)上進(jìn)行精調(diào)。

預(yù)訓(xùn)練的方法在自然語(yǔ)言處理的分類和標(biāo)記任務(wù)中,都被證明擁有更好的效果。目前,熱門的預(yù)訓(xùn)練方法主要有三個(gè):ELMo,OpenAI GPT 和 BERT。

在2018年初,艾倫人工智能研究所和華盛頓大學(xué)的研究人員在題為《Deep contextualized word representations》一文中提出了ELMo。

相較于傳統(tǒng)的使用詞嵌入(Word embedding)對(duì)詞語(yǔ)進(jìn)行表示,得到每個(gè)詞唯一固定的詞向量,ELMo 利用預(yù)訓(xùn)練好的雙向語(yǔ)言模型,根據(jù)具體輸入從該語(yǔ)言模型中可以得到在文本中該詞語(yǔ)的表示。在進(jìn)行有監(jiān)督的 NLP 任務(wù)時(shí),可以將 ELMo 直接當(dāng)做特征拼接到具體任務(wù)模型的詞向量輸入或者是模型的最高層表示上。

在ELMo的基礎(chǔ)之上,OpenAI的研究人員在《Improving Language Understanding by Generative Pre-Training》提出了OpenAI GPT。

與ELMo為每一個(gè)詞語(yǔ)提供一個(gè)顯式的詞向量不同,OpenAI GPT能夠?qū)W習(xí)一個(gè)通用的表示,使其能夠在大量任務(wù)上進(jìn)行應(yīng)用。

在處理具體任務(wù)時(shí),OpenAI GPT 不需要再重新對(duì)任務(wù)構(gòu)建新的模型結(jié)構(gòu),而是直接在 Transformer 這個(gè)語(yǔ)言模型上的最后一層接上 softmax 作為任務(wù)輸出層,再對(duì)這整個(gè)模型進(jìn)行微調(diào)。

ELMo和OpenAI GPT這兩種預(yù)訓(xùn)練語(yǔ)言表示方法都是使用單向的語(yǔ)言模型來(lái)學(xué)習(xí)語(yǔ)言表示,而Google在提出的BERT則實(shí)現(xiàn)了雙向?qū)W習(xí),并得到了更好的訓(xùn)練效果。

具體而言,BERT使用Transformer的編碼器作為語(yǔ)言模型,并在語(yǔ)言模型訓(xùn)練時(shí)提出了兩個(gè)新的目標(biāo):MLM(Masked Language Model)和句子預(yù)測(cè)。

MLM是指在輸入的詞序列中,隨機(jī)的擋上 15% 的詞,并遮擋部分的詞語(yǔ)進(jìn)行雙向預(yù)測(cè)。為了讓模型能夠?qū)W習(xí)到句子間關(guān)系,研究人員提出了讓模型對(duì)即將出現(xiàn)的句子進(jìn)行預(yù)測(cè):對(duì)連續(xù)句子的正誤進(jìn)行二元分類,再對(duì)其取和求似然。

圖片來(lái)源:Google AI Blog

無(wú)監(jiān)督機(jī)器翻譯

Unsupervised Machine Translation

現(xiàn)有的機(jī)器翻譯需要大量的翻譯文本做訓(xùn)練樣本,這使得機(jī)器翻譯只在一小部分樣本數(shù)量充足的語(yǔ)言上表現(xiàn)良好,但如何在沒有源翻譯的情況下訓(xùn)練機(jī)器翻譯模型,即無(wú)監(jiān)督訓(xùn)練,成為了目前熱門的研究話題。

Facebook 在 EMNLP 2018 上的論文《Phrase-Based & Neural Unsupervised Machine Translation》利用跨字嵌入(Cross Word Embedding),提升了高達(dá) 11 BLEU,那么 Facebook 是如何實(shí)現(xiàn)的呢?

第一步是讓系統(tǒng)學(xué)習(xí)雙語(yǔ)詞典。系統(tǒng)首先為每種語(yǔ)言中的每個(gè)單詞訓(xùn)練詞嵌入,訓(xùn)練詞嵌入通過(guò)上下文來(lái)預(yù)測(cè)給定單詞周圍的單詞。

不同語(yǔ)言的詞嵌入具有相似的鄰域結(jié)構(gòu),因此可以通過(guò)對(duì)抗訓(xùn)練等方法讓系統(tǒng)學(xué)習(xí)旋轉(zhuǎn)變換一種語(yǔ)言的詞嵌入,以匹配另一種語(yǔ)言的詞嵌入。

基于這些信息,就可以得到一個(gè)相對(duì)準(zhǔn)確的雙語(yǔ)詞典,并基本可以實(shí)現(xiàn)逐字翻譯。在得到語(yǔ)言模型和初始的逐字翻譯模型之后,就可以構(gòu)建翻譯系統(tǒng)的早期版本。

然后將系統(tǒng)翻譯出的語(yǔ)句作為標(biāo)注過(guò)的真實(shí)數(shù)據(jù)進(jìn)行處理,訓(xùn)練反向機(jī)器翻譯系統(tǒng),得到一個(gè)更加流暢和語(yǔ)法正確的語(yǔ)言模型,并將反向翻譯中人工生成的平行句子與該語(yǔ)言模型提供的校正相結(jié)合,以此來(lái)訓(xùn)練這個(gè)翻譯系統(tǒng)。

通過(guò)對(duì)系統(tǒng)的訓(xùn)練,形成了反向翻譯的數(shù)據(jù)集,從而改進(jìn)原有的機(jī)器翻譯系統(tǒng)。隨著一個(gè)系統(tǒng)得到改進(jìn),可以使用它以迭代方式在相反方向上為系統(tǒng)生成訓(xùn)練數(shù)據(jù),并根據(jù)需要進(jìn)行多次迭代。

逐字嵌入初始化、語(yǔ)言建模和反向翻譯是無(wú)監(jiān)督機(jī)器翻譯的三個(gè)重要原則。將基于這些原理得到的翻譯系統(tǒng)應(yīng)用于無(wú)監(jiān)督的神經(jīng)模型和基于計(jì)數(shù)的統(tǒng)計(jì)模型,從訓(xùn)練好的神經(jīng)模型開始,使用基于短語(yǔ)模型的其它反向翻譯句子對(duì)其進(jìn)行訓(xùn)練,最終得到了一個(gè)既流暢,準(zhǔn)確率又高的模型。

對(duì)于無(wú)監(jiān)督機(jī)器翻譯,微軟亞洲研究院自然語(yǔ)言計(jì)算組也進(jìn)行了探索。研究人員利用后驗(yàn)正則(Posterior Regularization)的方式將 SMT(統(tǒng)計(jì)機(jī)器翻譯)引入到無(wú)監(jiān)督NMT的訓(xùn)練過(guò)程中,并通過(guò)EM過(guò)程交替優(yōu)化 SMT 和 NMT 模型,使得無(wú)監(jiān)督 NMT 迭代過(guò)程中的噪音能夠被有效去除,同時(shí) NMT 模型也彌補(bǔ)了 SMT 模型在句子流暢性方面的不足。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4812

    瀏覽量

    103314
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    140

    瀏覽量

    15176
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22573

原文標(biāo)題:請(qǐng)收下這份 NLP 熱門詞匯解讀

文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DC/DC轉(zhuǎn)換器選型的三個(gè)要點(diǎn)

    在上一篇《DC/DC 轉(zhuǎn)換器電路設(shè)計(jì)與開發(fā) — 類型與工作原理》中,我們介紹了 DC/DC 轉(zhuǎn)換器的類型以及降壓型 DC/DC 轉(zhuǎn)換器和升壓型 DC/DC轉(zhuǎn)換器的工作原理。本文將為大家分享 DC/DC 轉(zhuǎn)換器選型的三個(gè)要點(diǎn),以及電感器選型的計(jì)算方法。
    的頭像 發(fā)表于 06-12 16:44 ?779次閱讀
    DC/DC轉(zhuǎn)換器選型的<b class='flag-5'>三個(gè)</b>要點(diǎn)

    Linux系統(tǒng)中最重要的三個(gè)命令

    Linux劍客是Linux系統(tǒng)中最重要的三個(gè)命令,它們以其強(qiáng)大的功能和廣泛的應(yīng)用場(chǎng)景而聞名。這三個(gè)工具的組合使用幾乎可以完美應(yīng)對(duì)Shell中的數(shù)據(jù)分析場(chǎng)景,因此被統(tǒng)稱為L(zhǎng)inux
    的頭像 發(fā)表于 03-03 10:37 ?405次閱讀

    基本理想電路元件的三個(gè)特征是什么

    基本理想電路元件是構(gòu)成電路的基本單元,它們具有三個(gè)基本特征:電壓-電流關(guān)系、能量轉(zhuǎn)換和電路參數(shù)。以下是對(duì)這三個(gè)特征的分析: 電壓-電流關(guān)系 理想電路元件的電壓-電流關(guān)系是其最基本的特征之一。這種關(guān)系
    的頭像 發(fā)表于 08-25 09:38 ?2333次閱讀

    對(duì)稱相電壓的特點(diǎn)是哪三個(gè)方面

    對(duì)稱相電壓是電力系統(tǒng)中常見的一種電壓形式,它具有三個(gè)相位,每個(gè)相位之間的相位差為120度。對(duì)稱相電壓在工業(yè)生產(chǎn)和日常生活中有著廣泛的應(yīng)用,如電動(dòng)機(jī)、變壓器、發(fā)電機(jī)等。本文將從三個(gè)
    的頭像 發(fā)表于 08-12 18:18 ?3060次閱讀

    可調(diào)變阻器三個(gè)引腳怎么區(qū)分

    的區(qū)分對(duì)于正確使用可調(diào)變阻器至關(guān)重要。本文將介紹可調(diào)變阻器的三個(gè)引腳的區(qū)分方法。 一、可調(diào)變阻器的工作原理 在了解可調(diào)變阻器的三個(gè)引腳之前,我們首先需要了解其工作原理??烧{(diào)變阻器主要由一個(gè)
    的頭像 發(fā)表于 07-24 11:12 ?2530次閱讀

    可調(diào)電阻三個(gè)腳各是什么

    可調(diào)電阻器,也稱為電位器或可變電阻器,是一種可調(diào)節(jié)電阻值的電子元件。它通常由三個(gè)腳(引腳)組成,分別是固定腳、滑動(dòng)腳和可調(diào)腳。以下是對(duì)這三個(gè)腳的介紹: 固定腳(Fixed Terminal): 固定
    的頭像 發(fā)表于 07-24 11:06 ?4013次閱讀

    嵌入式熱門領(lǐng)域有哪些?

    嵌入式熱門領(lǐng)域有哪些? 當(dāng)前,嵌入式行業(yè)正處于快速發(fā)展階段,并在多個(gè)領(lǐng)域呈現(xiàn)出蓬勃的熱度。 物聯(lián)網(wǎng) 物聯(lián)網(wǎng)作為目前嵌入式行業(yè)的炙手可熱領(lǐng)域之一,已經(jīng)在各行業(yè)展現(xiàn)出了強(qiáng)勁的增長(zhǎng)勢(shì)頭
    發(fā)表于 07-16 09:23

    如何分別場(chǎng)效應(yīng)管的三個(gè)

    識(shí)別這三個(gè)極對(duì)于正確使用場(chǎng)效應(yīng)管至關(guān)重要。本文將介紹如何分別場(chǎng)效應(yīng)管的三個(gè)極。 一、場(chǎng)效應(yīng)管的基本原理 1.1 場(chǎng)效應(yīng)管的工作原理 場(chǎng)效應(yīng)管是一種電壓控制型器件,其工作原理是通過(guò)改變柵極電壓來(lái)控制源極和漏極之間的導(dǎo)電能力。場(chǎng)效應(yīng)
    的頭像 發(fā)表于 07-14 09:14 ?4093次閱讀

    nlp邏輯層次模型的特點(diǎn)

    NLP(自然語(yǔ)言處理)邏輯層次模型是一種用于理解和生成自然語(yǔ)言文本的計(jì)算模型。它將自然語(yǔ)言文本分解為不同的層次,以便于計(jì)算機(jī)更好地處理和理解。以下是對(duì)NLP邏輯層次模型特點(diǎn)的分析: 詞匯層次
    的頭像 發(fā)表于 07-09 10:39 ?830次閱讀

    nlp自然語(yǔ)言處理基本概念及關(guān)鍵技術(shù)

    、問(wèn)答系統(tǒng)、文本摘要等眾多領(lǐng)域有著廣泛的應(yīng)用。 1. NLP的基本概念 1.1 語(yǔ)言模型 語(yǔ)言模型是NLP的基礎(chǔ),它用于描述一個(gè)句子在自然語(yǔ)言中出現(xiàn)的概率。語(yǔ)言模型通常用于文本生成、機(jī)
    的頭像 發(fā)表于 07-09 10:32 ?1314次閱讀

    nlp自然語(yǔ)言處理框架有哪些

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解和處理人類語(yǔ)言。隨著技術(shù)的發(fā)展,NLP
    的頭像 發(fā)表于 07-09 10:28 ?1023次閱讀

    nlp自然語(yǔ)言處理模型怎么做

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到計(jì)算機(jī)對(duì)人類語(yǔ)言的理解和生成。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,NLP
    的頭像 發(fā)表于 07-05 09:59 ?1124次閱讀

    nlp自然語(yǔ)言處理模型有哪些

    自然語(yǔ)言處理(Natural Language Processing,NLP)是計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠理解、解釋和生成人類語(yǔ)言。以下是對(duì)NLP
    的頭像 發(fā)表于 07-05 09:57 ?1830次閱讀

    nlp自然語(yǔ)言處理的應(yīng)用有哪些

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)分支,它致力于使計(jì)算機(jī)能夠理解和生成自然語(yǔ)言。隨著技術(shù)的發(fā)展,NLP已經(jīng)在許多
    的頭像 發(fā)表于 07-05 09:55 ?3627次閱讀

    NLP技術(shù)在人工智能領(lǐng)域的重要性

    智能的橋梁,其重要性日益凸顯。本文將從NLP的定義、發(fā)展歷程、核心技術(shù)、應(yīng)用領(lǐng)域以及對(duì)人工智能領(lǐng)域的深遠(yuǎn)影響等多個(gè)維度,深入探討NLP技術(shù)在人工智能
    的頭像 發(fā)表于 07-04 16:03 ?1242次閱讀