午夜社区视频在线观看,成人欧美在线观看应用

自然語言處理頂會NAACL近日公布了本屆會議的最佳論文，谷歌BERT論文獲得最佳長論文，可謂名至實(shí)歸。

自然語言處理四大頂會之一NAACL2019將于6月2日-7日在美國明尼阿波利斯市舉行。

據(jù)官方統(tǒng)計(jì)，NAACL2019共收到1955篇論文，接收論文424篇，錄取率僅為22.6%。其中長論文投稿1198篇，短論文757篇。

今天，大會揭曉了本屆會議的最佳論文獎項(xiàng)，包括最佳專題論文、最佳可解釋NLP論文、最佳長論文、最佳短論文和最佳資源論文。

其中，谷歌BERT論文獲得最佳長論文獎項(xiàng)，可謂名至實(shí)歸。

最佳長論文：谷歌BERT模型

最佳長論文(Best Long Paper)

BERT:PretrainingofDeepBidirectionalTransformersforLanguageUnderstanding

JacobDevlin,Ming-WeiChang,KentonLeeandKristinaToutanova

https://arxiv.org/abs/1810.04805

谷歌AI團(tuán)隊(duì)在去年10月發(fā)布的BERT模型，在機(jī)器閱讀理解頂級水平測試SQuAD1.1中表現(xiàn)出驚人的成績：全部兩個(gè)衡量指標(biāo)上全面超越人類！并且還在11種不同NLP測試中創(chuàng)出最佳成績，包括將GLUE基準(zhǔn)推至80.4％（絕對改進(jìn)7.6％），MultiNLI準(zhǔn)確度達(dá)到86.7%（絕對改進(jìn)率5.6％）等。

自BERT模型發(fā)布以來，許多基于BERT的改進(jìn)模型不斷在各種NLP任務(wù)刷新成績。毫不夸張地說，BERT模型開啟了NLP的新時(shí)代！

首先來看下谷歌AI團(tuán)隊(duì)做的這篇論文。

BERT的新語言表示模型，它代表Transformer的雙向編碼器表示。與最近的其他語言表示模型不同，BERT旨在通過聯(lián)合調(diào)節(jié)所有層中的上下文來預(yù)先訓(xùn)練深度雙向表示。因此，預(yù)訓(xùn)練的BERT表示可以通過一個(gè)額外的輸出層進(jìn)行微調(diào)，適用于廣泛任務(wù)的最先進(jìn)模型的構(gòu)建，比如問答任務(wù)和語言推理，無需針對具體任務(wù)做大幅架構(gòu)修改。

論文作者認(rèn)為現(xiàn)有的技術(shù)嚴(yán)重制約了預(yù)訓(xùn)練表示的能力。其主要局限在于標(biāo)準(zhǔn)語言模型是單向的，這使得在模型的預(yù)訓(xùn)練中可以使用的架構(gòu)類型很有限。

在論文中，作者通過提出BERT：即Transformer的雙向編碼表示來改進(jìn)基于架構(gòu)微調(diào)的方法。

BERT提出一種新的預(yù)訓(xùn)練目標(biāo)：遮蔽語言模型（maskedlanguagemodel，MLM），來克服上文提到的單向性局限。MLM的靈感來自Cloze任務(wù)（Taylor,1953）。MLM隨機(jī)遮蔽模型輸入中的一些token，目標(biāo)在于僅基于遮蔽詞的語境來預(yù)測其原始詞匯id。

與從左到右的語言模型預(yù)訓(xùn)練不同，MLM目標(biāo)允許表征融合左右兩側(cè)的語境，從而預(yù)訓(xùn)練一個(gè)深度雙向Transformer。除了遮蔽語言模型之外，本文作者還引入了一個(gè)“下一句預(yù)測”（nextsentenceprediction）任務(wù)，可以和MLM共同預(yù)訓(xùn)練文本對的表示。

預(yù)訓(xùn)練模型架構(gòu)的差異。BERT使用雙向Transformer。OpenAIGPT使用從左到右的Transformer。ELMo使用經(jīng)過獨(dú)立訓(xùn)練的從左到右和從右到左LSTM的串聯(lián)來生成下游任務(wù)的特征。三個(gè)模型中，只有BERT表示在所有層中共同依賴于左右上下文。

參考閱讀：

NLP歷史突破！谷歌BERT模型狂破11項(xiàng)紀(jì)錄，全面超越人類！

最佳專題論文：減輕機(jī)器學(xué)習(xí)系統(tǒng)的偏見

最佳專題論文（Best Thematic Paper）

What’sinaName?ReducingBiasinBiosWithoutAccesstoProtectedAttributes

AlexeyRomanov,MariaDeArteaga,HannaWallach,JenniferChayes,ChristianBorgs,AlexandraChouldechova,SahinGeyik,KrishnaramKenthapadi,AnnaRumshiskyandAdamKalai

https://128.84.21.199/abs/1904.05233

越來越多的研究提出了減輕機(jī)器學(xué)習(xí)系統(tǒng)偏見的方法。這些方法通常依賴于對受保護(hù)屬性(如種族、性別或年齡)的可用性。

然而，這提出了兩個(gè)重要的挑戰(zhàn)：

(1)受保護(hù)的屬性可能不可用，或者使用它們可能不合法;

(2)通常需要同時(shí)考慮多個(gè)受保護(hù)的屬性及其交集。

在減輕職業(yè)分類偏見的背景下，我們提出了一種方法，用于阻隔個(gè)人真實(shí)職業(yè)的預(yù)測概率與他們名字的單詞嵌入之間的相關(guān)性。

這種方法利用了詞嵌入中編碼的社會偏見，從而無需訪問受保護(hù)屬性。最重要的是，這種方法只要求在訓(xùn)練時(shí)訪問個(gè)人姓名，而不是在部署時(shí)。

我們使用了一個(gè)大規(guī)模的在線傳記數(shù)據(jù)集來評估我們提出的方法的兩種變體。我們發(fā)現(xiàn)，這兩種變體同時(shí)減少了種族和性別偏見，而分類器的總體真實(shí)陽性率幾乎沒有降低。

最佳可解釋NLP論文：用量子物理的數(shù)學(xué)框架建模人類語言

最佳可解釋NLP論文 (Best Explainable NLP Paper)

CNM:AnInterpretableComplex-valuedNetworkforMatching

QiuchiLi,BenyouWangandMassimoMelucci

https://128.84.21.199/abs/1904.05298

本文試圖用量子物理的數(shù)學(xué)框架對人類語言進(jìn)行建模。

這個(gè)框架利用了量子物理中精心設(shè)計(jì)的數(shù)學(xué)公式，將不同的語言單元統(tǒng)一在一個(gè)復(fù)值向量空間中，例如，將單詞作為量子態(tài)的粒子，句子作為混合系統(tǒng)。我們構(gòu)建了一個(gè)復(fù)值網(wǎng)絡(luò)來實(shí)現(xiàn)該框架的語義匹配。

由于具有良好約束的復(fù)值組件，網(wǎng)絡(luò)允許對顯式物理意義進(jìn)行解釋。所提出的復(fù)值匹配網(wǎng)絡(luò)(complex-valuednetworkformatching,CNM)在兩個(gè)基準(zhǔn)問題回答(QA)數(shù)據(jù)集上具有與強(qiáng)大的CNN和RNN基線相當(dāng)?shù)男阅堋?/p>

最佳短論文：視覺模態(tài)對機(jī)器翻譯的作用

最佳短論文(Best Short Paper)

Probing the Need for Visual Context in Multimodal Machine Translation

OzanCaglayan,PranavaMadhyastha,LuciaSpeciaandLo?cBarrault

https://arxiv.org/abs/1903.08678

目前關(guān)于多模態(tài)機(jī)器翻譯(MMT)的研究表明，視覺模態(tài)要么是不必要的，要么僅僅是有幫助的。

我們假設(shè)這是在任務(wù)的惟一可用數(shù)據(jù)集(Multi30K)中使用的非常簡單、簡短和重復(fù)的語句的結(jié)果，其中源文本被呈現(xiàn)為上下文。

然而，在一般情況下，我們認(rèn)為可以將視覺信息和文本信息結(jié)合起來進(jìn)行實(shí)際的翻譯。

在本文中，我們通過系統(tǒng)的分析探討了視覺模態(tài)對最先進(jìn)的MMT模型的貢獻(xiàn)。我們的結(jié)果表明，在有限的文本上下文中，模型能夠利用視覺輸入生成更好的翻譯。這與當(dāng)前的觀點(diǎn)相矛盾，即要么是因?yàn)閳D像特征的質(zhì)量，要么是因?yàn)樗鼈兗傻侥Ｐ椭械姆绞?，MMT模型忽視了視覺模態(tài)。

最佳資源論文：常識性問答的新數(shù)據(jù)集

最佳資源論文(Best Resource Paper)

CommonsenseQA:AQuestionAnsweringChallengeTargetingCommonsenseKnowledge

AlonTalmor,JonathanHerzig,NicholasLourieandJonathanBerant

https://arxiv.org/abs/1811.00937

在回答一個(gè)問題時(shí)，除了特定的上下文外，人們往往會利用他們豐富的世界知識。

最近的工作主要集中在回答一些有關(guān)文件或背景的問題，很少需要一般常識背景。

為了研究基于先驗(yàn)知識的問答任務(wù)，我們提出了CommonsenseQA：一個(gè)具有挑戰(zhàn)性的用于常識性問答的新數(shù)據(jù)集。

為了獲取超出關(guān)聯(lián)之外的常識，我們從ConceptNet(Speeretal.，2017)中提取了與單個(gè)源概念具有相同語義關(guān)系的多個(gè)目標(biāo)概念。參與者被要求撰寫多項(xiàng)選擇題，其中要提到源概念，并依次區(qū)分每個(gè)目標(biāo)概念。這鼓勵(lì)參與人員創(chuàng)建具有復(fù)雜語義的問題，這些問題通常需要先驗(yàn)知識。

我們通過這個(gè)過程創(chuàng)建了12247個(gè)問題，并用大量強(qiáng)大的基線說明了我們?nèi)蝿?wù)的難度。我們最好的基線是基于BERT-large(Devlinetal.，2018)的，獲得56%的準(zhǔn)確率，遠(yuǎn)低于人類表現(xiàn)，即89%的準(zhǔn)確度。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴