一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

計算語言學的發(fā)展趨勢、不足與挑戰(zhàn)

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2022-08-18 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

引言

NAACL 會議是 ACL 的北美分會,每年舉辦一次,也是 NLP 領域備受關注的頂會之一。NAACL 主要涉及對話、信息抽取、信息檢索、語言生成、機器翻譯、多模態(tài)、統(tǒng)計機器學習等多個方面。

本篇文章的作者Antoine SIMOULIN協(xié)助了NAACL 2022,他結合今年一些論文的情況,就大規(guī)模預訓練語言模型的應用、表現(xiàn)、期望等做了概述,總結并思考了當今計算語言學的發(fā)展趨勢、不足與挑戰(zhàn)。

02

2.1大規(guī)模預訓練語言模型數(shù)量增多

人們越來越樂觀地看待大規(guī)模預訓練語言模型的潛在應用,這使人們的注意力從它們?yōu)槭裁匆约叭绾喂ぷ鬓D移到如何確保它們在現(xiàn)實世界中可以更好地工作。

對話是語言模型的直接應用。Amazon Alexa AI高級首席科學家Dilek Hakkani-Tur表示,由于公共數(shù)據(jù)集、語言模型和產(chǎn)品的蓬勃發(fā)展,對話研究正處于激動人心的階段。她還概述了剩余的挑戰(zhàn):基于知識的回復生成、開放域對話中產(chǎn)生的事實響應、知識攝取以及收集跨長文檔或多源信息。

2.2 開放對話

通過給定恰當格式的輸入文本并提供相關上下文,模型可以產(chǎn)生符合條件的輸出。這種交互對話范式可以應用在很多任務上,如問答(Sanagavarapu et al. 2022 (opens new window), Qian et al. 2022 (opens new window), You et al. 2022 (opens new window))或摘要總結(Fang et al. 2022 (opens new window), Zhao et al. 2022 (opens new window), Asi et al. 2022 (opens new window))。此外,對話數(shù)據(jù)可用于學習高效的語言表示 (Zhou et al. 2022 (opens new window))。

2.3 結構融合和常識知識

我們期望大規(guī)模預訓練語言模型能夠準確回答事實問題,讓模型擁有如“百科全書”一般的知識。知識圖譜提供了可以與神經(jīng)網(wǎng)絡一起使用的硬結構信息??梢栽诿麑嶓w及其關系之間進行顯式通信(Ayoola et al. 2022 (opens new window)),或者將符號和顯式知識提煉成模型參數(shù)的隱式編碼知識 (Moiseev et al. 2022 (opens new window))。

我們還希望大規(guī)模預訓練語言模型擁有我們所有人擁有的日常知識。例如,我們希望模型不會生成“狗正在從噴氣式飛機上經(jīng)過”這樣的句子(Seo et al. 2022 (opens new window)),或牙刷在空間上應與浴室相關而不是與客廳相關(Henlein and Mehler 2022 (opens new window))。

最后,這些事實取決于時間。如果是在模型訓練后發(fā)生的事件,例如新冠肺炎大流行,那么模型并不會將其考慮在內(nèi),否則會導致時間錯位 (Luu et al. 2022 (opens new window))。

2.4 推理

我們希望模型可以校對事實并推斷它們之間的關系。(Sun et al. 2022 (opens new window))提出了JointLK,這是一個在LM(語言模型)和KG(知識圖譜)之間進行多步聯(lián)合推理的模型,可以解決問答任務。多跳問答任務也涉及推理,因為它需要推斷多個間接引用來連接詢問(query)中提到的實體。(Kinet al. 2022 (opens new window))提出了一種方法:對這種特定類型的問答使用知識庫。

2.5 超越語言本身

模型不僅僅需要精通語言,它們還需要捕捉語言背后的含義和意圖,捕捉真實世界的一些直觀表述,并對實體和現(xiàn)有的關系進行復雜的推斷。要推動大規(guī)模預訓練的語言模型向前發(fā)展,關鍵是:僅憑文本可以訓練高效且有意義的模型嗎?

2.6 多模態(tài)、多語言、對比學習

我們是否需要在訓練過程中引入其他模態(tài),例如音頻信息或者圖像信息?事實上,嬰兒在學習時會受到多種類型信息的刺激。關于多模態(tài)學習,(Zhang et al.2022 (opens new window))使用文本和圖像混合信息的對比框架來構建句子編碼。(Wang et al. 2022 (opens new window))提出將文本和圖像結合起來,以更好地確認命名實體識別。

2.7 語言學和符號結構的地位

計算語言學見證了大規(guī)模預訓練語言模型的廣泛使用,但大規(guī)模預訓練語言模型對語言學和符號的假設很少。在激動人心的小組會議上,Chitta Baral、Dilek Hakkani-Tür、Emily Bender和Chris Manning研究了這一觀察可能如何影響未來的研究方向??蒲匈Y金通常流向研究神經(jīng)網(wǎng)絡的工作,因此人們對利用語言學進行分析并不感興趣。但神經(jīng)網(wǎng)絡是我們應該追逐的唯一趨勢嗎?

Chris Manning根據(jù)經(jīng)驗觀察到,孩子們可以在沒有任何語言學專業(yè)知識的情況下學習語言。我們或許可以從語言理論和概念中汲取靈感,如復合性、系統(tǒng)概括、符號的穩(wěn)定意義和校對相關。但是,我們應該關注意義的直接表征,而不是語言本身,因為語言是一種間接表征。

Emily Bender認為如果沒有語言學,包括結構語言學、形態(tài)學、語法學、語義學、語言語用學、兒童語言習得、語言類型學和社會語言學,那么NLP就不應該作為一個領域而存在。

2.8 文本內(nèi)涵的定義

在SemEval研討會上,Jacob Andreas討論了語言模型在文本內(nèi)涵表示方面的潛力,以及是否可以單獨從文本中學習到文本的內(nèi)涵。會議期間多次提到關于文本的內(nèi)涵。文本內(nèi)涵是指世界上的外部參考,人們腦海中的內(nèi)部思想,還是用語言表達的觀念?更廣泛地說,我們可以期望一個模型在沒有任何形式的社交互動或實際經(jīng)驗的情況下,只憑借文本訓練就展示人類的行為嗎?

2.9 巨大的能力帶來巨大的責任

隨著大規(guī)模預訓練語言模型變得越來越可行和廣泛采用,工程師們對他們的觀念變得更加負責。

2.10 價值敏感設計

Batya Friedman就道德和技術想象力應該如何塑造技術發(fā)表了公開演講。除了安全、可靠性、效率或成本等工程標準外,還應考慮其他標準,包括專注和身體完整性。為了使技術和社會結構和諧發(fā)展,我們應該衡量大規(guī)模語言模型帶來的的影響,例如規(guī)模、時間、結構以及應用人類價值觀作為評估系統(tǒng)性能的標準。

2.11 拓寬NLP

眾所周知,自然語言處理是一個快速發(fā)展的領域,但這個領域的演變非常多樣化,研究資源也非常集中。科技公司擁有巨大的行動力,使學者難以跟上步伐。此外,研究資源在地理上分布不均,例如Manuel Montes-y-Gómez展示了墨西哥西班牙語NLP社區(qū)研究現(xiàn)狀,該研究不如美式英語先進。

2.12 NLP未來的一些挑戰(zhàn):組成性、基礎或解釋

盡管大規(guī)模預訓練語言模型非常令人興奮,并且我們對它們的可靠性和效率實現(xiàn)任務自動化的能力越來越樂觀,但一些挑戰(zhàn)仍然存在。

一個挑戰(zhàn)是跟蹤模型為什么產(chǎn)生一個給定的輸出。(Tan 2022 (opens new window))區(qū)分了幾種我們能從模型或人類所期望的概念解釋和挑戰(zhàn)。

根據(jù)許多研究,模型在系統(tǒng)推廣和顯式組成方面是失敗的,因為它們依賴于虛假的相關性。在這方面,(Wei?enhorn et al. 2022 (opens new window))使用復合語義解析器來解決COGS數(shù)據(jù)集上的成分概括。(Qui et al. 2022 (opens new window)) 提出了一種基于上下文無關語法主干的數(shù)據(jù)增強方法。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4814

    瀏覽量

    103635
  • 計算
    +關注

    關注

    2

    文章

    453

    瀏覽量

    39350
  • 語言模型
    +關注

    關注

    0

    文章

    561

    瀏覽量

    10792

原文標題:結合NAACL2022對計算語言學趨勢的思考與分析

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能技術的現(xiàn)狀與未來發(fā)展趨勢

    人工智能技術的現(xiàn)狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術迅猛發(fā)展,深刻影響著各行各業(yè)。從計算機視覺到自然語言處理,從自動駕駛到醫(yī)療診斷,AI的應用場景不斷擴展,推動社會向
    的頭像 發(fā)表于 07-16 15:01 ?173次閱讀

    物聯(lián)網(wǎng)未來發(fā)展趨勢如何?

    近年來,物聯(lián)網(wǎng)行業(yè)以其驚人的增長速度和無限的潛力成為了全球科技界的焦點。它正在改變我們的生活方式、商業(yè)模式和社會運轉方式。那么,物聯(lián)網(wǎng)行業(yè)的未來發(fā)展趨勢將會是怎樣的呢?讓我們一同探尋其中的奧秘
    發(fā)表于 06-09 15:25

    FPGA在數(shù)字化時代的主要發(fā)展趨勢

    的創(chuàng)新,也對開發(fā)者提出了新的要求。這篇文章將帶您深入探討FPGA發(fā)展趨勢,并剖析這些變化對開發(fā)者的影響與挑戰(zhàn),為在新時代的技術浪潮中把握機遇提供參考。
    的頭像 發(fā)表于 04-02 09:49 ?745次閱讀
    FPGA在數(shù)字化時代的主要<b class='flag-5'>發(fā)展趨勢</b>

    混合信號設計的概念、挑戰(zhàn)發(fā)展趨勢

    本文介紹了集成電路設計領域中混合信號設計的概念、挑戰(zhàn)發(fā)展趨勢。
    的頭像 發(fā)表于 04-01 10:30 ?611次閱讀

    工業(yè)電機行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析

    過大數(shù)據(jù)分析的部分觀點,可能對您的企業(yè)規(guī)劃有一定的參考價值。點擊附件查看全文*附件:工業(yè)電機行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析.doc 本文系網(wǎng)絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內(nèi)容!
    發(fā)表于 03-31 14:35

    淺析半導體激光器的發(fā)展趨勢

    文章綜述了現(xiàn)有高功率半導體激光器(包括單發(fā)射腔、巴條、水平陣列和垂直疊陣)的封裝技術,并討論了其發(fā)展趨勢;分析了半導體激光器封裝技術存在的問題和面臨的挑戰(zhàn),并給出解決問題與迎接挑戰(zhàn)的方法及策略。
    的頭像 發(fā)表于 02-26 09:53 ?846次閱讀
    淺析半導體激光器的<b class='flag-5'>發(fā)展趨勢</b>

    未來物流發(fā)展趨勢與TMS的關系

    隨著全球化的加速和電子商務的蓬勃發(fā)展,物流行業(yè)正經(jīng)歷著前所未有的變革。未來物流的發(fā)展趨勢不僅影響著供應鏈的效率和成本,也對企業(yè)的競爭力產(chǎn)生深遠影響。運輸管理系統(tǒng)(Transportation
    的頭像 發(fā)表于 11-26 09:40 ?1090次閱讀

    NPU的市場前景與發(fā)展趨勢

    隨著人工智能技術的快速發(fā)展,神經(jīng)網(wǎng)絡處理器(Neural Processing Unit,簡稱NPU)作為AI領域的關鍵硬件,其市場前景和發(fā)展趨勢備受關注。 一、NPU市場前景分析 市場需求
    的頭像 發(fā)表于 11-15 09:14 ?3316次閱讀

    邊緣計算的未來發(fā)展趨勢

    邊緣計算的未來發(fā)展趨勢呈現(xiàn)出多元化和高速增長的態(tài)勢,以下是對其未來發(fā)展趨勢的分析: 一、技術融合與創(chuàng)新 與5G、AI技術的深度融合 隨著5G技術的普及,其大帶寬、低延遲的特性為邊緣計算
    的頭像 發(fā)表于 10-24 14:21 ?1842次閱讀

    計算技術的未來發(fā)展趨勢

    計算技術的未來發(fā)展趨勢呈現(xiàn)出多元化和高度集成的特點,以下是對其未來發(fā)展趨勢的介紹: 一、市場規(guī)模持續(xù)增長 全球范圍 : 根據(jù)權威機構發(fā)布的數(shù)據(jù),全球云計算市場規(guī)模近年來持續(xù)增長,20
    的頭像 發(fā)表于 10-24 09:20 ?2649次閱讀

    智能駕駛技術發(fā)展趨勢

    智能駕駛技術是當前汽車行業(yè)的重要發(fā)展趨勢之一,它融合了傳感器技術、人工智能、大數(shù)據(jù)和云計算等多種先進技術,旨在實現(xiàn)車輛的自主駕駛和智能化管理。以下是對智能駕駛技術發(fā)展趨勢的分析: 一、技術突破與進展
    的頭像 發(fā)表于 10-23 15:41 ?1924次閱讀

    未來AI大模型的發(fā)展趨勢

    未來AI大模型的發(fā)展趨勢將呈現(xiàn)多元化和深入化的特點,以下是對其發(fā)展趨勢的分析: 一、技術驅動與創(chuàng)新 算法與架構優(yōu)化 : 隨著Transformer架構的廣泛應用,AI大模型在特征提取和并行計算效率
    的頭像 發(fā)表于 10-23 15:06 ?1955次閱讀

    變阻器的未來發(fā)展趨勢和前景如何?是否有替代品出現(xiàn)?

    變阻器是一種用于調(diào)節(jié)電路中電阻值的電子元件,廣泛應用于各種電子設備和系統(tǒng)中。隨著科技的不斷進步和應用領域的擴展,變阻器的未來發(fā)展趨勢和前景備受關注。 未來變阻器將趨向于智能化和多功能化,隨著物聯(lián)網(wǎng)
    發(fā)表于 10-10 14:35

    智能制造行業(yè)現(xiàn)狀與發(fā)展趨勢

    智能制造行業(yè)作為現(xiàn)代制造業(yè)的重要組成部分,正經(jīng)歷著快速的發(fā)展與變革。以下是對智能制造行業(yè)現(xiàn)狀與發(fā)展趨勢的詳細分析:
    的頭像 發(fā)表于 09-15 14:26 ?3034次閱讀

    倉頡語言書籍申請

    樓主, 您好!我是一名接觸開發(fā)語言不久,對語言學習充滿熱情的開發(fā)者小白,近期對華為推出的倉頡語言產(chǎn)生了濃厚的興趣。為了更深入地了解和學習這種語言,我希望能申請一本關于倉頡
    發(fā)表于 08-06 08:37