一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP的兩個(gè)部分:NLU和NLG

GKwL_infoqchina ? 來源:InfoQ ? 2019-12-12 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

比爾·蓋茨曾說過,「語言理解是人工智能皇冠上的明珠」。自然語言處理的進(jìn)步將會(huì)推動(dòng)人工智能整體進(jìn)展。NLP 的歷史幾乎跟計(jì)算機(jī)和人工智能的歷史一樣長(zhǎng)。自計(jì)算機(jī)誕生,就開始有了對(duì)人工智能的研究,而人工智能領(lǐng)域最早的研究就是機(jī)器翻譯以及自然語言理解。

隨著大數(shù)據(jù)和技術(shù)設(shè)施的完善,人工智能技術(shù)在近年來迎來了井噴式的發(fā)展。在產(chǎn)業(yè)方面,不少專注于計(jì)算機(jī)視覺的公司也獲得了長(zhǎng)足發(fā)展。其中比較具有代表性的是估值已經(jīng)超過 20 億美元的商湯科技,在經(jīng)歷了數(shù)輪大額融資之后,其隱隱有從獨(dú)角獸變成巨頭的趨勢(shì)。

不過,人工智能另一個(gè)相關(guān)領(lǐng)域自然語言處理似乎沒有達(dá)到這種高度。在技術(shù)方面,這一領(lǐng)域的技術(shù)準(zhǔn)確率遠(yuǎn)遠(yuǎn)沒有達(dá)到計(jì)算機(jī)視覺和語音識(shí)別的水平,技術(shù)產(chǎn)品也因?yàn)檩^高的錯(cuò)誤率,缺少實(shí)際價(jià)值。那么 NLP 技術(shù)到底有哪些難點(diǎn)呢?

什么是 NLP?

在人工智能出現(xiàn)之前,計(jì)算機(jī)只能處理結(jié)構(gòu)化的數(shù)據(jù),就比如我們平時(shí)用的表格里的數(shù)據(jù),但是網(wǎng)絡(luò)中大部分的數(shù)據(jù)都是非結(jié)構(gòu)化的,比如我們看到的文章、圖片、視頻等等。在這些數(shù)據(jù)中,文本數(shù)據(jù)又往往是最多的,為了能夠分析和利用這些文本信息,我們就需要利用 NLP 技術(shù),讓機(jī)器理解這些文本信息,并加以利用。

人類可以通過語言來交流,而為了讓計(jì)算機(jī)之間互相交流,人們讓所有計(jì)算機(jī)都遵守一些規(guī)則,計(jì)算機(jī)的這些規(guī)則就是計(jì)算機(jī)之間的語言。自然語言處理(NLP)就是在機(jī)器語言和人類語言之間溝通的橋梁,以實(shí)現(xiàn)人機(jī)交流的目的。

NLP 的兩個(gè)部分:NLU 和 NLG

自然語言理解(NLU) 則是 NLP 的一部分,這幾年深度學(xué)習(xí)技術(shù)的發(fā)展使 NLU 能在一些場(chǎng)景中落地。自然語言理解就是希望機(jī)器像人一樣,具備正常人的語言理解能力,由于自然語言在理解上有很多難點(diǎn) (下面詳細(xì)說明),所以 NLU 是至今還遠(yuǎn)不如人類的表現(xiàn)。

NLU 目前應(yīng)用的領(lǐng)域主要集中在機(jī)器翻譯、機(jī)器客服、智能音箱等領(lǐng)域,但由于需要大量的數(shù)據(jù)訓(xùn)練和 NLU 本身存在的一些語言語義上的難點(diǎn),其實(shí)機(jī)器還不是非常智能。

自然語言生成(NLG)是 NLP 的重要組成部分,NLU 負(fù)責(zé)理解內(nèi)容,NLG 負(fù)責(zé)生成內(nèi)容。他的主要目的是降低人類和機(jī)器之間的溝通鴻溝,將非語言格式的數(shù)據(jù)轉(zhuǎn)換成人類可以理解的語言格式。

自然語言生成 – NLG 有 2 種方式:

text – to – text:文本到語言的生成

data – to – text :數(shù)據(jù)到語言的生成

NLP 的難點(diǎn)

對(duì)于機(jī)器來說,難點(diǎn)主要分為 5 類問題:

語言的多樣性,我們?nèi)粘K玫恼Z言是沒有規(guī)律的,不同的組合可以表達(dá)出很多的含義。

語言的歧義性,如果不聯(lián)系上下文,缺少環(huán)境的約束,語言有很大的歧義性

語言是一個(gè)開放集合,我們可以任意的發(fā)明創(chuàng)造一些新的表達(dá)方式。

語言需要知識(shí)依賴,需要聯(lián)系到實(shí)踐知識(shí)。

語言的上下文

應(yīng)用場(chǎng)景復(fù)雜,很難出現(xiàn)“獨(dú)角獸”

總的來說,NLP 技術(shù)領(lǐng)域之所以沒有出現(xiàn)如計(jì)算機(jī)視覺領(lǐng)域那些獨(dú)角獸公司,是因?yàn)樽匀徽Z言處理的技術(shù)難度太大,和應(yīng)用場(chǎng)景太復(fù)雜。一個(gè)公司的成立發(fā)展都是由需求驅(qū)動(dòng)的,自然語言應(yīng)用主要是機(jī)器翻譯,雖然機(jī)器翻譯的需求長(zhǎng)期存在,但機(jī)器翻譯的水平一直未取得突破性的進(jìn)展,即使到今天,機(jī)器也很難翻譯有背景的復(fù)雜句子。

另外,自然語言處理的應(yīng)用太依賴于UI了。圖像識(shí)別基本不需要 UI,直接在系統(tǒng)內(nèi)部集成一些技術(shù)就行。一些公司做翻譯軟件,如果UI做得不行,用戶體驗(yàn)不行,人們就不會(huì)愿意使用。

技術(shù)產(chǎn)業(yè)化最重要的是商業(yè)模式,也就是怎么讓技術(shù)掙錢。圖像識(shí)別公司的掙錢模式已經(jīng)成立了,但翻譯付費(fèi)就難多了。所以自然語言是從研究到技術(shù)到落地到商業(yè)化,面臨一系列的挑戰(zhàn)。目前的現(xiàn)狀是,自然語言處理技術(shù)更多的是作為公司內(nèi)部技術(shù),比如內(nèi)部的商業(yè)情報(bào)或人機(jī)接口功能。

NLP 技術(shù)發(fā)展,未來可期

從今年的 ACL 大會(huì)可以看出 NLP 技術(shù)的火爆。會(huì)議共收到了 2900 余篇提交的論文,投稿規(guī)模相較于 2018 年增長(zhǎng)了 75%!自然語言處理領(lǐng)域?qū)嵲谑侵耸挚蔁?,學(xué)術(shù)界和工業(yè)界的熱情都創(chuàng)下了歷史新高。

從商業(yè)層面來講也涌現(xiàn)出了微軟小冰、小米小愛等比較成熟的機(jī)器人產(chǎn)品,相信在未來的不久 NLP 技術(shù)一定會(huì)給我們帶來更多的驚喜。

大咖現(xiàn)場(chǎng)分享 NLP 技術(shù)干貨

王斌博士,是小米人工智能實(shí)驗(yàn)室主任,NLP 首席科學(xué)家。中國中文信息學(xué)會(huì)理事,計(jì)算語言學(xué)、信息檢索、社會(huì)媒體處理、語言與知識(shí)計(jì)算等專委會(huì)委員及《中文信息學(xué)報(bào)》編委,中國計(jì)算機(jī)學(xué)會(huì)中文信息處理專業(yè)委員會(huì)委員。

加入小米之前,他在中科院計(jì)算所、信工所從事自然語言處理和信息檢索相關(guān)的科研工作。在AICon 全球人工智能與機(jī)器學(xué)習(xí)大會(huì)現(xiàn)場(chǎng),他將會(huì)帶來 NLP 技術(shù)方面的相關(guān)演講,各位感興趣的小伙伴歡迎來現(xiàn)場(chǎng)聽他分享。

AICon 全球人工智能與機(jī)器學(xué)習(xí)技術(shù)大會(huì),將于 11 月 21-22 日在北京國際會(huì)議中心舉行。顏水成、賈揚(yáng)清、崔寶秋等 AI 技術(shù)大咖屆時(shí)也會(huì)來現(xiàn)場(chǎng),跟大家聊一聊今年在 AI 商業(yè)化場(chǎng)景落地的大背景下,又涌現(xiàn)出了哪些新技術(shù)。本次大會(huì)我們?cè)O(shè)立了機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、NLP、AI芯片、搜索推薦、產(chǎn)業(yè)互聯(lián)網(wǎng)、硅谷 AI 技術(shù)實(shí)踐等 13+ 技術(shù)專場(chǎng),細(xì)分到 AI 技術(shù)的各個(gè)領(lǐng)域,為大家全方位的展示 AI 技術(shù)在國內(nèi)目前發(fā)展的現(xiàn)狀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49035

    瀏覽量

    249793
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46791
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22631

原文標(biāo)題:為何NLP領(lǐng)域難以出現(xiàn)“獨(dú)角獸”?丨AICon

文章出處:【微信號(hào):infoqchina,微信公眾號(hào):InfoQ】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    看到STM8L152用兩個(gè)IO用兩個(gè)或非門檢測(cè)兩個(gè)通斷,是什么原理呢?

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對(duì)GND設(shè)計(jì)來檢測(cè)這個(gè)干簧管通斷呢? 這樣設(shè)計(jì)的原理是什么?
    發(fā)表于 06-12 06:25

    兩個(gè)不同頻率晶振靠的近會(huì)怎樣

    晶振的振蕩本質(zhì)上是一種機(jī)械振動(dòng)(在壓電晶體層面)。當(dāng)兩個(gè)晶振靠得很近時(shí),它們的機(jī)械振動(dòng)可能會(huì)相互影響。一個(gè)晶振的振動(dòng)可能會(huì)通過電路板或者外殼等介質(zhì)傳遞給另一個(gè)晶振,從而改變另一個(gè)晶振的
    的頭像 發(fā)表于 01-20 13:55 ?1638次閱讀
    <b class='flag-5'>兩個(gè)</b>不同頻率晶振靠的近會(huì)怎樣

    ADS7230有兩個(gè)電源和兩個(gè)地,是不是意味著芯片內(nèi)部模擬部分和數(shù)字部分是隔離的?

    ADS7230有兩個(gè)電源和兩個(gè)地,是不是意味著芯片內(nèi)部模擬部分和數(shù)字部分是隔離的?或者是非隔離,只做電平轉(zhuǎn)換的?忘各位大俠解答,小弟不甚感激!??!
    發(fā)表于 01-08 08:21

    ads1013有兩個(gè)模擬輸入,可以接不同的兩個(gè)模擬輸入嗎?

    ads1013有兩個(gè)模擬輸入,可以接不同的兩個(gè)模擬輸入嗎,驅(qū)動(dòng)程序中怎么分別讀兩個(gè)模擬輸入的轉(zhuǎn)換結(jié)果?
    發(fā)表于 12-02 08:02

    兩個(gè)開關(guān)電源可以并聯(lián)使用嗎

    兩個(gè)開關(guān)電源并聯(lián)使用是一個(gè)相對(duì)復(fù)雜的話題,涉及到電子電路設(shè)計(jì)、電源管理、安全規(guī)范等多個(gè)方面。 1. 開關(guān)電源的基本原理 開關(guān)電源是一種通過電子開關(guān)元件(如晶體管、MOSFET等)快速切換來控制電流
    的頭像 發(fā)表于 10-09 16:04 ?4865次閱讀

    單相電機(jī)兩個(gè)繞組都在定子上嗎

    定子和一個(gè)轉(zhuǎn)子組成。定子是電機(jī)的固定部分,而轉(zhuǎn)子是旋轉(zhuǎn)部分。在單相電機(jī)中,定子通常包含一個(gè)主繞組和一個(gè)輔助繞組,這
    的頭像 發(fā)表于 09-03 15:10 ?2203次閱讀

    ad如何設(shè)置兩個(gè)元器件的距離

    在Altium Designer(簡(jiǎn)稱AD)中設(shè)置兩個(gè)元器件之間的距離,主要是通過設(shè)置元器件間的安全間距(Clearance)規(guī)則來實(shí)現(xiàn)的。這個(gè)規(guī)則定義了元器件之間、元器件與走線之間以及其他設(shè)計(jì)元素
    的頭像 發(fā)表于 09-02 15:31 ?1.7w次閱讀

    功放機(jī)AB兩個(gè)聲道輸出怎么接

    功放機(jī)AB兩個(gè)聲道輸出的接線方式,主要取決于您想要實(shí)現(xiàn)的音頻效果以及音箱的配置。以下將詳細(xì)介紹幾種常見的接線方式,以及它們各自的特點(diǎn)和適用場(chǎng)景。 一、基礎(chǔ)接線方式 在大多數(shù)情況下,功放機(jī)的AB兩個(gè)
    的頭像 發(fā)表于 08-23 10:40 ?9443次閱讀

    單穩(wěn)態(tài)觸發(fā)器的兩個(gè)工作狀態(tài)是什么

    單穩(wěn)態(tài)觸發(fā)器是一種數(shù)字邏輯電路,廣泛應(yīng)用于各種電子設(shè)備和系統(tǒng)中。它具有兩個(gè)工作狀態(tài):穩(wěn)定狀態(tài)和暫態(tài)狀態(tài)。 單穩(wěn)態(tài)觸發(fā)器的工作原理 單穩(wěn)態(tài)觸發(fā)器是一種具有兩個(gè)穩(wěn)定狀態(tài)的觸發(fā)器,其中一個(gè)狀態(tài)是穩(wěn)定狀態(tài)
    的頭像 發(fā)表于 08-22 10:11 ?1179次閱讀

    兩個(gè)二極管反向串聯(lián)是什么元件

    兩個(gè)二極管反向串聯(lián)是一種常見的電路元件,通常被稱為雙向二極管或雙向穩(wěn)壓二極管。這種元件具有獨(dú)特的電氣特性,可以在正向和反向電壓下工作,廣泛應(yīng)用于各種電子電路中。 一、雙向二極管的工作原理 基本結(jié)構(gòu)
    的頭像 發(fā)表于 08-16 16:05 ?7952次閱讀

    二極管的伏安特性分為哪兩個(gè)部分?

    二極管是一種半導(dǎo)體器件,具有單向?qū)щ娦?。其伏安特性是描述二極管在不同電壓下電流變化的曲線。二極管的伏安特性可以分為兩個(gè)部分:正向特性和反向特性。 正向特性 正向特性是指二極管在正向偏置下,即陽極接
    的頭像 發(fā)表于 08-16 11:16 ?1722次閱讀

    觸發(fā)器的兩個(gè)穩(wěn)定狀態(tài)分別是什么

    觸發(fā)器作為數(shù)字電路中的基本邏輯單元,具有兩個(gè)穩(wěn)定狀態(tài),這兩個(gè)狀態(tài)通常用于表示二進(jìn)制數(shù)碼中的0和1。
    的頭像 發(fā)表于 08-12 11:01 ?3088次閱讀

    雙穩(wěn)態(tài)電路的兩個(gè)穩(wěn)定狀態(tài)是什么

    雙穩(wěn)態(tài)電路是一種具有兩個(gè)穩(wěn)定狀態(tài)的電子電路,廣泛應(yīng)用于數(shù)字電路、通信系統(tǒng)、存儲(chǔ)器等領(lǐng)域。 雙穩(wěn)態(tài)電路的基本概念 雙穩(wěn)態(tài)電路是一種具有兩個(gè)穩(wěn)定狀態(tài)的電路,即在沒有外部輸入信號(hào)的情況下,電路可以保持在
    的頭像 發(fā)表于 08-11 15:00 ?2660次閱讀

    雙穩(wěn)態(tài)觸發(fā)器的兩個(gè)基本性質(zhì)是什么

    的定義 雙穩(wěn)態(tài)觸發(fā)器是一種具有兩個(gè)穩(wěn)定狀態(tài)的邏輯電路,通常由兩個(gè)交叉耦合的反相器或門電路構(gòu)成。在沒有外部輸入信號(hào)的情況下,雙穩(wěn)態(tài)觸發(fā)器可以保持在兩個(gè)穩(wěn)定狀態(tài)之一,即“0”狀態(tài)或“1”狀態(tài)。 1.2 雙穩(wěn)態(tài)觸發(fā)器的組成 雙穩(wěn)態(tài)觸發(fā)
    的頭像 發(fā)表于 08-11 10:08 ?1399次閱讀

    雙穩(wěn)態(tài)觸發(fā)器的兩個(gè)穩(wěn)定狀態(tài)是什么

    雙穩(wěn)態(tài)觸發(fā)器的兩個(gè)穩(wěn)定狀態(tài)通常被稱為“0”狀態(tài)和“1”狀態(tài),這兩個(gè)狀態(tài)可以分別用來表示二進(jìn)制數(shù)碼的0和1。具體來說: 0狀態(tài) :在此狀態(tài)下,雙穩(wěn)態(tài)觸發(fā)器的輸出Q為0,而其非輸出(通常表示為Q'或Q
    的頭像 發(fā)表于 08-11 10:05 ?1949次閱讀