一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

對話式AI的概念、工作原理及應用領域

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-05-13 10:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對話式 AI 是一種綜合運用多種技術的復雜的人工智能形式,能夠使人機間實現(xiàn)類似于真人的交互。復雜系統(tǒng)能夠識別語音和文本、理解意圖、識別特定語言的習語和格言,并且能夠以適當?shù)淖匀徽Z言做出回應。

什么是對話式 AI?

對話式 AI 是應用機器學習來開發(fā)基于語言的應用程序,使人們能夠通過語音與設備、機器和計算機進行自然交互。

無論是虛擬助手在早上喚醒您,還是您詢問通勤路線,或者您在網購時與聊天機器人進行交流,這些情況中您均在使用對話式 AI。您用正常的聲音說話,而設備可以理解并找到適當答案,然后用聽起來自然的聲音回復您。

對話式 AI 的應用程序有多種形式。最簡單的是 FAQ 機器人,它們經過訓練,可以從具有預先格式化答案的定義數(shù)據(jù)庫中回復查詢(通常是以書面形式表達)。一種更復雜的對話式 AI 形式是虛擬個人助理,例如 Amazon 的 Alexa、Apple 的 Siri 和 Microsoft 的 Cortana。這些工具設備經過調節(jié),可以回應簡單的請求。

虛擬客戶助理是一種更專業(yè)的個人助理版本,它能夠理解上下文,從一個互動到下一個互動進行對話。另一種專門的對話式 AI 形式是虛擬員工助理,它可以了解員工與軟件應用程序和工作流程之間的互動情況,并提出改進建議。虛擬員工助理廣泛用于機器人流程自動化這一熱門的新軟件類別。

為何選擇對話式 AI?

對話式 AI 是人類與智能機器和應用程序(從機器人和汽車到家庭助理和移動應用)互動的基本構建塊。讓計算機理解人類語言及所有細微差別,并做出適當?shù)姆磻?,這是 AI 研究人員長期以來的追求。但是,在采用加速計算的現(xiàn)代 AI 技術出現(xiàn)之前,構建具有真正自然語言處理 (NLP) 功能的系統(tǒng)是無法實現(xiàn)的。

在過去幾年中,深度學習改進了對話式 AI 的技術水平,并且在某些任務上提供了超人的準確性。深度學習還降低了構建語言服務時,對語言學和基于規(guī)則的技術的深度知識的需求,從而在零售、醫(yī)療健康和金融等行業(yè)中得到了廣泛采用。

現(xiàn)如今,人們對高級對話式 AI 工具的需求日益增加。預計到 2020 年,50% 的搜索結果將由語音執(zhí)行,且到 2023 年,將有 80 億個數(shù)字語音助手投入使用。

對話式 AI 的工作原理是什么?

回答問題的步驟如下:將用戶語音轉換為文本,理解文本含義,搜索符合上下文的適當應答,最后使用文本轉語音工具提供應答。對話式 AI 流程通常由三個階段組成:

自動語音識別 (ASR)

自然語言處理 (NLP) 或自然語言理解 (NLU)

帶有語音合成的文本轉語音 (TTS)

每一步都需要運行多個 AI 模型,因此每個單獨網絡的可用執(zhí)行時間約為 10 毫秒或更短。

自動語音識別 (ASR) 會收錄人類語音,然后將其轉換為可讀文本。深度學習在識別音素時具有更高的準確性,已經取代了傳統(tǒng)的統(tǒng)計方法,如隱馬爾可夫模型和高斯混合模型。

6b1102ae-cc5e-11ec-bce3-dac502259ad0.png

自然語言理解 (NLU) 會錄入文本,理解上下文和意圖,然后生成智能回復。深度學習模型能對眾多上下文和語言準確進行泛化處理,因此應用于 NLU。Transformer 深度學習模型,如 BERT(Transformer 雙向編碼器表征模型),是時間遞歸神經網絡的一個替代方案,它應用了一種注意力技術—通過將注意力集中在前后最相關的詞上來解析一個句子。BERT 通過在問答 (QA)、實體識別、意圖識別、情感分析等基準上提供與人類基準相媲美的準確性,徹底改變了 NLU 的進展。

6b2df3e6-cc5e-11ec-bce3-dac502259ad0.png

對話式 AI 流程的最后一個階段是將 NLU 階段生成的文本響應改為自然發(fā)音的語音。聲清晰度是通過使用深度神經網絡實現(xiàn)的,生成類似人類的語調和清晰的單詞發(fā)音。此步驟是通過兩個網絡完成的:一個根據(jù)文本生成頻譜圖的合成網絡,一個從頻譜圖生成波形的聲碼器網絡。

GPU:對話式 AI 的關鍵

對話式 AI 背后的技術十分復雜,涉及多步驟過程,需要大量的功耗計算,并要在 300 毫秒內完成大量計算,才能提供優(yōu)質的用戶體驗。

一個由數(shù)百個核心組成的 GPU,可以并行處理數(shù)千個線程。這使得 GPU 成為訓練深度學習模型和執(zhí)行推理的首選平臺,因為它們的性能比純 CPU 平臺高 10 倍。

借助 NVIDIA GPU 和 NVIDIA CUDA-X AI 庫,可快速訓練和優(yōu)化大量的先進語言模型,從而在幾毫秒或幾千分之一秒內運行推理。這是一項重大進步,可以結束快速 AI 模型與大型復雜 AI 模型之間的權衡。

此外,像 BERT 這樣的基于 Transformer 深度學習模型不需要按順序處理連續(xù)數(shù)據(jù),與遞歸神經網絡相比,可以在 GPU 上實現(xiàn)更多的并行化,并減少訓練時間。

6b83d766-cc5e-11ec-bce3-dac502259ad0.jpg

NVIDIA GPU 助力加速先進的對話式 AI 技術:

自動語音識別 (ASR):Kaldi 是一種 C++ 工具包,支持傳統(tǒng)方法以及用于 ASR 的熱門深度學習模型。GPU 加速的 Kaldi 解決方案的執(zhí)行速度比實時音頻快 3500 倍,比只用 CPU 的方案快 10 倍。

自然語言理解 (NLU):在與復雜語言模型協(xié)作時,NVIDIA GPU 的并行處理能力和 Tensor Core 架構可實現(xiàn)更高的吞吐量和可擴展性,從而為 BERT 的訓練和推理提供突破性的性能。利用 NVIDIA T4,GPU 加速的 BERT-base 進行推理的速度比單純的 CPU 解決方案快 17 倍。BERT 使用無監(jiān)督式學習方法的能力、使用預訓練模型進行遷移學習的能力,以及使用 GPU 進行加速的能力,均使其在行業(yè)中得到廣泛應用。為實現(xiàn)真正的對話式 AI,語言模型變得越來越大。未來的模型將比現(xiàn)在使用的大很多倍,因此 NVIDIA 構建并開源了迄今為止最大的基于 Transformer 的 AI:GPT-2 8B,這是一種內含 83 億參數(shù)的語言處理模型,比 BERT 大 24 倍。

文字轉語音 (TTS):熱門文本轉語音深度學習模型(GPU 加速的 Tacotron2 和 Waveglow)使用 NVIDIA T4 GPU 執(zhí)行推理的速度比僅使用 CPU 的 解決方案快 9 倍。

對話式 AI 用例

GPU 優(yōu)化的語言理解模型可集成到醫(yī)療健康、零售和金融服務等行業(yè)的 AI 應用程序中,為智能揚聲器和客戶服務領域中的高級數(shù)字語音助手提供支持。通過使用這些高質量的對話式 AI 工具,各個領域的企業(yè)在與客戶交流時,均可實現(xiàn)前所未有的個性化服務標準。

醫(yī)療健康

醫(yī)療健康面臨的困難之一是難以獲得。打醫(yī)生辦公室電話并一直等待的情況十分常見,與索賠代表聯(lián)系可能同樣困難。通過實施自然語言處理 (NLP) 來訓練聊天機器人是醫(yī)療健康行業(yè)的一項新興技術,可以解決醫(yī)療專業(yè)人員的短缺問題,并開創(chuàng)與患者的溝通渠道。

NLP 的另一個重要的醫(yī)療健康應用程序是生物醫(yī)學文本挖掘(或 BioNLP)。鑒于生物文獻數(shù)量眾多,以及生物醫(yī)學出版速度不斷提高,自然語言處理是一個關鍵的工具,可以在已發(fā)表的研究中提取信息,推動生物醫(yī)學領域的知識進步,協(xié)助藥物研發(fā)和疾病診斷。

金融服務

自然語言處理 (NLP) 是為金融服務公司構建更好的聊天機器人和 AI 助理的關鍵組成部分。在眾多用于基于 NLP 的應用程序的語言模型中,BERT 已成為機器學習領域 NLP 的領軍者及語言模型。借助 AI,NVIDIA 近期打破了 BERT 訓練速度的記錄,有助于釋放未來幾年內在線提供的數(shù)十億預期對話式 AI 服務的潛力,使其達到人類水平的理解能力。例如,銀行可以使用 NLP 來評估信用記錄很少或沒有信用記錄的客戶信譽。

零售

聊天機器人技術還常用于零售應用程序,能夠準確分析客戶查詢,并生成回復或建議。這可簡化客戶流程,并提高商店運營效率。NLP 還用于文本挖掘客戶反饋和情感分析。

對話式 AI 的優(yōu)勢

對此有許多答案。其中一點是人力成本很高。雖然成本差異很大,但根據(jù) F.Curtis Barry 公司的數(shù)據(jù),一個客服電話的全部成本介于 2.70 美元到 5.60 美元之間,其他公司估算的平均價格也要達到每分鐘一美元左右。將人工操作員替換為機器人,這具有顯著節(jié)約成本的優(yōu)勢。研究還表明,相較于銷售或客戶服務智能體,許多人更喜歡與電腦對話,這使得對話式 AI 成為客戶自助服務的實現(xiàn)者。

在許多場景中,比如一個人正在開車或忙于其他事情,又或者在電梯中無法使用鍵盤時,對話式 AI 比鍵盤交互更加合適。

核心技術還可用于解釋或完善模糊查詢,或解釋使用不同語言的人的查詢。

Gartner 認為,85% 的客戶與企業(yè)的關系無需人工交互即可處理,McKinsey 公司估計,全球約 60% 的職業(yè)中的有三分之一的活動可以使用這項技術。

NVIDIA GPU 加速的對話式 AI 工具

借助對話式 AI 部署服務似乎令人生畏,但 NVIDIA 擁有可以簡化這一過程的工具,包括神經模組(簡稱 NeMo)和一項名為 NVIDIA Riva 的新技術。為節(jié)省時間,預訓練模型、訓練腳本和性能結果可在 NVIDIA GPU Cloud (NGC) 軟件中心獲得。

6b9576ec-cc5e-11ec-bce3-dac502259ad0.png

NVIDIA Riva 是一種 GPU 加速應用程序框架,允許公司使用視頻和語音數(shù)據(jù),為自己的行業(yè)、產品和客戶定制最先進的對話式 AI 服務。

Riva 提供用于對話式 AI 的端到端深度學習流程。它包含先進的深度學習模型,例如用于自然語言理解的 NVIDIA Megatron BERT。企業(yè)可以利用 NVIDIA NeMo 進一步在數(shù)據(jù)上調優(yōu)這些模型,利用 NVIDIA TensorRT 優(yōu)化推理,并利用 NGC(NVIDIA 的 GPU 優(yōu)化軟件目錄)上提供的 Helm 圖表在云端和邊緣進行部署。

使用 Riva 構建的應用程序可以利用新款 NVIDIA A100 Tensor Core GPU 中的創(chuàng)新技術進行 AI 計算,并利用 NVIDIA TensorRT 的新型優(yōu)化技術進行推理。這使得使用功能強大的視覺和語音模型能夠運行整個多模態(tài)應用程序,并且速度比實時交互的 300 毫秒閾值還要快。

NVIDIA GPU 加速的端到端數(shù)據(jù)科學

基于 CUDA 構建的 RAPIDS 開源軟件庫套件使您能夠完全在 GPU 上執(zhí)行端到端數(shù)據(jù)科學和分析流程,同時仍然使用 Pandas 和 Scikit-Learn API 等熟悉的界面。

6ba988c6-cc5e-11ec-bce3-dac502259ad0.png

NVIDIA GPU 加速的深度學習框架

GPU 加速深度學習框架為設計和訓練自定義深度神經網絡帶來靈活性,并為 Python 和 C/C++ 等常用編程語言提供編程接口。MXNet、PyTorch、TensorFlow 等廣泛使用的深度學習框架依賴于 NVIDIA GPU 加速庫,能夠提供高性能的多 GPU 加速訓練。

6bc1a1fe-cc5e-11ec-bce3-dac502259ad0.png

對話式 AI 在 NVIDIA 平臺的未來

推動基于 Transformer 語言網絡(如 BERT 和 GPT-2 8B)的大規(guī)模性能的要求,即其純粹的復雜性以及對龐大數(shù)據(jù)集的預訓練。這種組合需要一個可靠的計算平臺來處理所有必要的計算,以推動快速執(zhí)行和準確性。這些模型可以在大量無標記數(shù)據(jù)集上工作,這使得它們成為現(xiàn)代 NLP 的創(chuàng)新中心,而且,對于即將在眾多用例中采用對話式 AI 應用程序的新一波智能助手來說,這是一個強有力的選擇。

帶有 Tensor Core 體系架構的 NVIDIA 平臺提供可編程性,以加速各種不同的現(xiàn)代 AI,包括基于 Transformer 的模型。此外,數(shù)據(jù)中心規(guī)模設計和 DGX SuperPOD 的最優(yōu)化,與軟件庫和先進 AI 框架的直接支持相結合,為開發(fā)者提供了無縫的端到端平臺,以承擔艱巨的 NLP 任務。

NGC(NVIDIA 加速軟件中心)免費提供持續(xù)優(yōu)化,以便加速 BERT 和 Transformer 在多個框架上的 GPU 訓練。

NVIDIA TensorRT 包括對 BERT 和基于 Transformer 的大型模型運行實時推理的優(yōu)化。如需了解更多信息,請查看我們的“對話式 AI 實時 BERT 推理”博客。NVIDIA 的 BERT GitHub 倉庫今天也有代碼,可以重現(xiàn)本博客中引用的單節(jié)點訓練性能,在不久的將來,該倉庫將更新必要的腳本,以重現(xiàn)大規(guī)模訓練性能的數(shù)字。

原文標題:NVIDIA 大講堂 | 什么是對話式 AI ?

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106448
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4949

    瀏覽量

    131276
  • AI
    AI
    +關注

    關注

    88

    文章

    35167

    瀏覽量

    280105

原文標題:NVIDIA 大講堂 | 什么是對話式 AI ?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    鎖存器的工作原理與作用

    鎖存器(Latch)作為數(shù)字電路中的基本元件,扮演著存儲單個比特信息的關鍵角色。其獨特的功能和廣泛的應用領域使其成為數(shù)字電路設計和實現(xiàn)的核心組成部分。本文將深入探討鎖存器的基本概念工作原理、類型、主要作用以及
    的頭像 發(fā)表于 02-03 16:53 ?2407次閱讀

    隔離收發(fā)器的工作原理與作用

    隔離收發(fā)器是一種在通信、控制和數(shù)據(jù)傳輸?shù)?b class='flag-5'>領域中廣泛應用的電子器件。其核心功能在于通過電氣隔離技術,確保不同電路之間不會直接連接,從而有效防止噪聲和干擾的傳遞。本文將詳細解析隔離收發(fā)器的原理和作用,深入探討其結構、
    的頭像 發(fā)表于 02-03 16:16 ?688次閱讀

    微型壓力傳感器的工作原理應用領域

    深入探討微型壓力傳感器的工作原理、應用領域、重要指標以及校準方法,以揭示其背后的科技奧秘。 微型壓力傳感器的工作原理 微型壓力傳感器的工作原理基于物理學的壓力感應原理,即當外界壓力作用
    的頭像 發(fā)表于 01-17 16:17 ?711次閱讀
    微型壓力傳感器的<b class='flag-5'>工作原理</b>與<b class='flag-5'>應用領域</b>

    多線示波器的原理和應用領域

    多線示波器是一種電子測量儀器,其原理和應用領域可以歸納如下:一、原理多線示波器在普通示波器原理的基礎上,采用了雙線(或多線)示波法。這種方法使得示波器能夠同時顯示多個波形。其基本原理是,示波器利用
    發(fā)表于 01-07 15:34

    HarmonyOS NEXT 應用開發(fā)練習:AI智能對話

    一、練習內容 在這個HarmonyOS NEXT原生應用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個功能更為豐富的AI智能對話框。這個對話框不僅具備基本的聊天功能,還能展示圖片消息、表情符號,并
    發(fā)表于 01-03 11:29

    增量編碼器:工作原理、應用與優(yōu)勢解析

    深入探討增量編碼器的工作原理應用領域及其顯著優(yōu)勢,幫助您更好地理解這一技術的重要性。 工作原理揭秘 增量編碼器通過檢測旋轉軸的相對位置
    的頭像 發(fā)表于 11-27 08:57 ?2947次閱讀
    增量<b class='flag-5'>式</b>編碼器:<b class='flag-5'>工作原理</b>、應用與優(yōu)勢解析

    氦質譜檢漏儀的工作原理 氦質譜檢漏儀的應用領域

    氦質譜檢漏儀是一種高精度的檢漏設備,它利用氦氣作為示蹤氣體,通過質譜分析技術來檢測系統(tǒng)中的微小漏率。以下是關于氦質譜檢漏儀工作原理應用領域的介紹: 氦質譜檢漏儀的工作原理 示蹤氣體的選擇 : 氦氣
    的頭像 發(fā)表于 11-26 15:01 ?1998次閱讀

    行程開關的工作原理 行程開關的應用領域

    行程開關,也被稱為限位開關,是一種機電開關,其工作原理應用領域如下: 行程開關的工作原理 機械結構 :行程開關主要由操作頭、觸點系統(tǒng)、彈簧和外殼等組成。操作頭通常是一個可以移動的部
    的頭像 發(fā)表于 11-26 09:12 ?2597次閱讀

    成像器件的工作原理是什么

    工作原理 1. 成像器件的分類 成像器件可以根據(jù)其工作原理應用領域進行分類。主要的成像器件類型包括: 電荷耦合器件(Charge-Coupled Device, CCD) :是一種基于半導體材料的成像器件,通過電荷的存儲和轉
    的頭像 發(fā)表于 10-14 14:05 ?1122次閱讀

    光電三極管的基本概念工作原理

    光電三極管,又稱為光敏三極管或光控三極管,是一種重要的光電轉換器件,能夠將光信號轉化為電流或電壓信號。這種器件在光電通信、光電測量、光電控制等領域有著廣泛的應用。下面,我們將詳細探討光電三極管的基本概念、工作原理以及其在不同
    的頭像 發(fā)表于 09-24 11:08 ?4927次閱讀

    光耦的應用領域

    發(fā)射和光敏器件的光譜匹配理想,響應速度快,傳輸效率高。容易與邏輯電路連接. 無觸點、壽命長、體積小、耐沖擊,工作溫度范圍寬,符合工業(yè)和民用溫度標準。 二.應用領域 光耦廣泛應用于各個領域。常見
    發(fā)表于 08-26 16:59

    DC-DC升壓模塊的工作原理

    DC-DC升壓模塊的工作原理是一個復雜但高效的過程,它基于電感器的能量存儲和釋放機制,通過開關器件的快速通斷來實現(xiàn)電壓的升高。以下是對DC-DC升壓模塊工作原理的詳細闡述,包括其組成部分、工作過程、特點及
    的頭像 發(fā)表于 08-23 10:34 ?4734次閱讀

    光耦的工作原理應用領域

    光耦(Optical Coupler),又稱光電隔離器或光電耦合器,是一種采用光學原理進行信號傳輸和轉換的電子元件。其工作原理基于光電效應,通過光的傳輸來實現(xiàn)電信號的隔離與轉換,具有高隔離性能、抗干擾能力強、體積小、壽命長等優(yōu)點,在電子電路中得到了廣泛應用。
    的頭像 發(fā)表于 08-15 10:53 ?3441次閱讀

    Buck-Boost型變換器的工作原理應用領域

    電子設備中廣泛應用,特別是在需要靈活調節(jié)電壓的場合。以下是對Buck-Boost型變換器的詳細闡述,包括其工作原理、性能特點、應用領域等方面。
    的頭像 發(fā)表于 08-14 11:53 ?4591次閱讀

    電壓跟隨器的工作原理應用領域

    電壓跟隨器是一種常見的電子電路,其主要作用是將輸入信號的電壓值不變地傳遞到輸出端,同時具有一定的電流驅動能力。 一、電壓跟隨器的工作原理 電壓跟隨器的基本結構 電壓跟隨器通常由一個運算放大器
    的頭像 發(fā)表于 08-07 14:52 ?5443次閱讀