一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

阿里語音機器人首次實現(xiàn)與主播的實時互動 反應速度是Siri的20倍

工程師鄧生 ? 來源:獵云網(wǎng) ? 作者:獵云網(wǎng) ? 2020-11-02 17:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

10月30日消息,剛剛結束的李佳琦直播間里,剁手黨通過阿里語音機器人首次實現(xiàn)與主播的實時互動。直播過程中,數(shù)十萬用戶同時用語音回答李佳琦的提問,最終機器人在50毫秒內(nèi)就完成了語音識別和語音反饋全過程,反應速度是傳統(tǒng)語音的20倍。

淘寶直播間觀眾用語音與李佳琦互動

今年雙11期間,淘寶直播間推出 “語音猜價格”功能,觀眾在直播間也能實現(xiàn)語音交互,例如動動嘴就可以響應主播發(fā)出的猜產(chǎn)品價格任務。語音機器人成為決定這一互動過程能否順暢的關鍵。

據(jù)介紹,一場淘寶直播的觀眾數(shù)量可達百萬甚至千萬,并且用戶分布在全國各地,口音差異較大,目前主流的語音技術方案很難做到短時間內(nèi)快速響應如此體量的用戶語音,例如類似Siri識別用戶語音的響應時長就在1秒以上,無法滿足直播場景強互動的要求。

此次淘寶直播間采用了達摩院最新的移動端離線端到端語音識別技術?;谌碌木W(wǎng)絡結構和語音識別框架,即便在低配手機上,也能在50毫秒內(nèi)完成語音交互過程,速度是傳統(tǒng)語音識別的20倍;此外,該技術還解決了快語速、重口音等問題,高難度場景中的語音識別錯誤率降低近三成。

達摩院語音實驗室技術專家萬玉龍表示,“在實時性要求極高的場景,傳統(tǒng)的云端語音方案無法滿足需求,這套語音技術的創(chuàng)新在于同時實現(xiàn)了識別速度和準確度的提升,語音AI模型部署在每個用戶的淘寶直播APP上,即便直播間有千萬級別的用戶,AI也不會漏聽慢判?!?/p>

過去幾年,阿里語音AI在基礎研究和應用上取得了一系列突破。2019年,阿里語音AI入選《麻省理工評論》“全球十大突破性技術”,是唯一上榜的中國科技公司;今年7月IDC發(fā)布的《中國AI云服務市場半年度研究報告》顯示,阿里語音AI以44%的市場份額,在云上語音AI市場中位居第一。

責任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29706

    瀏覽量

    212683
  • 語音識別
    +關注

    關注

    39

    文章

    1779

    瀏覽量

    114192
  • Siri
    +關注

    關注

    4

    文章

    206

    瀏覽量

    37823
  • 阿里
    +關注

    關注

    6

    文章

    454

    瀏覽量

    33318
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器人遇上“語言障礙”:CCLINKIE轉Profinet的“破冰外掛”來啦\\!

    的時間); 即插即用部署:某國產(chǎn)車企焊裝線實測,無需修改原有PLC程序,3小時完成網(wǎng)關部署,改造后機器人響應速度提升8,單班產(chǎn)能增加120臺。 三、從“設備孤島”到“協(xié)同作戰(zhàn)” 在新能源汽車電驅產(chǎn)線
    發(fā)表于 06-04 14:31

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    的四核1.4GHz處理器具備強勁的運算性能,能夠高效處理語音機器人運行過程中的復雜任務。語音識別和合成需要大量的計算資源,該處理器可以快速對語音信號進行分析、處理和轉換。在
    發(fā)表于 05-28 11:36

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機器人開發(fā)套件 Kria KR260機器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    詳細介紹機場智能指路機器人的工作原理

    和周圍環(huán)境變化。激光雷達和攝像頭持續(xù)檢測前方是否有障礙物,一旦發(fā)現(xiàn)障礙物,導航系統(tǒng)會立即調(diào)整路徑,引導機器人避開障礙物,確保行走安全。同時,機器人會根據(jù)實時的人流情況,動態(tài)調(diào)整行走速度
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+內(nèi)容初識

    講解了如何在 ROS 2 中實現(xiàn)機器人的運動控制,包括速度控制、位置控制等。通過編寫運動控制節(jié)點,可以接收來自上層的控制指令,如速度指令或目標位置指令,然后通過底層的驅動程序控制
    發(fā)表于 04-27 11:24

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    識別聯(lián)調(diào)。 進迭時空致力于為智能機器人提供完整全棧優(yōu)化的RISC-V AI軟硬件解決方案,第一代RISC-V AI CPU芯片K1已完成AI視覺感知、AI語音處理、自動避障、路徑規(guī)劃、運動控制等
    發(fā)表于 04-25 17:59

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎模塊

    ,一次生成深度信息。 自主機器人定位任務的本質是對機器人自身狀態(tài)的估計問題,包括位置,朝向,速度等問題。 路徑規(guī)劃旨在找到從起點到目標區(qū)域的路徑,確保路徑的可行性和最優(yōu)性。路徑規(guī)劃方法包括變分方法,圖搜
    發(fā)表于 01-04 19:22

    開源項目!能夠精確地行走、跳舞和執(zhí)行復雜動作的機器人—Tillu

    認識Tillu——機器人 Tillu是一款融合先進機器人技術與創(chuàng)造力的獨特機器人,旨在激發(fā)學習與創(chuàng)新!它由運行Debian操作系統(tǒng)的UNIHIKER驅動,利用強大的控制系統(tǒng)實現(xiàn)逼真的動
    發(fā)表于 01-02 17:24

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    中取得了令人矚目的效果。 閱讀感悟 從傳統(tǒng)的手動編程到借助大模型實現(xiàn)智能化、自主化,從單一模態(tài)的交互到多模態(tài)信息的深度融合,再到擴散模型的應用,機器人控制技術正在以驚人的速度進化。這不僅讓機器
    發(fā)表于 12-29 23:04

    【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能

    現(xiàn)狀和前沿研究,詳細介紹大模型的構建方法、訓練數(shù)據(jù)、模型架構和優(yōu)化技術。 第4部分(第10章到第13章)深入探討提升機器人計算實時性、算法安全性、系統(tǒng)可靠性及具身智能數(shù)據(jù)挑戰(zhàn)的具身智能機器人系統(tǒng)研究
    發(fā)表于 12-28 21:12

    【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    解決許多技術的和非技術的挑戰(zhàn),如提高智能體的自主性、處理復雜環(huán)境互動的能力及確保行為的倫理和安全性。 未來的研究需要將視覺、語音和其他傳感技術與機器人技術相結合,以探索更加先進的知識表示和記憶模塊,利用強化學習進一步優(yōu)化決策過程
    發(fā)表于 12-20 19:17

    《具身智能機器人系統(tǒng)》第1-6章閱讀心得之具身智能機器人系統(tǒng)背景知識與基礎模塊

    ,互聯(lián)網(wǎng)行業(yè)占成熟經(jīng)濟體的GDP增長的21%,世界經(jīng)濟正面向數(shù)字經(jīng)濟轉型的大趨勢。具身智能機器人集成人工智能、高端制造、新材料等技術,其核心在于通過智能體與環(huán)境的動態(tài)互動實現(xiàn)智能行為。 在第2章“具身
    發(fā)表于 12-19 22:26

    湯姆貓發(fā)布AI語音情感陪伴機器人研發(fā)進展

    ,能夠智能識別聲音來源的位置與方向,實現(xiàn)120°的自由轉頭,確保始終面向用戶進行語音對話。這一設計不僅增強了機器人互動性,還大大提升了用戶的溝通體驗。 此外,湯姆貓AI
    的頭像 發(fā)表于 12-17 11:27 ?1262次閱讀

    機器人語音功能

    經(jīng)典卡通角色的聲音成為了它們的“名片”。那么,機器人語音功能究竟是如何實現(xiàn)的?它與智能模組有什么關系?誰是這類服務機器人語音“指揮官”?
    的頭像 發(fā)表于 12-02 10:50 ?1129次閱讀

    語音識別機器人的工作原理

    語音識別機器人的工作原理主要基于一系列復雜的技術流程,包括信號采集、預處理、特征提取、聲學模型匹配、語言模型預測以及最終的解碼輸出。 一、信號采集 語音識別機器人首先通過麥克風等音頻輸
    的頭像 發(fā)表于 10-25 09:25 ?1071次閱讀