一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

三星無聲語音助手專利解密:可以完成精準語音識別任務

ss ? 來源:愛集微APP ? 作者:愛集微APP ? 2021-02-12 15:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【嘉德點評】三星發(fā)明的可以完成精準語音識別任務的語音識別助手,在交互時無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復雜的交互任務,因此,可以簡便且準確地采用語音識別方式來實現(xiàn)交互任務。

集微網(wǎng)消息,在2019年,三星就曾預告過新的“人造人”NEON助手,并表示NEON可以像真正的人類一樣進行對話,并有一定的感知能力。NEON的網(wǎng)站上宣傳其外觀和行為都像真實的人類,能夠表現(xiàn)出情感和智慧,而據(jù)相關消息,三星最終將隨三星Galaxy S21 Ultra獨家發(fā)售這款數(shù)字助手。

數(shù)字助手首先也是一款手機助手軟件,目前,智能手機能夠提供各種類型的應用服務,其中就包括手機助手軟件,用戶可以通過語音、文字等方式與智能手機之間進行交互,智能手機通過該語音識別助手軟件識別語音后,提供對應的應用服務。

智能手機識別語音的功能可以有三種方式:交互任務型、知識問答型及閑聊型。其中,交互任務型語音識別方式使得用戶可以通過直接的語音輸入,由智能手機識別該語音,完成與智能手機的應用服務之間的交互意圖,而無需進行多次語音識別界面的操作。

但是,智能手機提供的交互任務型語音識別方式對用戶來說,使用率并不高,這是因為用戶在通過語音操控智能手機時,存在以下缺點:1)公眾場合不適合使用語音,有隱私問題;2) 智能手機處于嘈雜的遠程環(huán)境下,語音識別的效果不佳;3)因為用戶發(fā)音不準確,形同意思的表述方式多樣等因素,語音識別和語音理解的準確率還需要提高;4)有些用戶不習慣使用智能手機提供的語音識別界面。

那么,智能手機該如何在這些條件下簡便且準確地采用語音識別方式實現(xiàn)交互任務呢?為此,三星在2019年9月27日申請了一項名為“一種采用語音識別方式實現(xiàn)交互任務的方法及系統(tǒng)”的發(fā)明專利(申請?zhí)枺?01910921533.6),申請人為三星電子(中國)研發(fā)中心和三星電子株式會社。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項應用于智能設備的語音識別方法及系統(tǒng)吧。

如上圖,為該專利中發(fā)明的采用語音識別方式實現(xiàn)交互任務的方法流程示意圖,首先,系統(tǒng)會基于當前環(huán)境進行語音識別來得到文本以及語義信息,基于得到的文本以及語義信息,來確定對應的上下文信息,且劃分不同的場景,基于不同的場景來在系統(tǒng)中匹配不同的語音技能推薦表。

這種利用語音技能推薦表的方式,可以更加準確的應對不同的場景,通過事先準備好豐富的語料庫,就可以非常人性化的與用戶進行對話以及完成相應的操作。而當要實現(xiàn)交互任務時,則會根據(jù)語音技能推薦表執(zhí)行智能手機的交互任務。同時,由于是智能助手主動分析用戶所處場景,并主動提供相關的操作服務,因此無需用戶主動發(fā)起語音喚醒,而是由語音助手主動為用戶提供相關服務,只需用戶進行選擇即可。

如上圖,為這種采用語音識別方式實現(xiàn)交互任務的方法子流程圖,當用戶喚醒語音助手插件模塊時,語音助手插件模塊被觸發(fā),該模塊通知語言輸入信息采集模塊啟動信息采集,信息采集模塊通過上下文感知模塊獲取到當前的環(huán)境信息,再向語音助手插件模塊發(fā)送請求,來獲取從用戶語音識別得到的文本,以及做自然語言理解后的語義信息。

之后,語言輸入信息采集模塊將采集到的文本、語義信息及當前的環(huán)境信息傳輸給語言技能生成模塊,由此來生成語言技能庫,并通知語言技能推薦模塊。

語言技能推薦模塊在特定情況下可以啟動,將大量不同的上下文劃分到若干類場景中,對每個場景生成相應的語言技能推薦表。

如上圖,為在手機上使用語言技能推薦表的展示圖,該款語音助手插件模塊為Bixby,當每次都調(diào)用Bixby時,都會顯示出語言技能推薦表,并且場景不同,該語言技能推薦表中的推薦技能偶讀不同。

例如,經(jīng)過學習后,如果用戶打開手機并且喚醒了Bixby,則就可以觸發(fā)語言技能推薦表的展示,當用戶選擇某條推薦的語言技能時,將該語言技能推薦表中的文本用作用戶語言輸入識別的結(jié)果,以完成后續(xù)用戶的指令。

以上就是三星發(fā)明的可以完成精準語音識別任務的靜默式語音識別助手,其在實現(xiàn)交互任務時,基于當前環(huán)境下對語音識別得到文本以及語音信息,在交互時無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復雜的交互任務,因此可以簡便且準確地采用語音識別方式來實現(xiàn)交互任務。

責任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 三星電子
    +關注

    關注

    34

    文章

    15888

    瀏覽量

    182338
  • 語音助手
    +關注

    關注

    7

    文章

    241

    瀏覽量

    27158
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    芯知識|語音芯片發(fā)碼無聲解析:上電無聲、連發(fā)指令才響的大根源及解決之道

    在嵌入式語音方案開發(fā)中,廣州唯創(chuàng)電子語音芯片(如WT系列)以其高性價比和易用性廣受青睞。但當開發(fā)者遭遇“上電發(fā)碼無聲”或“必須連發(fā)兩次指令才有聲音”的問題時,往往陷入調(diào)試困境。本文將深入剖析這些現(xiàn)象
    的頭像 發(fā)表于 06-19 09:14 ?185次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片發(fā)碼<b class='flag-5'>無聲</b>解析:上電<b class='flag-5'>無聲</b>、連發(fā)指令才響的<b class='flag-5'>三</b>大根源及解決之道

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    的四核1.4GHz處理器具備強勁的運算性能,能夠高效處理語音機器人運行過程中的復雜任務語音識別和合成需要大量的計算資源,該處理器可以快速對
    發(fā)表于 05-28 11:36

    空調(diào)語音控制方案NRK3501語音識別芯片-讓智能生活觸手可及!

    NRK3501語音識別芯片支持離線語音控制空調(diào),精準識別,遠場降噪,最多支持200條離線指令,5米內(nèi)識別
    的頭像 發(fā)表于 01-07 11:40 ?686次閱讀
    空調(diào)<b class='flag-5'>語音</b>控制方案NRK3501<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片-讓智能生活觸手可及!

    語音識別技術在醫(yī)療領域的應用

    語音識別技術在醫(yī)療領域的應用已經(jīng)越來越廣泛,為醫(yī)療服務帶來了諸多便利和效率提升。以下是對語音識別技術在醫(yī)療領域應用的介紹: 一、語音病歷
    的頭像 發(fā)表于 11-26 09:35 ?1200次閱讀

    語音識別與自然語言處理的關系

    在人工智能的快速發(fā)展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音,而自然語言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?1490次閱讀

    語音識別技術的應用與發(fā)展

    語音識別技術的發(fā)展可以追溯到20世紀50年代,但直到近年來,隨著計算能力的提升和機器學習技術的進步,這項技術才真正成熟并廣泛應用于各個領域。語音識別
    的頭像 發(fā)表于 11-26 09:20 ?1624次閱讀

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動語音識別)與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、技術基礎 ASR : 基于深度學習算
    的頭像 發(fā)表于 11-18 15:22 ?1337次閱讀

    ASR語音識別技術應用

    ASR(Automatic Speech Recognition)語音識別技術,是計算機科學與人工智能領域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應用于智能家居、醫(yī)療、交通等多個領域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?2056次閱讀

    基于Arm Neoverse N2實現(xiàn)自動語音識別技術

    自動語音識別 (Automatic Speech Recognition) 技術已經(jīng)深入到現(xiàn)代生活的方方面面,廣泛應用于從語音助手、轉(zhuǎn)錄服務,到呼叫中心分析和
    的頭像 發(fā)表于 11-15 11:35 ?1094次閱讀
    基于Arm Neoverse N2實現(xiàn)自動<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術

    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識別方案_離線語音識別芯片分析

    01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用離線語音識別芯片 物聯(lián)網(wǎng)系統(tǒng)中使用離線語音識別芯片的原因主要基于以下幾個方面: 1、實時性與可靠性 實時性好:離線語音
    的頭像 發(fā)表于 09-26 17:56 ?1589次閱讀
    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的<b class='flag-5'>語音</b><b class='flag-5'>識別</b>方案_離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片分析

    WTK6900FC語音識別模塊

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月25日 17:35:07

    唯創(chuàng)知音WT2605C用在離在線語音識別方案# #語音芯片 #語音識別 #唯創(chuàng)知音

    語音識別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月12日 17:24:28

    三星Bixby語音助手即將進軍家電產(chǎn)品,實現(xiàn)自然語言交互

     三星宣布,Bixby語音助手即將全面進駐BESPOKE AI系列家電,用戶可通過自然語言對家電進行語音控制。Bixby作為三星智能手機、手
    的頭像 發(fā)表于 08-26 17:20 ?1262次閱讀

    什么是離線語音識別芯片?與在線語音識別的區(qū)別

    離線語音識別芯片適用于智能家電等,特點為小詞匯量、低成本、安全性高、響應快,無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、識別準確率高,但依賴穩(wěn)定網(wǎng)絡。
    的頭像 發(fā)表于 07-22 11:33 ?949次閱讀

    ESP32-WROOM跑了官方的語音識別中的asr例程,但是切換到語音識別就會出錯的原因?

    我是用的是ESP32-WROOM芯片,用的Vscode+IDF+ADF,我跑了一下官方的語音識別中的asr例程,但是我發(fā)現(xiàn),語音喚醒可以,但是一旦切換到
    發(fā)表于 07-19 08:27