一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌宣布開(kāi)源Android語(yǔ)音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe的語(yǔ)音引擎

SwM2_ChinaAET ? 來(lái)源:lq ? 2019-10-01 17:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌在其開(kāi)源博客中宣布開(kāi)源 Android 語(yǔ)音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe 的語(yǔ)音引擎(Live Transcribe Speech Engine),它旨在將語(yǔ)音或?qū)υ?huà)實(shí)時(shí)轉(zhuǎn)錄為文字,還能夠?yàn)槁?tīng)障人士提供幫助。

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 應(yīng)用程序,它的語(yǔ)音識(shí)別由谷歌最先進(jìn)的 Cloud Speech API 提供。但是,依賴(lài)于云引入了一些復(fù)雜性,不斷變化的網(wǎng)絡(luò)連接、數(shù)據(jù)成本和延遲的魯棒性等等都帶來(lái)一些考驗(yàn)。因此,谷歌把它開(kāi)源出來(lái), 希望開(kāi)發(fā)人員在已有的基礎(chǔ)上進(jìn)一步構(gòu)建和開(kāi)發(fā)。

Cloud Speech API 目前無(wú)法支持無(wú)限的音頻流,團(tuán)隊(duì)目前采取了一些措施來(lái)解決這一難題,例如在達(dá)到超時(shí)之前關(guān)閉并重新啟動(dòng)流式傳輸請(qǐng)求,這將有效減少會(huì)話(huà)中丟失的文本量。

無(wú)限流媒體音頻帶來(lái)了一大挑戰(zhàn)。在許多國(guó)家,網(wǎng)絡(luò)數(shù)據(jù)非常昂貴,并且在互聯(lián)網(wǎng)較差的地方,帶寬可能有限。Live Transcribe Speech Engine 的團(tuán)隊(duì)對(duì)音頻編解碼器進(jìn)行了大量實(shí)驗(yàn),并最終在不影響精度的情況下將數(shù)據(jù)使用量減少了 10 倍。

另外,由于是提供實(shí)時(shí)語(yǔ)音轉(zhuǎn)錄,轉(zhuǎn)錄出來(lái)的文本會(huì)隨著語(yǔ)音的輸入不斷發(fā)生變化,降低延遲自然十分必要。該引擎能夠大大降低延遲率,這都要?dú)w功于它的自定義 Opus 編碼器

此外,值得一提的是,Live Transcribe 支持超過(guò) 70 種語(yǔ)言,并能夠根據(jù)語(yǔ)音自動(dòng)識(shí)別語(yǔ)種,其中也包括中文。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1178

    瀏覽量

    42016
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108199
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114261

原文標(biāo)題:【業(yè)內(nèi)熱點(diǎn)】谷歌開(kāi)源實(shí)時(shí)語(yǔ)音轉(zhuǎn)錄引擎 Live Transcribe Speech Engine

文章出處:【微信號(hào):ChinaAET,微信公眾號(hào):電子技術(shù)應(yīng)用ChinaAET】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    EASY EAl Orin Nano(RK3576) whisper語(yǔ)音識(shí)別訓(xùn)練部署教程

    Whisper是OpenAI開(kāi)源的,識(shí)別語(yǔ)音識(shí)別能力已達(dá)到人類(lèi)水準(zhǔn)自動(dòng)語(yǔ)音識(shí)別系統(tǒng)。Whispe
    的頭像 發(fā)表于 07-17 14:55 ?659次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    。 開(kāi)發(fā)板支持浮點(diǎn)運(yùn)算,這對(duì)于語(yǔ)音信號(hào)處理中的精確計(jì)算至關(guān)重要。在語(yǔ)音識(shí)別過(guò)程中,需要對(duì)語(yǔ)音信號(hào)的頻率、幅度等參數(shù)進(jìn)行精確計(jì)算和分析,浮點(diǎn)運(yùn)算能夠確保計(jì)算結(jié)果的準(zhǔn)確性,從而提高
    發(fā)表于 05-28 11:36

    詳解語(yǔ)音識(shí)別技術(shù)在通信領(lǐng)域中的應(yīng)用

    語(yǔ)音識(shí)別技術(shù)也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR),是通過(guò)計(jì)算機(jī)對(duì)語(yǔ)音信號(hào)進(jìn)行分析和
    的頭像 發(fā)表于 02-21 17:05 ?789次閱讀
    詳解<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>技術(shù)在通信領(lǐng)域中的應(yīng)用

    基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專(zhuān)注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作,成功將語(yǔ)音
    的頭像 發(fā)表于 12-20 10:35 ?599次閱讀

    NRK3502系列芯片 | 制氧機(jī)離線(xiàn)語(yǔ)音識(shí)別方案

    NRK3502芯片制氧機(jī)離線(xiàn)語(yǔ)音識(shí)別方案制氧機(jī)離線(xiàn)語(yǔ)音識(shí)別方案是基于NRK3502藍(lán)牙雙模智能語(yǔ)音IoT芯片,依托于九芯電子在
    的頭像 發(fā)表于 12-04 01:02 ?494次閱讀
    NRK3502系列芯片 | 制氧機(jī)離線(xiàn)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>方案

    語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

    在人工智能的快速發(fā)展中,語(yǔ)音識(shí)別和自然語(yǔ)言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語(yǔ)音識(shí)別技術(shù)使得機(jī)器能夠理解人類(lèi)的語(yǔ)音,而自然語(yǔ)言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?1514次閱讀

    語(yǔ)音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    語(yǔ)音識(shí)別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來(lái),隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個(gè)領(lǐng)域。語(yǔ)音識(shí)別技術(shù)的應(yīng)用不僅提高了工作效率,也極大
    的頭像 發(fā)表于 11-26 09:20 ?1637次閱讀

    ASR與傳統(tǒng)語(yǔ)音識(shí)別的區(qū)別

    ASR(Automatic Speech Recognition,自動(dòng)語(yǔ)音識(shí)別)與傳統(tǒng)語(yǔ)音識(shí)別在多個(gè)方面存在顯著的區(qū)別。以下是對(duì)這兩者的對(duì)比: 一、技術(shù)基礎(chǔ) ASR : 基于深度學(xué)習(xí)算
    的頭像 發(fā)表于 11-18 15:22 ?1359次閱讀

    ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語(yǔ)音識(shí)別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類(lèi)語(yǔ)音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個(gè)領(lǐng)域。以下是對(duì)ASR
    的頭像 發(fā)表于 11-18 15:12 ?2078次閱讀

    基于Arm Neoverse N2實(shí)現(xiàn)自動(dòng)語(yǔ)音識(shí)別技術(shù)

    自動(dòng)語(yǔ)音識(shí)別 (Automatic Speech Recognition) 技術(shù)已經(jīng)深入到現(xiàn)代生活的方方面面,廣泛應(yīng)用于從語(yǔ)音助手、轉(zhuǎn)錄服務(wù),到呼叫中心分析和
    的頭像 發(fā)表于 11-15 11:35 ?1109次閱讀
    基于Arm Neoverse N2實(shí)現(xiàn)自動(dòng)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>技術(shù)

    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語(yǔ)音識(shí)別方案_離線(xiàn)語(yǔ)音識(shí)別芯片分析

    01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用離線(xiàn)語(yǔ)音識(shí)別芯片 物聯(lián)網(wǎng)系統(tǒng)中使用離線(xiàn)語(yǔ)音識(shí)別芯片的原因主要基于以下幾個(gè)方面: 1、實(shí)時(shí)性與可靠性 實(shí)時(shí)性好:離線(xiàn)語(yǔ)音
    的頭像 發(fā)表于 09-26 17:56 ?1612次閱讀
    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>方案_離線(xiàn)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片分析

    WTK6900FC語(yǔ)音識(shí)別模塊

    語(yǔ)音識(shí)別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月25日 17:35:07

    唯創(chuàng)知音WT2605C用在離在線(xiàn)語(yǔ)音識(shí)別方案# #語(yǔ)音芯片 #語(yǔ)音識(shí)別 #唯創(chuàng)知音

    語(yǔ)音識(shí)別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月12日 17:24:28

    谷歌推出Gemini Live,開(kāi)啟AI語(yǔ)音聊天新紀(jì)元

    在萬(wàn)眾矚目的Pixel 9系列手機(jī)發(fā)布會(huì)上,谷歌震撼宣布了一項(xiàng)創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語(yǔ)的Gemini Advanced訂閱用戶(hù)敞開(kāi)大門(mén)。這一舉措標(biāo)志著
    的頭像 發(fā)表于 08-15 17:29 ?1061次閱讀

    什么是離線(xiàn)語(yǔ)音識(shí)別芯片?與在線(xiàn)語(yǔ)音識(shí)別的區(qū)別

    離線(xiàn)語(yǔ)音識(shí)別芯片適用于智能家電等,特點(diǎn)為小詞匯量、低成本、安全性高、響應(yīng)快,無(wú)需聯(lián)網(wǎng)。在線(xiàn)語(yǔ)音識(shí)別功能更廣泛、識(shí)別準(zhǔn)確率高,但依賴(lài)穩(wěn)定網(wǎng)絡(luò)。
    的頭像 發(fā)表于 07-22 11:33 ?964次閱讀