一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Alexa耳語(yǔ)模式——AI技術(shù)更顯人性化

人工智能 ? 2018-10-09 15:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上周,亞馬遜在美國(guó)西雅圖舉行的發(fā)布會(huì)上一口氣推出了十余款A(yù)lexa設(shè)備,大部分設(shè)備主要由Alexa語(yǔ)音平臺(tái)驅(qū)動(dòng)。其中部分設(shè)備將增添“耳語(yǔ)模式”功能,使Alexa設(shè)備用耳語(yǔ)來(lái)回應(yīng)用戶的低聲說(shuō)話。日前,亞馬遜Alexa語(yǔ)音系統(tǒng)小組的一位專家Zeynab Raeesy在其博文中揭秘了這一功能的AI基礎(chǔ)。

Raeesy在博文中介紹:“如果你在一個(gè)有小孩睡覺(jué)的房間,當(dāng)有人走進(jìn)來(lái)時(shí),你會(huì)馬上低聲說(shuō)話,提醒進(jìn)來(lái)的人你希望房間內(nèi)能保持安靜,而進(jìn)來(lái)的人意識(shí)到這一點(diǎn)之后,很可能也會(huì)壓低聲音講話。”

Raeesy指出,Alexa的耳語(yǔ)模式令人難以理解的地方在于它是清音的,也就是說(shuō),它不涉及聲帶振動(dòng),往往比普通的語(yǔ)音在低頻段具有更少的能量。她與小組的同事研究了兩種能區(qū)分正常語(yǔ)音和耳語(yǔ)音的神經(jīng)網(wǎng)絡(luò)。

兩種神經(jīng)網(wǎng)絡(luò)主要在結(jié)構(gòu)上有所區(qū)別,一個(gè)是MLP(多層感知器),另一個(gè)是能進(jìn)行時(shí)間遞歸的LSTM(長(zhǎng)短期記憶)網(wǎng)絡(luò),這兩者用來(lái)做訓(xùn)練的數(shù)據(jù)是一樣的,這些數(shù)據(jù)包括(1)對(duì)數(shù)濾波器組能量,或者是用來(lái)記錄不同頻率范圍信號(hào)能量的語(yǔ)音信號(hào)表示;(2)能區(qū)別耳語(yǔ)音與正常語(yǔ)音之間信號(hào)差異的一組特征。

在測(cè)試中,他們發(fā)現(xiàn)LSTM的表現(xiàn)結(jié)果比MLP更好,具備許多優(yōu)勢(shì)。Raeesy解釋道,Alexa語(yǔ)音識(shí)別引擎的其他組件完全依賴對(duì)數(shù)濾波器組能量,并給不同的組件提供相同的輸入數(shù)據(jù),進(jìn)而使整個(gè)系統(tǒng)更加緊湊。

Alexa耳語(yǔ)模式的開(kāi)發(fā)并非一帆風(fēng)順,至少在最初階段是這樣的。由于Alexa是通過(guò)短時(shí)間的沉默(一種被稱為“結(jié)束指向”的技術(shù))來(lái)識(shí)別指令的結(jié)束或者進(jìn)行回復(fù),LSTM往往在話語(yǔ)即將結(jié)束時(shí)降低置信度。為解決這個(gè)問(wèn)題,研究人員將LSTM的輸出校準(zhǔn)成整個(gè)話語(yǔ)的平均值,最終,降低最后1.25秒的語(yǔ)音數(shù)據(jù)成為維持“耳語(yǔ)模式”性能的關(guān)鍵。

美式英語(yǔ)的耳語(yǔ)模式功能將在今年11月份推出,對(duì)耳語(yǔ)模式具體工作原理的介紹將以論文的形式在12月份的IEEE語(yǔ)音技術(shù)研討會(huì)上發(fā)表。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279757
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI在可穿戴領(lǐng)域狂飆,混合式AI模式加速落地

    并不陌生,它帶來(lái)了更加個(gè)性的推薦和更加人性化的交互方式。 ? 在可穿戴設(shè)備上,蘋(píng)果、三星、360、索尼、XREAL等做智能手表、XR設(shè)備的硬件廠商都將生成式AI用到了自己的產(chǎn)品上。在產(chǎn)業(yè)鏈上游,涉及處理器、傳感器的芯片廠商在生
    的頭像 發(fā)表于 08-02 01:09 ?7136次閱讀
     <b class='flag-5'>AI</b>在可穿戴領(lǐng)域狂飆,混合式<b class='flag-5'>AI</b><b class='flag-5'>模式</b>加速落地

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動(dòng)AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范式信而泰深度整合DeepSeek-R1大模型
    發(fā)表于 07-16 15:29

    芯資訊|廣州唯創(chuàng)電子WT588F02B-8S語(yǔ)音芯片:驅(qū)動(dòng)充電樁智能升級(jí),打造人性化充電體驗(yàn)

    隨著電動(dòng)汽車的普及浪潮席卷全球,充電樁作為核心基礎(chǔ)設(shè)施,其智能人性化水平直接影響用戶體驗(yàn)。在這一背景下,廣州唯創(chuàng)電子WT588F02B-8S語(yǔ)音芯片憑借其創(chuàng)新的技術(shù)特性,正成為提升充電樁交互
    的頭像 發(fā)表于 07-03 08:41 ?446次閱讀
    芯資訊|廣州唯創(chuàng)電子WT588F02B-8S語(yǔ)音芯片:驅(qū)動(dòng)充電樁智能升級(jí),打造<b class='flag-5'>人性化</b>充電體驗(yàn)

    成本狂降90%!國(guó)產(chǎn)芯片+開(kāi)源模型如何改寫(xiě)AI玩具規(guī)則

    成本實(shí)現(xiàn)更人性化的體驗(yàn)。這種技術(shù)迭代不僅重塑了玩具的定義,更悄然重構(gòu)著人與機(jī)器的關(guān)系圖譜。 ? 輕量級(jí)模型的出現(xiàn),本質(zhì)上是將云端大模型的智慧濃縮至終端設(shè)備的過(guò)程。以DeepSeek-R1為代表的技術(shù)路徑,通過(guò)知識(shí)蒸餾將千億參數(shù)模
    的頭像 發(fā)表于 05-29 00:52 ?3185次閱讀

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+ 入門(mén)篇學(xué)習(xí)

    10.AI Agent開(kāi)發(fā)模式走向了零代碼可視模式(需要我們程序員對(duì)此有著觀念上的轉(zhuǎn)變),但是掌握編程技術(shù),有助于
    發(fā)表于 05-02 09:26

    移遠(yuǎn)通信智能模組全面接入多模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    全系智能模組產(chǎn)品已全面接入火山引擎豆包VLM(視覺(jué)語(yǔ)言)多模態(tài)AI大模型。這一突破性進(jìn)展表明,搭載移遠(yuǎn)任意智能模組的終端設(shè)備,均可無(wú)縫融合多模態(tài)AI大模型的強(qiáng)大功能,為用戶帶來(lái)更智能、便捷、人性化的產(chǎn)品體驗(yàn)。 ? ? ? 一鍵接
    發(fā)表于 03-21 14:12 ?284次閱讀
    移遠(yuǎn)通信智能模組全面接入多模態(tài)<b class='flag-5'>AI</b>大模型,重塑智能交互新體驗(yàn)

    AI技術(shù)與PLC編程融合

    如何將AI技術(shù)融入PLC編程軟件
    發(fā)表于 02-14 15:55

    企業(yè)AI算力租賃模式的好處

    構(gòu)建和維護(hù)一個(gè)高效、可擴(kuò)展的AI算力基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級(jí)。而AI算力租賃模式為企業(yè)提供了一種靈活、高效且成本可控的解決方案。下面,
    的頭像 發(fā)表于 12-24 10:49 ?1208次閱讀

    雷諾下一代車載語(yǔ)音助手Reno將引入生成式AI技術(shù)

    為客戶提供更加直觀和有趣的駕駛體驗(yàn)。多年來(lái),雷諾與賽輪思一直保持緊密合作,致力于提升Reno的人性化語(yǔ)音交互能力。
    的頭像 發(fā)表于 11-01 16:39 ?1788次閱讀

    亞馬遜基于人工智能的Alexa發(fā)布計(jì)劃延期至明年

    11月1日外媒報(bào)道稱,亞馬遜已將基于人工智能技術(shù)全新打造的正版Alexa發(fā)布計(jì)劃延期至明年。   亞馬遜最初于去年9月公開(kāi)了新版Alexa的規(guī)劃,意在通過(guò)集成AI大模型,顯著增強(qiáng)
    的頭像 發(fā)表于 11-01 15:19 ?1012次閱讀

    智能照明管理系統(tǒng),打造人性化照明方案

    基本概念 智能照明管理系統(tǒng)是利用物聯(lián)網(wǎng)、有線/無(wú)線通訊、大數(shù)據(jù)以及云計(jì)算等技術(shù)組成的智慧樓宇照明管控系統(tǒng),將傳統(tǒng)人工按時(shí)開(kāi)關(guān)的模式,升級(jí)為能夠遠(yuǎn)程控制、故障示警、自動(dòng)調(diào)節(jié)及節(jié)能管理的燈控方案,為
    的頭像 發(fā)表于 10-22 10:55 ?1090次閱讀
    智能照明管理系統(tǒng),打造<b class='flag-5'>人性化</b>照明方案

    (JAVA)一套成熟在用的智能產(chǎn)科電子病歷系統(tǒng),源碼交付可直接上項(xiàng)目

    在人類探索與人性化的產(chǎn)科管理系統(tǒng)的征途中,我們深知每一步都承載著對(duì)未來(lái)新生命健康與家庭幸福的深切關(guān)懷。
    的頭像 發(fā)表于 10-21 13:59 ?481次閱讀
    (JAVA)一套成熟在用的智能<b class='flag-5'>化</b>產(chǎn)科電子病歷系統(tǒng),源碼交付可直接上項(xiàng)目

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    領(lǐng)域的研究人員的工作模式相融合,也是一個(gè)亟待解決的問(wèn)題。然而,這些挑戰(zhàn)也孕育著新的機(jī)遇。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的拓展,AI在生命科學(xué)領(lǐng)域的應(yīng)用將更加廣泛和深入,為科學(xué)家們提供更多的研究工具和方法
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的
    發(fā)表于 10-14 09:16

    NV080D-S8 高品質(zhì)otp語(yǔ)音芯片:讓漱口水售貨機(jī)更智能和人性化

    體驗(yàn)與人性化服務(wù)。這款芯片憑借其卓越的音質(zhì)輸出與靈活的編程能力,讓每一次與售貨機(jī)的交互都變得生動(dòng)有趣。當(dāng)顧客走近漱口水售貨機(jī)時(shí),該芯片能夠即時(shí)感知并觸發(fā)預(yù)設(shè)的歡迎
    的頭像 發(fā)表于 10-12 08:02 ?544次閱讀
    NV080D-S8 高品質(zhì)otp語(yǔ)音芯片:讓漱口水售貨機(jī)更智能和<b class='flag-5'>人性化</b>