一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

下一代的人機交互方式是什么?

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-10-21 10:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自互聯(lián)網(wǎng)誕生以來,人與機器的信息交互方式就在不斷演進和發(fā)展。從早期單一的鼠標、鍵盤操作方式,再到如今以智能手機為代表的觸控交互。我們急切地想知道:下一代的人機交互方式是什么?

智能語音,賦予了機器可以像人類一樣“講話”并與人類“對話”的能力,也讓不少人看到了語音技術(shù)的巨大潛力。追溯起來,有關(guān)語音技術(shù)真正意義上的研究可以追溯到 1876 年貝爾電話的發(fā)明。

從 2009 年開始,借助機器學習領(lǐng)域深度學習研究的發(fā)展及大數(shù)據(jù)語料的積累,以語音識別為突出代表的語音技術(shù)得到了突飛猛進的發(fā)展。如將深度學習引入語音識別聲學模型訓練,使用基于 RBM 預訓練的多層神經(jīng)網(wǎng)絡,以提高聲學模型的準確性,包括蘋果公司的 Siri、谷歌公司的 Google Assistant 的面世曾一時引起了不小轟動。2015 年,亞馬遜 Amazon Echo 的誕生正式開啟了智能語音技術(shù)的競爭局面。從智能音箱到主打語音交互的智能設(shè)備,國內(nèi)外巨頭們不惜輪番價格戰(zhàn)。

截止到目前,國內(nèi)外的戰(zhàn)場上有阿里、騰訊、百度,也有谷歌、微軟、亞馬遜、Facebook,它們的介入導致不少創(chuàng)新公司展開了激烈競爭,也對未來十年產(chǎn)生了極其重要的影響。

在眾多語音技術(shù)中,語音識別、語音合成、聲紋識別、語音喚醒、端信號處理等語音技術(shù)伴隨著算法統(tǒng)計模型的迭代有了新的重大創(chuàng)新,也成為當前最具有挑戰(zhàn)性和應用場景的技術(shù)。

以聲紋識別為例,即通過對一種或多種語音信號的特征分析來判斷說話人身份的技術(shù)。由于任何兩個人的聲紋圖譜都有所差異,所以聲紋同樣具有如指紋生物特征一樣的唯一性。聲音不涉及隱私問題,麥克風和傳感器等相關(guān)設(shè)備成本低廉,傳輸帶寬窄,而語音又是一個形簡意豐的信號,口音、語種、情感等各種信息通過一段聲音便傳輸了出來。

清華大學語音和語言技術(shù)中心主任、得意音通董事長鄭方博士接受 CSDN 采訪時表示:“目前在聲紋識別這個領(lǐng)域,不同技術(shù)或產(chǎn)品提供商參差不齊、差異很大;與此同時,聲紋識別不再是單一強調(diào)準確性,而是變得更為成熟、完備和可用?!?/p>

不過相對來講,聲紋識別仍是一個應用相對較窄的領(lǐng)域。就目前來看,語音識別、語音合成的應用更為廣泛。

例如在年初舉辦的Google I/O 大會上,機器語音助手的一聲“嗯哼”震驚了全場,然后微軟小冰為知乎寫歌又刷了一波屏。我們才意識到,AI 語音正悄然從原來的“機械式語音”變成了“像人類一樣說話”的自然語言。

語音產(chǎn)業(yè)雖然可以由概念觸發(fā),但最終仍由技術(shù)驅(qū)動,打磨好技術(shù)和產(chǎn)品仍是第一要務。

出門問問 CTO 雷欣曾表示,“從技術(shù)上來講,機器學習、人工智能跟其他功能性的東西不太一樣,它非常強調(diào)學習的過程,訓練跟實際使用場景越匹配越好,做得越通用,就代表在某一個垂直領(lǐng)域做不到最優(yōu)。”

那么,隨著語音市場需求的爆發(fā),如何更好地通過智能技術(shù)解決聲學、語音、語義等各方面的問題,對于任何一位語音技術(shù)相關(guān)領(lǐng)域的工程師而言,將是未來長期時間內(nèi)必然面臨的挑戰(zhàn)。

現(xiàn)在,CSDN 就為大家提供了這樣一個機會,讓你能夠聆聽頭部 AI 公司的最新技術(shù)實踐,并有機會與這些公司的資深技術(shù)人員面對面交流。

2018 年 11 月 8-9 日,由中國 IT 社區(qū) CSDN 與硅谷 AI 社區(qū) AICamp 聯(lián)合出品的 2018 AI 開發(fā)者大會(AI NEXTCon)將于北京召開。

本次大會設(shè)有“語音技術(shù)專場”,我們很榮幸邀請到在研究和工業(yè)界都極富盛名的一線技術(shù)專家們:清華大學語音和語言技術(shù)中心主任、得意音通董事長 鄭方,聲智科技創(chuàng)始人、董事長兼 CEO 陳孝良,出門問問 CTO 雷欣、云知聲董事長、CTO梁家恩,以及標貝科技聯(lián)合創(chuàng)始人&CTO 李秀林。

下面重磅介紹語音技術(shù)專題的講師團和他們的議題概要:

陳孝良:聲智科技創(chuàng)始人、董事長兼 CEO

演講議題:遠場語音交互技術(shù)與實踐

陳孝良,2017年度中關(guān)村高端領(lǐng)軍人才,計算機學會語音對話與聽覺專業(yè)組常務委員,中國聲學學會聲頻工程分會委員,中國人工智能和大數(shù)據(jù)專家委員,美國 AES/JASA會員。先后于北京航空航天大學和中國科學院大學(聲學研究所)獲得管理學學士和工學博士學位。

曾任職于金山軟件股份有限公司和中國科學院聲學研究所,歷任初級工程師、助理研究員、副研究員,兼任首屆信息化辦公室主任和中國科學院上海高等研究院客座副教授,主要參與海軍某重大型號艦艇、863、973、國家自然科學基金、中科院戰(zhàn)略先導等國家重要項目,共發(fā)表文章36篇,申請專利 35項。

鄭方:清華大學語音和語言技術(shù)中心主任、得意音通董事長

演講議題:聲紋識別技術(shù)及其應用現(xiàn)狀

鄭方,博士、教授、博士生導師,清華大學語音和語言技術(shù)中心主任;北京得意音通技術(shù)有限責任公司董事長;亞太區(qū)信號與信息處理聯(lián)合會副主席、中國中文信息學會語音專委會主任、中國計算機學會語音對話與聽覺專業(yè)組副主任。

鄭方博士從事語音語言處理和生物特征識別的研發(fā)近 30 年,是全國安防標委會人體生物特征識別應用分委會副主任委員、中文語音交互技術(shù)標準工作組聲紋識別專題組組長、全國信標委生物特征識別分委會委員等,是許多國家和行業(yè)標準的起草者。

梁家恩:云知聲董事長、CTO

演講議題:AIoT 智能交互技術(shù)與應用

梁家恩博士畢業(yè)于中國科技大學,獲中國科學院識別與智能系統(tǒng)專業(yè)博士學位,畢業(yè)后留校負責語音識別核心技術(shù)研發(fā)及其產(chǎn)業(yè)化,在國家863語音識別核心技術(shù)評測中多次獲第一名,在廣電、安全、教育等領(lǐng)域?qū)崿F(xiàn)產(chǎn)業(yè)化應用。

2012 年,由梁家恩博士主導創(chuàng)立人工智能公司云知聲,并率先在國內(nèi)實現(xiàn)深度學習和5米遠講識別技術(shù)的產(chǎn)業(yè)化,在業(yè)內(nèi)首次提出的“云端芯”一體化解決方案已經(jīng)在家居、車載、醫(yī)療、教育等領(lǐng)域規(guī)模化落地。在他和團隊的共同努力下,云知聲先后被福布斯評為“中國成長最快科技企業(yè)”、科技部評為“中國獨角獸企業(yè)”。2013 年底,梁家恩博士出任云知聲 CTO,負責技術(shù)領(lǐng)域。

李秀林:標貝科技聯(lián)合創(chuàng)始人&CTO

演講議題:標貝科技的語音超市實踐——助力智能產(chǎn)品人性化

李秀林,中國科學院博士,15 年語音相關(guān)技術(shù)研發(fā)和學術(shù)研究,申請專利三十余項,在國內(nèi)外語音界有很高的知名度;曾帶領(lǐng)團隊獲得百度百萬美元大獎。2006 年— 2013 年,松下研發(fā)中心高級研發(fā)經(jīng)理;2013 年— 2016 年,百度語音合成技術(shù)負責人;2016 年—2018 年,滴滴研究院語音團隊負責人&首席算法工程師;2018年3月份加盟標貝科技,作為聯(lián)合創(chuàng)始人兼 CTO。

雷欣:出門問問(Mobvoi)CTO

演講議題:語音交互的軟硬結(jié)合

雷欣,人工智能專家,在人工智能尤其是語音識別領(lǐng)域至今已有十多年研究及從業(yè)經(jīng)驗。2006 年,雷欣獲得美國華盛頓大學電子工程博士后,加入了微軟總部任軟件設(shè)計工程師及 Speech Scientist,負責開發(fā)微軟語音識別引擎內(nèi)的說話人自適應模塊;后加入斯坦福研究所(SRI)任研究工程師,領(lǐng)導開發(fā)了SRI 2008 年大規(guī)模中文語音識別系統(tǒng);隨后進入 Google 研究院任 Staff Research Scientist,領(lǐng)導開發(fā) Google 基于深度神經(jīng)網(wǎng)絡的離線語音識別系統(tǒng)。

目前,雷欣所帶領(lǐng)的出門問問 AI 團隊,正進行人工智能落地在生活場景(可穿戴、車載、家居)上的研究開發(fā)。

除了語音技術(shù)專題之外,我們還為大家準備了“自然語言處理”、“機器學習工具”、“數(shù)據(jù)分析”、“機器學習”、“計算機視覺”、“知識圖譜”等技術(shù)專題,以及“智慧金融”、“智能駕駛”、“智慧醫(yī)療”等行業(yè)峰會。大會完整日程以及嘉賓議題請查看下方海報。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關(guān)注

    關(guān)注

    12

    文章

    1246

    瀏覽量

    56411
  • 智能手機
    +關(guān)注

    關(guān)注

    66

    文章

    18621

    瀏覽量

    183751
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134548

原文標題:解放雙手,人機交互真的只需要一張嘴嗎?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    蘇州唯理科技神經(jīng)腕帶肌電臂環(huán)人機交互演示

    人機交互
    jf_74911425
    發(fā)布于 :2025年07月08日 22:02:34

    聲智科技全球首發(fā)新一代人機交互框架

    全球人工智能產(chǎn)業(yè)正經(jīng)歷人機交互范式升級。過去兩個月中,以O(shè)penAI、Meta為代表的行業(yè)領(lǐng)軍企業(yè)加速推進交互技術(shù)創(chuàng)新迭代,推動產(chǎn)業(yè)進入關(guān)鍵變革期。值得關(guān)注的是,a16z合伙人Olivia
    的頭像 發(fā)表于 05-12 10:28 ?402次閱讀
    聲智科技全球首發(fā)新<b class='flag-5'>一代人機交互</b>框架

    光庭信息推出下一代整車操作系統(tǒng)A2OS

    ,正式推出面向中央計算架構(gòu)、支持人機協(xié)同開發(fā)的下一代整車操作系統(tǒng)A2OS(AI × Automotive OS),賦能下一代域控軟件解決方案的快速研發(fā),顯著提升整車智能化水平。 A2OS 核心架構(gòu) A2OS采用"軟硬解耦、軟軟解
    的頭像 發(fā)表于 04-29 17:37 ?540次閱讀
    光庭信息推出<b class='flag-5'>下一代</b>整車操作系統(tǒng)A2OS

    聲學技術(shù)如何重構(gòu)人機交互生態(tài)

    人機交互的底層邏輯。隨著非線性聲學計算與強化學習的深度融合,聲音交互正從“聽得見”邁向“聽得懂”,并逐漸成為 AI 時代的重要接口。
    的頭像 發(fā)表于 04-14 13:50 ?387次閱讀

    聲智科技重新定義下一代人機交互標準

    日前,OpenAI發(fā)布三款語音模型,首次提出"開發(fā)者可控制語音情緒"的概念,引發(fā)行業(yè)對語音交互未來形態(tài)的討論。然而,國內(nèi)外測評顯示,其生成的中文語音仍顯生硬,與國內(nèi)技術(shù)存在明顯差距。這背后揭示了個更深層的命題:情緒化語音的核心不在于文本轉(zhuǎn)譯技術(shù),而在于聲學底層能力的突破
    的頭像 發(fā)表于 04-01 14:14 ?425次閱讀

    AR互動與傳統(tǒng)的交互方式相比更加豐富多元

    AR 互動的另個顯著特點,是其豐富多元的互動方式。與傳統(tǒng)的交互方式相比,AR 互動不再局限于鼠標、鍵盤、觸摸屏等有限的輸入方式,而是通過多
    的頭像 發(fā)表于 03-10 17:48 ?494次閱讀
    AR互動與傳統(tǒng)的<b class='flag-5'>交互</b><b class='flag-5'>方式</b>相比更加豐富多元

    為什么開關(guān)柜人機交互裝置集成鍵順控,可以替代開關(guān)柜操顯裝置

    蜀瑞創(chuàng)新科普:開關(guān)柜人機交互裝置集成鍵順控在功能集成與簡化操作、智能化與遠程監(jiān)控以及可靠性與安全性等方面均表現(xiàn)出顯著優(yōu)勢。這些優(yōu)勢使得集成鍵順控的人機交互裝置能夠替代傳統(tǒng)的開關(guān)柜智
    的頭像 發(fā)表于 03-07 10:21 ?543次閱讀
    為什么開關(guān)柜<b class='flag-5'>人機交互</b>裝置集成<b class='flag-5'>一</b>鍵順控,可以替代開關(guān)柜操顯裝置

    清華牽頭深開鴻參與:混合智能人機交互系統(tǒng)獲批立項

    近日,個由清華大學牽頭、深開鴻重點參與的“面向混合智能的自然人機交互軟硬件系統(tǒng)”研發(fā)計劃項目,正式獲得了立項批準。該項目是國家“十四五”重點研發(fā)計劃“先進計算與新興軟件”專項中的項關(guān)鍵核心技術(shù)
    的頭像 發(fā)表于 01-23 16:33 ?829次閱讀

    啟英泰倫新推出多意圖自然說,重塑離線人機交互新標準!

    智能語音識別技術(shù)作為人機交互領(lǐng)域的場革命性突破,正逐步重塑我們與智能設(shè)備的交互方式。近期,啟英泰倫新推出了多意圖自然說技術(shù),進步增強了
    的頭像 發(fā)表于 01-03 16:01 ?536次閱讀
    啟英泰倫新推出多意圖自然說,重塑離線<b class='flag-5'>人機交互</b>新標準!

    芯??萍糉orceTouch3.0:重塑人機交互新境界

    在追求極致用戶體驗的智能時代,每次技術(shù)的革新都是對未來的深度探索。芯海科技,作為業(yè)界領(lǐng)先的芯片設(shè)計企業(yè),憑借其ForceTouch3.0技術(shù),正引領(lǐng)著人機交互的變革,為智能手機、智能穿戴、家電乃至汽車電子等領(lǐng)域注入了全新的
    的頭像 發(fā)表于 11-28 09:20 ?632次閱讀
    芯??萍糉orceTouch3.0:重塑<b class='flag-5'>人機交互</b>新境界

    的人機交互入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)隨著智能眼鏡的出現(xiàn),加之AI技術(shù)的應用,AI智能眼鏡被認為是下一代人機交互的入口。在今年,不少品牌廠商都推出了AI智能眼鏡新品,包括李未可推出的Meta Lens
    的頭像 發(fā)表于 11-21 00:57 ?3964次閱讀
    新<b class='flag-5'>的人機交互</b>入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    具身智能對人機交互的影響

    在人工智能的發(fā)展歷程中,人機交互直是研究的核心領(lǐng)域之。隨著技術(shù)的進步,人機交互方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再
    的頭像 發(fā)表于 10-27 09:58 ?947次閱讀

    DJN人機交互解決方案

    技術(shù)是智能化中不可或缺的重要組成元素,是人機交互的重要媒介,能有效將智能化終端的運行狀態(tài)通過顯示屏直觀的反饋給人,同時通過觸控顯示屏將人類的操作直接精確的傳達給智能化終端。 帝晶HMI智慧屏解決方案,旨在提供專業(yè)的觸控
    的頭像 發(fā)表于 10-12 09:29 ?1487次閱讀

    聚徽-工控體機是如何實現(xiàn)人機交互

    工控體機實現(xiàn)人機交互方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實現(xiàn)方式
    的頭像 發(fā)表于 09-10 09:31 ?650次閱讀

    基于傳感器的人機交互技術(shù)

    基于傳感器的人機交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之,它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應用領(lǐng)域以及未來
    的頭像 發(fā)表于 07-17 16:52 ?1698次閱讀