微軟院士：Speech DDK技能太強(qiáng)了，語音識別超專業(yè)翻譯人士水平

【導(dǎo)讀】2016年152層殘差網(wǎng)絡(luò)圖像識別精準(zhǔn)率96%，2017年語音識別基準(zhǔn)測試誤差率5.1%，2018年1月文本理解測試精準(zhǔn)率88.5%，3月機(jī)器翻譯研究系統(tǒng)精準(zhǔn)率達(dá)到69.9%，12月語音合成測試版在Azure正式上線，并首次達(dá)到超過專業(yè)翻譯人士的水平，微軟人工智能（AI）再次刷新世界紀(jì)錄。

12月18日，在IoT In Ac tion峰會上，微軟全球資深院士首席語音科學(xué)家黃學(xué)東博士介紹智能語音和語言上的最新進(jìn)展。首款媲美專業(yè)發(fā)音人的實(shí)時(shí)在線語音合成系統(tǒng)預(yù)覽版在Azure上正式運(yùn)營服務(wù)。

黃學(xué)東博士表示，微軟在云服務(wù)上提供了世界級的語音合成服務(wù)，所有的互聯(lián)網(wǎng)內(nèi)容提供商都可以享受這個(gè)世界級的技術(shù)。它不僅解決了過去20年機(jī)器語音識別錯(cuò)誤率居高不下的難題，更是人工智能語音和語言上的一次歷史性突破——采用先進(jìn)深度網(wǎng)絡(luò)學(xué)習(xí)，簡化了傳統(tǒng)語音合成的架構(gòu)。

從以上圖片可以看出，左邊紫色系統(tǒng)架構(gòu)下，微軟通過端到端的深度學(xué)習(xí)優(yōu)化，為大家提供前所未有的、最自然的語音合成系統(tǒng)。

“基于神經(jīng)網(wǎng)絡(luò)的語音合成系統(tǒng)”是業(yè)界第一個(gè)實(shí)時(shí)的在語音上上線的人工智能服務(wù)。黃學(xué)東博士指出，大家可以享受更好的語音合成質(zhì)量、更快的引擎性能、更廣的全球服務(wù)部署。所有的內(nèi)容提供商，不管是有沒有音頻、你的內(nèi)容都可以轉(zhuǎn)換成自然的聲音表達(dá)，不管是在開車還是在睡覺，都可以享受高質(zhì)量的交互。

同時(shí)，微軟聯(lián)合全球合作伙伴一起推出強(qiáng)大的語音麥克風(fēng)陣列開發(fā)系統(tǒng)（Speech Devices SDK簡稱Speech DDK），它可以在25m之外都可以轉(zhuǎn)寫你的聲音，DDK不僅可供用戶免費(fèi)使用，還可以整合到任何硬件設(shè)備中去，通過微軟云服務(wù)為用戶提供最先進(jìn)的、世界一流的語音交互服務(wù)。

DDK讓智能音箱“說話”。這是一款眼觀六路的智能音箱系統(tǒng)，為企業(yè)級的會議轉(zhuǎn)寫提供前所未有的智能服務(wù)。

可以看到，它不僅僅是業(yè)界第一臺多人原場會議轉(zhuǎn)錄系統(tǒng)，而且是業(yè)界第一臺“睜開雙眼”的智能音箱。

隨著語音識別技術(shù)不斷取得進(jìn)步。放眼未來，各國間的語言溝通障礙不再有任何問題，人類離人工智能真正的目標(biāo)又將推進(jìn)一小步。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

微軟

微軟

+關(guān)注

關(guān)注
4

文章
6685

瀏覽量
105730
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4814

瀏覽量
103562
語音識別

語音識別

+關(guān)注

關(guān)注
39

文章
1780

瀏覽量
114218
人工智能

人工智能

+關(guān)注

關(guān)注
1806

文章
49008

瀏覽量
249309
語音合成

語音合成

+關(guān)注

關(guān)注
2

文章
92

瀏覽量
16495

漁翁先生
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot 歐菲光凈利下修逾23億股價(jià)跌停踩坑金立爆雷早有預(yù)警
Hot AI芯片市場正在升溫亞馬遜入局欲與Intel，微軟搶市占？

New 高通預(yù)計(jì)Q2財(cái)季芯片出貨量將下降要怪冠狀病毒嗎？
New NAND閃存成2020年增長最快產(chǎn)品三大半導(dǎo)體存儲公司出現(xiàn)復(fù)蘇跡象

精選推薦
更多

文章

資料

帖子

CMOS工藝中方塊電阻的主要類型和測試方法

芯長征科技
17小時(shí)前

375 閱讀

用于電動(dòng)汽車供電網(wǎng)絡(luò)的高壓母線轉(zhuǎn)換器48V電源模塊

Vicor
18小時(shí)前

474 閱讀

Copilot操作指南（一）：使用圖片生成原理圖符號、PCB封裝

KiCad
21小時(shí)前

310 閱讀

如何構(gòu)建帶有VGA輸出的低分辨率熱成像

FPGA研究院
21小時(shí)前

504 閱讀

如何為EMC設(shè)計(jì)選擇PCB疊層結(jié)構(gòu)

Altium
21小時(shí)前

483 閱讀

靜態(tài)時(shí)序分析與邏輯（華為內(nèi)部培訓(xùn)資料）

斗地主之神
550

10積分

130下載

Afﬁnity Script One-Step

KANA
223

2積分

8下載

Harmonoid音樂應(yīng)用程序

h1654155272.9717
3.95 MB

免費(fèi)

1下載

HCPush項(xiàng)目左/右側(cè)彈出視圖

劉豐標(biāo)
0.14 MB

免費(fèi)

0下載

TKImageView iOS圖片裁剪工具類

siyugege
0.13 MB

免費(fèi)

0下載

匠芯創(chuàng)D133CBS RISC-V KunLun Pi V1.0開發(fā)板開發(fā)資料

ElecFans小喇叭
1天前

295 閱讀

HarmonyOS AI輔助編程工具（CodeGenie）代碼續(xù)寫

李洋水蛟龍
1天前

220 閱讀

【沁恒CH585開發(fā)板免費(fèi)試用體驗(yàn)】手機(jī)控制小臺燈亮度與小風(fēng)扇轉(zhuǎn)速

yinwuqing
1天前

286 閱讀

【嘉楠堪智K230開發(fā)板試用體驗(yàn)】K230 AI 功能體驗(yàn)

杯pp
1天前

282 閱讀

【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】ISP功能AE測試

jf_1137202360
1天前

366 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

微軟院士：Speech DDK技能太強(qiáng)了，語音識別超專業(yè)翻譯人士水平

評論

搜索歷史

微軟院士：Speech DDK技能太強(qiáng)了，語音識別超專業(yè)翻譯人士水平

評論

微軟院士：Speech DDK技能太強(qiáng)了，語音識別超專業(yè)翻譯人士水平