一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

鄢志杰談深度學(xué)習(xí)要基于問題來(lái)選擇工具

大小:0.03 MB 人氣: 2017-10-13 需要積分:1
 鄢志杰將在12月11日下午的深度學(xué)習(xí)論壇進(jìn)行題為“Deep Learning 助力客服小二:數(shù)據(jù)技術(shù)及機(jī)器學(xué)習(xí)在客服中心的應(yīng)用”的主題演講,分享基于DNN、CNN、RNN(LSTM)及其各種組合模型的語(yǔ)音識(shí)別、自然語(yǔ)言處理技術(shù)在客服領(lǐng)域的應(yīng)用。
  鄢志杰在接受采訪時(shí)表示,他的分享內(nèi)容將包括Deep Learning 判斷小二對(duì)問題定位的一致性、采用Deep Learning自動(dòng)識(shí)別用戶問題等,iDST在數(shù)據(jù)技術(shù)及機(jī)器學(xué)習(xí)方面的嘗試,已經(jīng)在阿里巴巴集團(tuán)及螞蟻金服助力客服小二,向客服機(jī)器人的引入邁出了第一步。不過(guò),他認(rèn)為,客服機(jī)器人不是要取代人工,而是要學(xué)習(xí)人、幫助人。比如阿里巴巴客服中心的很多Machine Learning的工作,都是去學(xué)習(xí)客服小二是如何服務(wù)的,沒有客服小二,學(xué)習(xí)無(wú)從入手。
  談到深度學(xué)習(xí)的挑戰(zhàn),鄢志杰表示,近年來(lái)在DL領(lǐng)域不管三七二十一加數(shù)據(jù)、加運(yùn)算能力、增加模型規(guī)模的brute-force方法從某種意義上講是相當(dāng)成功的。DL在Feature Engineering上的成功也帶來(lái)了似乎不需要再關(guān)注問題本身、不需要任何Domain Knowledge,只需要把Raw Feature扔進(jìn)Deep Model訓(xùn)練一下就能打敗歷史上所有模型的假象——這恰恰只是說(shuō)明了我們很多人對(duì)DL的理解還比較膚淺。他認(rèn)為,DL目前的挑戰(zhàn)之一就是需要重新去嚴(yán)肅的思考我們要解的問題、了解我們的模型、分析我們的數(shù)據(jù),而不是一味的強(qiáng)調(diào)“大數(shù)據(jù)”、“大模型”、“大計(jì)算”。
  此外,對(duì)于機(jī)器學(xué)習(xí)開源工具的選擇,鄢志杰認(rèn)為,工具就是工具,不必抱有“宗教信仰”,比較合適的態(tài)度也許是更關(guān)注你要解的問題,基于問題來(lái)選擇工具。
  
  鄢志杰
  阿里巴巴iDST語(yǔ)音組高級(jí)專家
  鄢志杰,阿里巴巴 iDST(Institute of Data Science and Technologies)語(yǔ)音組高級(jí)專家。在加入阿里巴巴前,就職于微軟亞洲研究院,任語(yǔ)音組主管研究員。畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)訊飛語(yǔ)音實(shí)驗(yàn)室,獲博士學(xué)位。研究領(lǐng)域主要包括語(yǔ)音識(shí)別、語(yǔ)音合成、說(shuō)話人識(shí)別驗(yàn)證、OCR/ 手寫識(shí)別、機(jī)器學(xué)習(xí)算法等。在語(yǔ)音及文本識(shí)別領(lǐng)域頂級(jí)學(xué)術(shù)期刊及會(huì)議發(fā)表多篇論文,長(zhǎng)期擔(dān)任語(yǔ)音領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議及期刊的專家評(píng)審,并擁有多項(xiàng)美國(guó)及PCT專利,目前是 IEEE senior member。其研究成果被轉(zhuǎn)化并應(yīng)用于微軟公司及阿里巴巴集團(tuán)的多項(xiàng)產(chǎn)品中。
  以下為鄢志杰采訪實(shí)錄:
  CSDN:請(qǐng)介紹一下您自己以及當(dāng)前的主要工作。
  鄢志杰:我主要在阿里云iDST負(fù)責(zé)語(yǔ)音技術(shù)方面的工作,為集團(tuán)和螞蟻金服各個(gè)業(yè)務(wù)部門,以及外部客戶提供各種與語(yǔ)音有關(guān)的服務(wù),包括語(yǔ)音識(shí)別、語(yǔ)音合成、說(shuō)話人識(shí)別/驗(yàn)證、對(duì)話系統(tǒng)等。由于語(yǔ)音領(lǐng)域是Deep Learning的最重要的試金石之一,我們也應(yīng)用各種機(jī)器學(xué)習(xí)算法到更廣泛的領(lǐng)域,如客服問題定位等等當(dāng)中去。
  CSDN:在您的語(yǔ)音識(shí)別工作中采用了哪些DL模型?從這些模型在標(biāo)準(zhǔn)數(shù)據(jù)集上實(shí)現(xiàn)的精度,到實(shí)現(xiàn)在淘寶客服的實(shí)際應(yīng)用,還需要做哪些方面的工作?
  鄢志杰:語(yǔ)音識(shí)別領(lǐng)域是DL最重要的應(yīng)用領(lǐng)域之一,很多DL算法都首先在語(yǔ)音識(shí)別上得到實(shí)踐。因此,我們所采用的DL模型也較多,包括DNN、CNN、RNN(LSTM)及其各種組合。當(dāng)前語(yǔ)音識(shí)別研究的重心早已從學(xué)術(shù)界向工業(yè)界傾斜,因此通常所說(shuō)的標(biāo)準(zhǔn)數(shù)據(jù)集一般規(guī)模較小,主要是為快速驗(yàn)證算法來(lái)使用。像客服語(yǔ)音識(shí)別這樣的實(shí)際應(yīng)用場(chǎng)景,還需要做以下幾個(gè)方面的工作:
  沉淀數(shù)據(jù),構(gòu)造feedback loop,即能夠形成數(shù)據(jù)的閉環(huán),將線上實(shí)際數(shù)據(jù)很快應(yīng)用到模型迭代更新中去;提高模型訓(xùn)練的周轉(zhuǎn)率,降低訓(xùn)練時(shí)間,通過(guò)大規(guī)模并行計(jì)算實(shí)現(xiàn)高速DL模型訓(xùn)練;構(gòu)造高水平的云端線上服務(wù),包括高效的解碼器、自動(dòng)部署、運(yùn)維等等。
  CSDN:您的工作也涉及到文本分析,如何看待DL在文本分析領(lǐng)域的進(jìn)展和前景?
  鄢志杰:DL在文本領(lǐng)域有非常令人興奮的進(jìn)展。從早前的“看圖說(shuō)話”、“sequence-to-sequence翻譯、語(yǔ)言生成”,到最近的“看圖回答問題”等等,DL在文本上的應(yīng)用正向縱深發(fā)展,應(yīng)該說(shuō)前景是很廣闊的。我們自己也在這方面有一些工作,包括客服問題聚類、分類、對(duì)話理解、語(yǔ)言生成等。
  CSDN:基于數(shù)據(jù)技術(shù)和ML,您認(rèn)為客服機(jī)器人技術(shù)將能夠取代多少的人工工作?時(shí)間節(jié)點(diǎn)如何?
  鄢志杰:我個(gè)人有一個(gè)理念,就是永遠(yuǎn)不去取代人工,而是讓客服機(jī)器人去學(xué)習(xí)人、幫助人。就像我們?cè)诳头行牡暮芏郙achine Learning的工作,都是去學(xué)習(xí)客服小二是如何服務(wù)的,沒有客服小二,學(xué)習(xí)無(wú)從入手。例如,我們會(huì)將客服小二的真實(shí)IVR服務(wù)進(jìn)行語(yǔ)音識(shí)別,從沉淀下來(lái)的數(shù)據(jù)中去做Machine Learning,去做各種后續(xù)的工作。我認(rèn)為客服機(jī)器人的價(jià)值在于可以減少人工,讓客服中心可以隨公司業(yè)務(wù)智能的擴(kuò)展,而不是一味擴(kuò)大人的規(guī)模,使得服務(wù)質(zhì)量無(wú)法保證。
  CSDN:當(dāng)前的開源DL工具越來(lái)越多,您嘗試過(guò)哪些工具?最喜歡什么樣的工具?最終選擇的標(biāo)準(zhǔn)是什么?
  鄢志杰:我們擁抱開源。開源的、得到大家認(rèn)可而發(fā)展起來(lái)的東西肯定是好東西。在語(yǔ)音領(lǐng)域目前最活躍的開源工具是Kaldi,是微軟的前同事Povey從幾年前開始一步步做起來(lái)、逐漸變得流行的。我們也是通過(guò)改造Kaldi來(lái)搭建我們系統(tǒng)的某些環(huán)節(jié)的,改造的工作一方面是使之適應(yīng)工業(yè)界需求(如大規(guī)模的GPU多機(jī)多卡訓(xùn)練)、一方面是基于它的codebase來(lái)快速的做創(chuàng)新性研究。我認(rèn)為工具就是工具,不必抱有“宗教信仰”,比較合適的態(tài)度也許是更關(guān)注你要解的問題,基于問題來(lái)選擇工具。這也正是我們開發(fā)GPU多機(jī)多卡 Machine Learning Middleware的原因。這個(gè)Middleware的功能就是把各種各樣的開源DL訓(xùn)練工具通過(guò)很少的修改,就變成可以利用多機(jī)多卡的大規(guī)模并行化訓(xùn)練工具。這樣一來(lái),我們就可以迅速消化、吸收,并改造層出不窮的新的DL開源工具。
  CSDN:DL的領(lǐng)軍人物Yann LeCun曾經(jīng)多次談到DL的挑戰(zhàn),如推理機(jī)制、無(wú)監(jiān)督學(xué)習(xí)等等,您如何看待DL的挑戰(zhàn)?
  鄢志杰:DL近年來(lái)發(fā)展得太快了,也太熱了。有一些brute-force的研究方法太過(guò)成功,容易給人造成誤導(dǎo)。傳統(tǒng)的機(jī)器學(xué)習(xí)講究對(duì)問題的分析、對(duì)數(shù)據(jù)本身的理解、“Occam‘s razor”是研究者樂于奉行的原則。我們看到近年來(lái)在DL領(lǐng)域,不管三七二十一加數(shù)據(jù)、加運(yùn)算能力、增加模型規(guī)模的brute-force方法從某種意義上講是相當(dāng)成功的。DL在Feature Engineering上的成功也帶來(lái)了似乎不需要再關(guān)注問題本身、不需要任何Domain Knowledge,只需要把Raw Feature扔進(jìn)Deep Model訓(xùn)練一下就能打敗歷史上所有模型的假象。我個(gè)人認(rèn)為這恰恰只是說(shuō)明了我們很多人對(duì)DL的理解還比較膚淺。多年后回過(guò)頭來(lái)看,也許會(huì)發(fā)現(xiàn),現(xiàn)在的我們只不過(guò)是正處在DL野蠻發(fā)展的初級(jí)階段而已。
  在我所在的語(yǔ)音領(lǐng)域,現(xiàn)在要找一個(gè)篇非DL的論文已經(jīng)很難了。今年開InterSpeech國(guó)際會(huì)議的時(shí)候,聲學(xué)所一名同學(xué)做Oral Presentation,一上臺(tái)就說(shuō)今天我全篇沒有DL,沒想到贏得臺(tái)下一片掌聲。我覺得DL目前的挑戰(zhàn)之一就是需要重新去嚴(yán)肅的思考我們要解的問題、了解我們的模型、分析我們的數(shù)據(jù),而不是一味的強(qiáng)調(diào)“大數(shù)據(jù)”、“大模型”、“大計(jì)算”。
  CSDN:您對(duì)目前的DL硬件系統(tǒng)的滿意度如何?對(duì)于DL的硬件平臺(tái)的發(fā)展,您有什么期待?
  鄢志杰:很樂于看到Intel找到了一個(gè)不同以往的對(duì)手NVIDIA,此外也看到DL在其它一些硬件(如FPGA等)上的發(fā)展。因?yàn)镈L的推動(dòng),硬件在這方面的運(yùn)算能力、通訊能力近年來(lái)都得到了很大的進(jìn)步,期待硬件廠商給我們更強(qiáng)大的支撐。
  CSDN:請(qǐng)談?wù)勀谶@次大會(huì)上即將分享的話題。
  鄢志杰:我會(huì)介紹數(shù)據(jù)技術(shù)、Machine Learning在阿里巴巴集團(tuán)和螞蟻金服客服系統(tǒng)中的好幾個(gè)很接地氣的應(yīng)用。我們通過(guò)自動(dòng)語(yǔ)音識(shí)別將IVR系統(tǒng)的客服對(duì)話數(shù)據(jù)全部轉(zhuǎn)換成文本,這些文本可以用于客服質(zhì)檢、用于提升客服小二對(duì)問題解答的一致性,還可以讓機(jī)器學(xué)習(xí)客服人員是如何一步步定位用戶的問題,并做出解答的??头緛?lái)是一個(gè)非常傳統(tǒng)的領(lǐng)域,對(duì)客服系統(tǒng)刻板的印象就是人海戰(zhàn)術(shù)、手寫規(guī)則等等。但由于機(jī)器學(xué)習(xí)的加入,這個(gè)領(lǐng)域正發(fā)生奇妙的變化。新一代的客服背后站著的是數(shù)據(jù)科學(xué)家,現(xiàn)在講的都是Data-driven、Deep Learning等等。這些嘗試應(yīng)該說(shuō)只是一個(gè)開始,是我們后續(xù)通向機(jī)器人客服的必由之路。
  CSDN:哪些聽眾最應(yīng)該了解您所分享的主題?這些話題可以幫助聽眾解決哪些問題?
  鄢志杰:一些對(duì)語(yǔ)音識(shí)別、文本分析、自然語(yǔ)言處理等DL話題感興趣的聽眾應(yīng)該會(huì)想來(lái)聽聽。我希望給大家一些全新的角度——原來(lái)DL還可以幫助客服這樣的傳統(tǒng)領(lǐng)域。
  CSDN:您最希望在BDTC上聽到什么樣的分享話題?
  鄢志杰:最新的來(lái)自Machine Learning Community的聲音,以及DL的一些落地。
?

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?