一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何開發(fā)與自定義應(yīng)用的音頻分類模

Tensorflowers ? 來源:ensorFlow ? 作者: Luiz GUStavo Martins ? 2021-10-11 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在 Google I/O 大會上我們分享了一套教程,幫大家在音頻方面使用機(jī)器學(xué)習(xí)。在這篇文章中,您可找到一些相關(guān)資源,幫助開發(fā)與自定義應(yīng)用的音頻分類模型,以及激發(fā)靈感的真實(shí)案例。

音頻機(jī)器學(xué)習(xí)

“聲音”和“音頻“兩詞有時(shí)候會被混用,但是兩者有一點(diǎn)本質(zhì)上的區(qū)別,即聲音是你聽見的內(nèi)容,而音頻則是聲音的電子表現(xiàn)形式。這就是為什么我們討論機(jī)器學(xué)習(xí)的時(shí)候使用“音頻”一詞的原由。

音頻機(jī)器學(xué)習(xí)可用于:

理解語音

識別樂器

對事件分類(例如:識別鳥的種類)

檢測音高

生成音樂

本文我們將重點(diǎn)關(guān)注”音頻事件分類“,這是一種常見需求,在現(xiàn)實(shí)生活中的應(yīng)用非常多。例如 NOAA 創(chuàng)建了座頭鯨聲波探測器,再如倫敦動(dòng)物學(xué)會使用音頻識別來保護(hù)野生動(dòng)物。

座頭鯨聲波探測器

https://www.blog.google/technology/ai/pattern-radio-whale-songs/

您現(xiàn)在就可以前往 TensorFlow Hub 體驗(yàn)多種音頻事件分類模型(YAMNet、鯨魚探測)。

TensorFlow Hub

https://hub.tensorflow.google.cn

YAMNet

https://hub.tensorflow.google.cn/google/yamnet/1

鯨魚探測

https://hub.tensorflow.google.cn/google/humpback_whale/1

音頻識別也完全能夠在設(shè)備端運(yùn)行。例如,Android 擁有一項(xiàng)聲音通知功能,此功能可在您身邊出現(xiàn)重要聲音時(shí)推送通知。這項(xiàng)功能還可以檢測設(shè)備正在播放哪種音樂,甚至還可以通過一個(gè)基于機(jī)器學(xué)習(xí)的音頻錄制器來記錄設(shè)備上的對話。

聲音通知

https://blog.google/products/android/new-sound-notifications-on-android/

正在播放哪種音樂

https://blog.google/products/pixel/on-device-ai-with-pixel4/

音頻錄制器

https://ai.googleblog.com/2019/12/the-on-device-machine-learning-behind.html

如何在自己的應(yīng)用中使用這些模型?

如何根據(jù)自己的音頻用例自定義這些模型?

部署設(shè)備端機(jī)器學(xué)習(xí)模型

想象一下,如果您已經(jīng)擁有一個(gè)音頻分類模型(例如從 TF-Hub 獲取的預(yù)訓(xùn)練模型),您會怎樣在移動(dòng)應(yīng)用上使用該模型?為了幫助您將音頻分類集成到應(yīng)用中,我們創(chuàng)建了 TensorFlow Lite Task Library。音頻分類器組件現(xiàn)已發(fā)布,您只需幾行代碼即可將音頻分類模型添加到您的應(yīng)用之中:

音頻分類器

https://tensorflow.google.cn/lite/inference_with_metadata/task_library/audio_classifier

// Initialization

val classifier = AudioClassifier.createFromFile(this, modelPath)

// Start recording

val record = classifier.createAudioRecord()

record.startRecording()

// Load latest audio samples

val tensor = classifier.createInputTensorAudio()

tensor.load(record);

// Run inference

val output = classifier.classify(tensor)

該庫負(fù)責(zé)將音頻分類模型加載到內(nèi)存,以使用適當(dāng)?shù)哪P鸵?guī)格(采樣率、比特率)和分類方法創(chuàng)建音頻錄制器,并獲取模型推理結(jié)果。您可以點(diǎn)擊此處查看完整示例并獲取靈感。

此處

https://github.com/tensorflow/examples/tree/master/lite/examples/sound_classification/android

自定義模型

如果您需要識別的音頻事件未包含在預(yù)訓(xùn)練模型提供的集合中,應(yīng)該怎么辦?或者您需要細(xì)化事件類別,又該如何?在以上情況下,您可以使用一項(xiàng)名為遷移學(xué)習(xí)的技術(shù)對模型進(jìn)行微調(diào)。

遷移學(xué)習(xí)

https://developers.google.com/machine-learning/glossary#transfer-learning

這一流程十分常規(guī),您無需成為機(jī)器學(xué)習(xí)方面的專家也能做到。在此過程中,您可以使用 Model Maker 來助您一臂之力。

Model Maker

https://tensorflow.google.cn/lite/guide/model_maker

spec = audio_classifier.YamNetSpec()

data = audio_classifier.DataLoader.from_folder(spec, DATA_DIR)

train_data, validation_data = data.split(0.8)

model = audio_classifier.create(train_data, spec, validation_data)

model.export(models_path)

您可以點(diǎn)擊此處查看完整代碼。輸出模型可使用 Task Library 直接加載。另外,Model Maker 不僅能夠自定義音頻模型,還可以自定義圖像、文本以及推薦系統(tǒng)的模型。

此處

https://tensorflow.google.cn/lite/tutorials/model_maker_audio_classification

總結(jié)

音頻機(jī)器學(xué)習(xí)是一個(gè)令人興奮的領(lǐng)域,具備許多可能性,同時(shí)支持不少新功能。借助 TensorFlow Lite Task Library 等工具,在設(shè)備端使用機(jī)器學(xué)習(xí) 變得越來越簡單便捷。有了 Model Maker,無需領(lǐng)域?qū)I(yè)知識也可進(jìn)行自定義。

您可以在我們有關(guān)設(shè)備端機(jī)器學(xué)習(xí)的新網(wǎng)站中了解詳情(點(diǎn)擊此處可前往音頻路徑)。您將找到教程、代碼 等相關(guān)資源,這些資源不僅包括如何處理音頻相關(guān)的任務(wù),還包括圖像(分類、目標(biāo)檢測)以及文本(分類、實(shí)體提取、問答)等。

設(shè)備端機(jī)器學(xué)習(xí)

https://developers.google.com/learn/topics/on-device-ml

此處

https://developers.google.com/learn/pathways/on-device-ml-5

您還可以在社交網(wǎng)絡(luò)帖子中添加 #TensorFlow 標(biāo)簽,與我們分享您在項(xiàng)目中創(chuàng)建的內(nèi)容,或者將其提交參加 TensorFlow Community Spotlight 計(jì)劃。如果有任何疑問,歡迎在 discuss.tensorflow.google.cn 上提問。

discuss.tensorflow.google.cn

https://discuss.tensorflow.google.cn/

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    30

    文章

    3042

    瀏覽量

    83433
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8502

    瀏覽量

    134589

原文標(biāo)題:如何輕松部署設(shè)備端音頻機(jī)器學(xué)習(xí)?

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    LOTO示波器自定義解碼功能—CANFD解碼

    LOTO示波器軟件更新了自定義解碼功能,并在bilibili上傳了演示視頻,視頻鏈接: https://www.bilibili.com/video/BV1wq3ezjEjQ
    的頭像 發(fā)表于 07-11 10:34 ?87次閱讀
    LOTO示波器<b class='flag-5'>自定義</b>解碼功能—CANFD解碼

    大彩講堂:VisualTFT軟件如何自定義圓形進(jìn)度條

    VisualTFT軟件如何自定義圓形進(jìn)度條
    的頭像 發(fā)表于 07-07 17:10 ?483次閱讀
    大彩講堂:VisualTFT軟件如何<b class='flag-5'>自定義</b>圓形進(jìn)度條

    KiCad 中的自定義規(guī)則(KiCon 演講)

    “ ?Seth Hillbrand 在 KiCon US 2025 上為大家介紹了 KiCad 的規(guī)則系統(tǒng),并詳細(xì)講解了自定義規(guī)則的設(shè)計(jì)與實(shí)例。? ” ? 演講主要圍繞 加強(qiáng) KiCad 中的自定義
    的頭像 發(fā)表于 06-16 11:17 ?601次閱讀
    KiCad 中的<b class='flag-5'>自定義</b>規(guī)則(KiCon 演講)

    HarmonyOS應(yīng)用自定義鍵盤解決方案

    自定義鍵盤是一種替換系統(tǒng)默認(rèn)鍵盤的解決方案,可實(shí)現(xiàn)鍵盤個(gè)性化交互。允許用戶結(jié)合業(yè)務(wù)需求與操作習(xí)慣,對按鍵布局進(jìn)行可視化重構(gòu)、設(shè)置多功能組合鍵位,使輸入更加便捷和舒適。在安全防護(hù)層面,自定義鍵盤可以
    的頭像 發(fā)表于 06-05 14:19 ?662次閱讀

    LabVIEW運(yùn)動(dòng)控制(三):EtherCAT運(yùn)動(dòng)控制器的高效加工指令自定義封裝

    LabVIEW高效加工指令自定義封裝
    的頭像 發(fā)表于 04-08 13:49 ?2693次閱讀
    LabVIEW運(yùn)動(dòng)控制(三):EtherCAT運(yùn)動(dòng)控制器的高效加工指令<b class='flag-5'>自定義</b>封裝

    如何添加自定義單板

    開發(fā)過程中,用戶有時(shí)需要?jiǎng)?chuàng)建自定義板配置。本節(jié)將通過一個(gè)實(shí)例講解用戶如何創(chuàng)建屬于自己的machine,下面以g2l-test.conf為例進(jìn)行說明。
    的頭像 發(fā)表于 03-12 14:43 ?583次閱讀

    如何快速創(chuàng)建用戶自定義Board和App工程

    可將該文件夾復(fù)制到用戶自定義的工作目錄(workspace)中,基于此模板進(jìn)行開發(fā)。本模板主要牽涉到的用戶自定義的文件有:用戶板級文件Board用戶應(yīng)用程序App用
    的頭像 發(fā)表于 02-08 13:38 ?521次閱讀
    如何快速創(chuàng)建用戶<b class='flag-5'>自定義</b>Board和App工程

    Altium Designer 15.0自定義元件設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《Altium Designer 15.0自定義元件設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 01-21 15:04 ?0次下載
    Altium Designer 15.0<b class='flag-5'>自定義</b>元件設(shè)計(jì)

    think-cell:自定義think-cell(四)

    C.5 設(shè)置默認(rèn)議程幻燈片布局 think-cell 議程可以在演示文稿中使用特定的自定義布局來定義議程、位置和議程幻燈片上的其他形狀,例如標(biāo)題或圖片。通過將此自定義布局添加到模板,您可以為整個(gè)組織
    的頭像 發(fā)表于 01-13 10:37 ?507次閱讀
    think-cell:<b class='flag-5'>自定義</b>think-cell(四)

    智能語音識別照明解決方案,平臺自定義,中英切換

    智能語音識別照明方案引入NRK3502芯片,支持平臺自定義,離線控制,中英雙語切換。NRK3502具備高性能和靈活自定義能力,可推動(dòng)智能照明革新,控制其他智能設(shè)備,為國際用戶提供全方位智能生活體驗(yàn)。
    的頭像 發(fā)表于 01-10 13:23 ?431次閱讀
    智能語音識別照明解決方案,平臺<b class='flag-5'>自定義</b>,中英切換

    think-cell;自定義think-cell(一)

    本章介紹如何自定義 think-cell,即如何更改默認(rèn)顏色和其他默認(rèn)屬性;這是通過 think-cell 的樣式文件完成的,這些文件將在前四個(gè)部分中進(jìn)行討論。 第五部分 C.5 設(shè)置默認(rèn)議程幻燈片
    的頭像 發(fā)表于 01-08 11:31 ?744次閱讀
    think-cell;<b class='flag-5'>自定義</b>think-cell(一)

    創(chuàng)建自定義的基于閃存的引導(dǎo)加載程序(BSL)

    電子發(fā)燒友網(wǎng)站提供《創(chuàng)建自定義的基于閃存的引導(dǎo)加載程序(BSL).pdf》資料免費(fèi)下載
    發(fā)表于 09-19 10:50 ?0次下載
    創(chuàng)建<b class='flag-5'>自定義</b>的基于閃存的引導(dǎo)加載程序(BSL)

    開發(fā)用于將四個(gè)ADC通道連接到MCU/MPU的自定義多通道SPI

    電子發(fā)燒友網(wǎng)站提供《開發(fā)用于將四個(gè)ADC通道連接到MCU/MPU的自定義多通道SPI.pdf》資料免費(fèi)下載
    發(fā)表于 09-02 10:12 ?0次下載
    <b class='flag-5'>開發(fā)</b>用于將四個(gè)ADC通道連接到MCU/MPU的<b class='flag-5'>自定義</b>多通道SPI

    EtherCAT運(yùn)動(dòng)控制器PT/PVT實(shí)現(xiàn)用戶自定義軌跡規(guī)劃

    EtherCAT運(yùn)動(dòng)控制器PT/PVT實(shí)現(xiàn)用戶自定義軌跡規(guī)劃。
    的頭像 發(fā)表于 08-15 11:49 ?1239次閱讀
    EtherCAT運(yùn)動(dòng)控制器PT/PVT實(shí)現(xiàn)用戶<b class='flag-5'>自定義</b>軌跡規(guī)劃

    NVIDIA NeMo加速并簡化自定義模型開發(fā)

    如果企業(yè)希望充分發(fā)揮出 AI 的力量,就需要根據(jù)其行業(yè)需求量身定制的自定義模型。
    的頭像 發(fā)表于 07-26 11:17 ?1251次閱讀
    NVIDIA NeMo加速并簡化<b class='flag-5'>自定義</b>模型<b class='flag-5'>開發(fā)</b>