一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python在音頻(Audio)領(lǐng)域中,如何進行數(shù)據(jù)擴充呢?

機器學(xué)習(xí)算法與人工智能 ? 來源:未知 ? 作者:李倩 ? 2018-04-15 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Python音頻的數(shù)據(jù)擴充

經(jīng)典的深度學(xué)習(xí)網(wǎng)絡(luò)AlexNet使用數(shù)據(jù)擴充(Data Augmentation)的方式擴大數(shù)據(jù)集,取得較好的分類效果。在深度學(xué)習(xí)的圖像領(lǐng)域中,通過平移、 翻轉(zhuǎn)、加噪等方法進行數(shù)據(jù)擴充。但是,在音頻(Audio)領(lǐng)域中,如何進行數(shù)據(jù)擴充呢?

音頻的數(shù)據(jù)擴充,主要有以下四種方式:

音頻剪裁(Clip)

音頻旋轉(zhuǎn)(Roll)

音頻調(diào)音(Tune)

音頻加噪(Noise)

音頻解析基于librosa音頻庫;矩陣操作基于scipy和numpy科學(xué)計算庫。

以下是Python的實現(xiàn)方式

01

音頻剪裁

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/love_illusion.mp3")

# 讀取音頻print y.shape, sr wavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])

# 寫入音頻

02

音頻旋轉(zhuǎn)

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 讀取音頻ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)

# 寫入音頻

03

音頻調(diào)音

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 讀取音頻ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)

# 寫入音頻

04

音頻加噪

import librosa

from scipy.io import wavfile

import numpy as np

y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 讀取音頻wn = np.random.randn(len(y)) y = np.where(y != 0.0, y + 0.02 * wn, 0.0)

# 噪聲不要添加到0上!print y.shape, sr wavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)

# 寫入音頻

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    30

    文章

    3042

    瀏覽量

    83451
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86761

原文標題:Python音頻的數(shù)據(jù)擴充

文章出處:【微信號:machinelearningai,微信公眾號:機器學(xué)習(xí)算法與人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    labview中如何進行數(shù)據(jù)存儲?

    labview中如何進行數(shù)據(jù)存儲?
    發(fā)表于 07-26 09:19

    請問問手機與電腦之間沒有網(wǎng)絡(luò)的情況下如何進行數(shù)據(jù)傳輸!

    請問問手機與電腦之間沒有網(wǎng)絡(luò)的情況下如何進行數(shù)據(jù)傳輸!
    發(fā)表于 05-31 21:15

    HX711如何進行數(shù)據(jù)處理?

    HX711如何進行數(shù)據(jù)處理?
    發(fā)表于 11-21 22:03

    利用Python進行數(shù)據(jù)分析之時間序列基礎(chǔ)

    《利用Python進行數(shù)據(jù)分析》 112時間序列基礎(chǔ)
    發(fā)表于 03-20 09:30

    如何利用Python進行數(shù)據(jù)分析

    《利用Python進行數(shù)據(jù)分析》 122高階GroupBy應(yīng)用
    發(fā)表于 04-23 07:29

    何進行數(shù)字信號處理?有哪幾個基本步驟?

    數(shù)字信號處理是如何定義的?如何進行數(shù)字信號處理?有哪幾個基本步驟?
    發(fā)表于 06-22 06:46

    串口通信中外設(shè)與開發(fā)板串口通信是如何進行數(shù)據(jù)傳輸?shù)模?/a>

    串口通信中外設(shè)與開發(fā)板串口通信是如何進行數(shù)據(jù)傳輸?shù)模?b class='flag-5'>在使用外設(shè)時怎樣將外設(shè)的數(shù)據(jù)返回給開發(fā)板
    發(fā)表于 07-07 07:58

    STM32 USART串口是如何進行數(shù)據(jù)處理的

    STM32 USART串口接收數(shù)據(jù)的具體步驟有哪些?STM32 USART串口是如何進行數(shù)據(jù)處理的
    發(fā)表于 11-25 08:56

    PC機的串口調(diào)試助手與STM32是如何進行數(shù)據(jù)收發(fā)的

    怎樣通過PC機的串口調(diào)試助手將數(shù)據(jù)發(fā)送至STM32?PC機的串口調(diào)試助手與STM32是如何進行數(shù)據(jù)收發(fā)的?
    發(fā)表于 12-09 07:17

    什么是信號處理?如何進行數(shù)字信號處理?

    什么是信號處理?如何進行數(shù)字信號處理我們的周圍存在著為數(shù)眾多的"信號"。如:從茫茫宇宙中的天體發(fā)出的微弱電波信號,移動電話發(fā)出
    發(fā)表于 03-06 10:13 ?3500次閱讀

    Python信息安全領(lǐng)域中的運用

    Python信息安全領(lǐng)域中的運用
    發(fā)表于 09-07 09:51 ?27次下載
    <b class='flag-5'>Python</b><b class='flag-5'>在</b>信息安全<b class='flag-5'>領(lǐng)域中</b>的運用

    數(shù)據(jù)庫教程之如何進行數(shù)據(jù)庫設(shè)計

    本文檔的主要內(nèi)容詳細介紹的是數(shù)據(jù)庫教程之如何進行數(shù)據(jù)庫設(shè)計內(nèi)容包括了:1 數(shù)據(jù)庫設(shè)計概述 ,2 數(shù)據(jù)庫需求分析 ,3 數(shù)據(jù)庫結(jié)構(gòu)設(shè)計 ,4
    發(fā)表于 10-19 10:41 ?21次下載
    <b class='flag-5'>數(shù)據(jù)</b>庫教程之如<b class='flag-5'>何進行數(shù)據(jù)</b>庫設(shè)計

    風格遷移中如何進行數(shù)據(jù)增強

    這是一篇關(guān)于風格遷移中如何進行數(shù)據(jù)增強的論文。introduction部分,informal--formal 的風格遷移問題,最大的障礙是訓(xùn)練數(shù)據(jù)的不足。為了解決此問題,本篇論文提出三種數(shù)據(jù)
    的頭像 發(fā)表于 01-13 09:41 ?2824次閱讀

    藍牙m(xù)idi和藍牙音頻或者藍牙audio有什么區(qū)別

    、什么是藍牙m(xù)idi,這個一般問這個問題的人,基本都懂,藍牙m(xù)idi實際就是標準midi協(xié)議的基礎(chǔ)上擴充為無線連接而已,原先的midi是靠usb傳輸,現(xiàn)在換成藍牙 3、什么是藍牙audio,這個就更簡單了,藍牙音箱或者藍牙耳
    的頭像 發(fā)表于 01-09 15:22 ?1652次閱讀
    藍牙m(xù)idi和藍牙<b class='flag-5'>音頻</b>或者藍牙<b class='flag-5'>audio</b>有什么區(qū)別<b class='flag-5'>呢</b>

    e絡(luò)盟大幅擴充PUI Audio產(chǎn)品系列以強化音頻產(chǎn)品組合

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟大幅擴充了 PUI Audio產(chǎn)品種類。作為音頻、觸覺反饋及傳感器解決方案領(lǐng)域的全球創(chuàng)新者和供應(yīng)商,PUI
    的頭像 發(fā)表于 02-18 16:29 ?521次閱讀
    e絡(luò)盟大幅<b class='flag-5'>擴充</b>PUI <b class='flag-5'>Audio</b>產(chǎn)品系列以強化<b class='flag-5'>音頻</b>產(chǎn)品組合