哥倫比亞大學(xué)的工程師們宣布一項(xiàng)實(shí)驗(yàn)技術(shù),該技術(shù)可模仿大腦檢測(cè)和放大許多聲音的天生能力。這種由大腦控制的助聽器由人工智能驅(qū)動(dòng),可作為自動(dòng)過濾器,監(jiān)控佩戴者的腦電波并增強(qiáng)他們想要關(guān)注的聲音。雖然仍處于早期開發(fā)階段,但該技術(shù)是邁向更好助聽器的重要一步,使佩戴者能夠無縫,高效地與周圍的人交談。
人類大腦具有非凡的能力,可以在嘈雜的環(huán)境中挑選出特定的聲音。比如,在嘈雜的酒吧里留意中意對(duì)象的說話、在車水馬龍的街道分辨身后來車等等。
這在人類來說很輕松就能做到,可連最先進(jìn)的助聽器也無法實(shí)現(xiàn)。不過,哥倫比亞大學(xué)的工程師們正在改變這種情況。
他們宣布已經(jīng)實(shí)現(xiàn)一項(xiàng)技術(shù),可以模仿大腦天生具備的檢測(cè)并放大特定聲音的能力,并開發(fā)出一款由大腦控制的助聽器。
助聽器由AI驅(qū)動(dòng),可作為自動(dòng)過濾器,監(jiān)控佩戴者的腦電波并增強(qiáng)他們想要關(guān)注的聲音,從而能夠讓佩戴者無縫并高效地與周圍的人交流。
論文發(fā)表在Science Advances上。據(jù)悉,一作Cong Han在杭州科技大學(xué)獲得學(xué)士學(xué)位,在哥倫比亞大學(xué)獲得碩士學(xué)位。
雞尾酒會(huì)難題
哥倫比亞大學(xué)Mortimer B. Zuckerman Mind Brain Behavior Institute的主要研究員和該論文的資深作者Nima Mesgarani博士說,處理聲音的大腦區(qū)域非常敏感,也非常強(qiáng)大,可以毫不費(fèi)力的放大一個(gè)特定聲音而不牽扯其他聲音,今天的助聽器卻做不到。
那么通過創(chuàng)造一種利用大腦本能的助聽設(shè)備,有望使全球數(shù)億聽障人士能夠像普通人一樣輕松地進(jìn)行交流。
現(xiàn)代助聽器在降噪方面已經(jīng)做的非常出色了,但實(shí)現(xiàn)的過程卻是通過提高特定種類的聲音,使其蓋過其它背景音??茖W(xué)家稱之為雞尾酒會(huì)難題。
想象一下,我們?cè)谝粋€(gè)嘈雜的雞尾酒會(huì),不僅每個(gè)人都在說話,大廳還放著BGM。為了讓身邊的人聽清楚你不得不提高嗓門說話,而旁邊的人為了讓你聽清楚也不得不提高自己的音量。
哥倫比亞工程公司電氣工程副教授Mesgarani博士說:“助聽器會(huì)立刻放大所有人的聲音,你仍然無法將你的談話對(duì)象和其他人區(qū)分出來”
用腦電波來放大特定聲音
為什么會(huì)想到利用腦電波呢?Mesgarani稱他們發(fā)現(xiàn)兩個(gè)人在交談的時(shí)候,講者的腦電波開始和聽著趨同。
于是該團(tuán)隊(duì)將語音分離算法與神經(jīng)網(wǎng)絡(luò)、以及模仿大腦自然計(jì)算能力的復(fù)雜數(shù)學(xué)模型相結(jié)合,開發(fā)了一款腦控助聽器,使用腦電波來判斷哪些聲音應(yīng)該被放大,哪些聲音應(yīng)該被抑制。
具體實(shí)現(xiàn)方式如下:
首先從一個(gè)組中分離出每個(gè)說話者的聲音。設(shè)備自動(dòng)將多個(gè)揚(yáng)聲器分離成單獨(dú)的流,然后將每個(gè)揚(yáng)聲器與來自用戶大腦的神經(jīng)數(shù)據(jù)進(jìn)行比對(duì)。一旦某人的聲音模式與聽者的腦電波匹配度最高,他的聲音就會(huì)被放大。
其實(shí)團(tuán)隊(duì)早在2年前就發(fā)布了這項(xiàng)技術(shù)的初代版本,但限于預(yù)訓(xùn)練數(shù)據(jù)集,效果剛開始不是很理想。比如一旦出現(xiàn)不在數(shù)據(jù)集的聲音,比如來個(gè)路人問路,系統(tǒng)就凌亂了。
好在哥倫比亞科技風(fēng)險(xiǎn)投資公司的資助下,團(tuán)隊(duì)對(duì)原始算法進(jìn)行了改進(jìn),Mesgarani博士、第一作者Cong Han和James O'Sullivan博士再次利用深度神經(jīng)網(wǎng)絡(luò),構(gòu)建了一個(gè)更加復(fù)雜的模型,從而能夠識(shí)別任何人聲,從而解決了上述問題。
室內(nèi)測(cè)試顯示,效果還不錯(cuò)
為了測(cè)試該算法的有效性,研究人員與Northwell Health Institute for Neurology and Neurosurgery的神經(jīng)外科醫(yī)生Ashesh Dinesh Mehta合作,找來志愿患者聽取不同的講者發(fā)言,研究人員利用植入患者大腦的電極直接監(jiān)測(cè)他們的腦電波、
當(dāng)患者專注于一個(gè)揚(yáng)聲器時(shí),系統(tǒng)會(huì)自動(dòng)放大該聲音。當(dāng)他們的注意力轉(zhuǎn)移到另一個(gè)揚(yáng)聲器時(shí),音量水平發(fā)生變化以反映這種轉(zhuǎn)變。
接下里,研究人員希望不用植入大腦這種太過簡單粗暴的方式,例如將其置于頭皮外部或耳朵周圍。
目前為止只在室內(nèi)環(huán)境中進(jìn)行了測(cè)試,Mesgarani博士說未來有望在室外環(huán)境也實(shí)現(xiàn)相同的效果。
-
助聽器
+關(guān)注
關(guān)注
18文章
179瀏覽量
40951 -
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
279884 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25447
原文標(biāo)題:Sceince子刊:利用AI+腦電波,鎖定你想聽的聲音
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
研華榮登2025 AI+工業(yè)場(chǎng)景創(chuàng)新領(lǐng)軍企業(yè)榜
AMD攜手微軟共迎Windows 11 AI+ PC 生態(tài)新篇章

微軟推出全新Surface Windows11 AI+ PC Surface Laptop 13 英寸和Surface Pro 12英寸
國產(chǎn)低噪聲4/6/8通道24位模數(shù)轉(zhuǎn)換器軟硬件替換AD1299應(yīng)用于腦電波

用意念控制燈光亮度?這個(gè)樹莓派項(xiàng)目有點(diǎn)意思...

正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續(xù)航,語音暢聊,情景對(duì)話,知識(shí)科普,多色可選,隨身攜帶!
軟通動(dòng)力正式加入“AI+出海合作生態(tài)聯(lián)盟”

Normal Awake腦電波形時(shí)域分析參考

微軟推出全新Windows 11 AI+ PC產(chǎn)品
科技云報(bào)到:從大模型到云端,“AI+云計(jì)算”還能講出什么新故事
ADS1299EEGFE-PDK按照手冊(cè)里設(shè)置后,無法產(chǎn)生正常的腦電波波形是怎么回事?
ADS1299開發(fā)板怎么接線測(cè)腦電信號(hào),用什么樣的線采集腦電波,在哪個(gè)位置?
共創(chuàng)AI+時(shí)代——2024中國移動(dòng)全球合作伙伴大會(huì)

簡儀高性能平臺(tái)在小鼠腦電波實(shí)驗(yàn)中的應(yīng)用

評(píng)論