一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開發(fā)者說 | 手語翻譯系統(tǒng)系列之使用旭日X3派實(shí)現(xiàn)實(shí)時(shí)語音轉(zhuǎn)寫

地瓜機(jī)器人 ? 2023-01-05 14:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

準(zhǔn)備工作

  • 硬件部分:旭日X3派,USB免驅(qū)攝像頭,電源適配器,燒錄Ubuntu系統(tǒng)的SD卡,USB揚(yáng)聲器,顯示屏(或者VNC/SSH遠(yuǎn)程連接)

  • 軟件部分:Thonny IDE集成開發(fā)環(huán)境
2.jfif

注意:購買麥克風(fēng)時(shí)要購買二合一的USB麥克風(fēng),切勿購買3.5mm耳機(jī)接口傳輸?shù)柠溈孙L(fēng)。

首先更新軟件源和所有軟件,只需要使用快捷鍵ctrl+alt+T打開命令行,輸入以下命令,耐心等待即可。

# 更新軟件源 apt-get update # 更新升級(jí)所有軟件 apt-get upgrade

開發(fā)工具依然是沿用Thonny,作為一款輕量化的python集成開發(fā)環(huán)境,對(duì)新手十分友好,簡單易上手,后續(xù)安裝各種python依賴庫也相當(dāng)方便。安裝完成后同樣是使用快捷鍵ctrl+alt+T打開命令行,輸入Thonny啟動(dòng),然后開始項(xiàng)目的重頭戲——安裝項(xiàng)目依賴庫,需要用到的第三方庫和版本如下,大家可以根據(jù)這個(gè)順序進(jìn)行安裝,以免遺漏(也可以復(fù)制到一個(gè)新的txt文件利用pip一次性安裝)。

cffi==1.12.3 gevent==1.4.0 greenlet==0.4.15 pycparser==2.19 six==1.12.0 websocket==0.2.1 websocket-client==0.56.0

注意:有些庫安裝失敗的話代碼可能不會(huì)有高亮提示,但運(yùn)行時(shí)會(huì)報(bào)錯(cuò),所以,出現(xiàn)報(bào)錯(cuò)第一時(shí)間檢查第三方庫是否成功安裝。

本文著重介紹需要用到的Python標(biāo)準(zhǔn)GUI庫——Tkinter。

在Python程序中,Tkinter是Python的一個(gè)模塊,它可以像其他模塊一樣在Python交互式shell中(或者“.py”程序中)導(dǎo)入,導(dǎo)入Tkinter模塊后,就可使用Tkinter模塊中的函數(shù)、方法等進(jìn)行GUI編程。同時(shí),開發(fā)者也可以使用Tkinter庫中的文本框、按鈕、標(biāo)簽等組件實(shí)現(xiàn)GUI開發(fā)。

首先,需檢查Tkinter是否成功導(dǎo)入,如運(yùn)行無誤則說明導(dǎo)入成功,否之,則需要重新安裝Tkinter庫。

import tkinter

接著創(chuàng)建一個(gè)窗口,先使用http://tkinter.Tk生成一個(gè)主窗口對(duì)象,然后才能使用Tkinter模塊中其他的函數(shù)和方法等元素。生成主窗口以后才可以向里面添加組件,或者直接調(diào)用其mainloop()方法進(jìn)行消息循環(huán)。示例如下:

import tkinter #導(dǎo)入Tkinter模塊 top = tkinter.Tk()#生成一個(gè)主窗口對(duì)象 top.mainloop()#進(jìn)入消息循環(huán)

我們要有交互,就需要有組件。組件與窗口一樣,也是通過Tkinter模塊中相應(yīng)的組件函數(shù)生成的。在生成組件以后,就可以使用pack、grid或place等方法將它添加到窗口中,以下示例給窗口增添兩個(gè)按鈕:

import tkinter #導(dǎo)入Tkinter模塊 root = tkinter.Tk()#生成一個(gè)主窗口對(duì)象 label= tkinter.Label(root, text="Python, tkinter!") label.pack()#將標(biāo)簽添加到窗口中 button1 = tkinter.Button(root, text="按鈕1")#創(chuàng)建按鈕1 button1.pack(side=tkinter.LEFT)#將按鈕1添加到窗口中 button2 = tkinter.Button(root, text="按鈕2")#創(chuàng)建按鈕2 button2.pack(side=tkinter.RIGHT)#將按鈕2添加到窗口中 root.mainloop()#進(jìn)入消息循環(huán)

3.jfif

至此,用Tkinter庫創(chuàng)建一個(gè)帶交互功能的窗口已經(jīng)完成,大家感興趣可以繼續(xù)學(xué)習(xí)其他組件,這里就不再贅述。

接下來進(jìn)行云服務(wù)器部署,本項(xiàng)目選用云端語音平臺(tái),登錄平臺(tái)后,通過右上角「控制臺(tái)」,或右上角下拉菜單的「我的應(yīng)用」進(jìn)入控制臺(tái)。如果賬戶未曾創(chuàng)建過應(yīng)用,平臺(tái)會(huì)引導(dǎo)創(chuàng)建,創(chuàng)建完成后,便可通過左側(cè)的服務(wù)列表,選擇要使用的服務(wù)。

在服務(wù)管理面板中,將看到這個(gè)服務(wù)對(duì)應(yīng)的可用量、歷史用量、服務(wù)接口的驗(yàn)證信息,還有可以調(diào)用的API和SDK。值得注意的是,要將應(yīng)用創(chuàng)建后生成的APPID,APISecret和APIKey去替換代碼中的APPID,APISecret和APIKey一定要一一對(duì)應(yīng),否則會(huì)影響代碼的正常運(yùn)行!

def run(): global wsParam wsParam = Ws_Param(APPID='你的APPID', APIKey='你的APIKey',APISecret='你的APISecret') websocket.enableTrace(False) wsUrl = wsParam.create_url() ws = websocket.WebSocketApp(wsUrl, on_message=on_message, on_error=on_error, on_close=on_close) ws.on_open = on_open ws.run_forever(sslopt={"cert_reqs": ssl.CERT_NONE}, ping_timeout=2)

隨后選擇需要的語種和服務(wù)即可,支持除中文和英語外的51種外語,24種方言和1種民族語言。

4.png

實(shí)現(xiàn)原理

本項(xiàng)目主要就是利用python程序錄制本地mp3格式的用戶音頻,并將音頻上傳到云端語音平臺(tái)進(jìn)行實(shí)時(shí)轉(zhuǎn)寫,最后利用GUI庫在屏幕上展示轉(zhuǎn)寫結(jié)果(云端語音平臺(tái)翻譯文本的方法和窗口的實(shí)現(xiàn),點(diǎn)擊文末閱讀原文即可獲?。?。

效果展示

結(jié)果顯示,本項(xiàng)目對(duì)本地資源占用較小,得益于旭日X3派的高算力和高性能,溫度的控制讓人十分滿意(和上一個(gè)項(xiàng)目手語翻譯終端同時(shí)運(yùn)行也沒有問題)。

5.jfif


6.jfif

性能測試

系統(tǒng)測試方案:將程序?qū)胄袢誜3派中,接入電源后等待初始化完成,在安靜的室內(nèi)環(huán)境下,在麥克風(fēng)前分別測試普通話,英語,方言(東北話/四川話),將轉(zhuǎn)寫終端實(shí)時(shí)轉(zhuǎn)寫的準(zhǔn)確率記錄,同時(shí)將識(shí)別的總時(shí)長記錄收集。

測試數(shù)據(jù)如下:

7.jfif


8.jfif

結(jié)果分析:接收到語音信息后到完成轉(zhuǎn)寫結(jié)果的顯示總時(shí)長在0.5秒之內(nèi),可基本實(shí)現(xiàn)實(shí)時(shí)轉(zhuǎn)譯,對(duì)普通話和英文以及51種外語,24種方言和1種民族語言的識(shí)別率在95%以上。

結(jié)論:實(shí)現(xiàn)語音轉(zhuǎn)寫除了支持普通話和英語外,支持51個(gè)外國語種(包括日語、俄語、泰語、捷克語等常用語種)、24種方言(包括四川話、廣東話、河南話、上海話,閩南語等常用方言),另外,還支持一種民族語言(彝語),真正做到無障礙溝通交流。

本文轉(zhuǎn)自地平線開發(fā)者社區(qū)
原作者:鑫辰大海王

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5152

    文章

    19675

    瀏覽量

    317655
  • 語音
    +關(guān)注

    關(guān)注

    3

    文章

    399

    瀏覽量

    38713
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249595
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    開鴻Bot系列:為開源鴻蒙開發(fā)者而生!

    操作系統(tǒng),實(shí)現(xiàn)從國產(chǎn)高性能芯片到操作系統(tǒng)的全棧自主化,構(gòu)建起一站式的開源鴻蒙學(xué)習(xí)與開發(fā)平臺(tái)。融合開發(fā)與辦公場景打造開源鴻蒙生態(tài)的“第一站”作
    的頭像 發(fā)表于 05-16 16:06 ?480次閱讀
    開鴻Bot<b class='flag-5'>系列</b>:為開源鴻蒙<b class='flag-5'>開發(fā)者</b>而生!

    RDK X3 帶飛的智能護(hù)理系統(tǒng):讓機(jī)器人秒變貼心小棉襖

    濟(jì)往開來團(tuán)隊(duì)帶著超燃黑科技來了!基于 RDK X3 開發(fā)的老年智能監(jiān)控系統(tǒng),跌倒秒報(bào)警、手勢一鍵呼叫、還能陪嘮嗑!最絕的是 開源代碼直接甩鏈接 ,技術(shù)黨狂喜!
    的頭像 發(fā)表于 05-09 21:53 ?272次閱讀
    RDK <b class='flag-5'>X3</b> 帶飛的智能護(hù)理<b class='flag-5'>系統(tǒng)</b>:讓機(jī)器人秒變貼心小棉襖

    【第一彈】樹莓開發(fā)者必看!Ubuntu Snap煥新升級(jí):跨平臺(tái)開發(fā)從未如此簡單!

    導(dǎo)語:當(dāng)樹莓遇上UbuntuSnap,會(huì)發(fā)生什么?無論是用樹莓搭建智能家居中樞,還是開發(fā)物聯(lián)網(wǎng)邊緣設(shè)備,依賴管理和跨平臺(tái)兼容性始終是開發(fā)者的痛點(diǎn)。而UbuntuSnap
    的頭像 發(fā)表于 03-25 09:19 ?401次閱讀
    【第一彈】樹莓<b class='flag-5'>派</b><b class='flag-5'>開發(fā)者</b>必看!Ubuntu Snap煥新升級(jí):跨平臺(tái)<b class='flag-5'>開發(fā)</b>從未如此簡單!

    AI助力實(shí)時(shí)翻譯耳機(jī)

    是一種能夠實(shí)時(shí)將一種語言翻譯成另一種語言的耳機(jī)設(shè)備。它通常由一個(gè)耳機(jī)和一個(gè)配套的應(yīng)用程序組成,用戶可以通過應(yīng)用程序選擇需要翻譯的語言,并通過耳機(jī)聽到翻譯結(jié)果。 2
    的頭像 發(fā)表于 01-24 11:14 ?1678次閱讀
    AI助力<b class='flag-5'>實(shí)時(shí)</b><b class='flag-5'>翻譯</b>耳機(jī)

    Cadence推出Palladium Z3與Protium X3系統(tǒng)

    楷登電子(Cadence)公司近日宣布,正式推出新一代Cadence? Palladium? Z3 Emulation和Protium? X3 FPGA原型驗(yàn)證系統(tǒng)。這一組合標(biāo)志著數(shù)字孿生
    的頭像 發(fā)表于 01-07 13:48 ?1075次閱讀

    開發(fā)者的開源鴻蒙故事

    近日,在以“一切為了開發(fā)者”為主題的“2024開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)”上,開源鴻蒙5.0 Release版本正式發(fā)布,備受各方關(guān)注。該版本在系統(tǒng)完備度、分布式創(chuàng)新、開發(fā)者
    的頭像 發(fā)表于 01-06 10:28 ?873次閱讀

    《HarmonyOS第一課》煥新升級(jí),賦能開發(fā)者快速掌握鴻蒙應(yīng)用開發(fā)

    應(yīng)用集成與開發(fā)能力,能夠獨(dú)立完成復(fù)雜任務(wù)及擁有團(tuán)隊(duì)組織能力。 主題課程則聚焦前沿應(yīng)用開發(fā)主題和實(shí)踐,如應(yīng)用UX體驗(yàn)標(biāo)準(zhǔn)、實(shí)時(shí)語音與文本互轉(zhuǎn)、賬戶能力集成等應(yīng)用核心功能的
    發(fā)表于 01-02 14:24

    訊維智能語音轉(zhuǎn)寫系統(tǒng):開啟智能會(huì)議記錄新篇章!

    隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)逐漸走進(jìn)我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語音轉(zhuǎn)寫
    的頭像 發(fā)表于 11-15 15:41 ?1123次閱讀
    訊維智能<b class='flag-5'>語音</b><b class='flag-5'>轉(zhuǎn)寫</b><b class='flag-5'>系統(tǒng)</b>:開啟智能會(huì)議記錄新篇章!

    精準(zhǔn)高效,訊維智能語音轉(zhuǎn)寫系統(tǒng)打造智慧會(huì)議新體驗(yàn)!

    在快節(jié)奏的現(xiàn)代工作環(huán)境中,會(huì)議已成為企業(yè)溝通、決策和協(xié)作不可或缺的一部分。然而,傳統(tǒng)會(huì)議記錄方式往往存在效率低下、信息遺漏、人力成本高等問題。隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)應(yīng)運(yùn)而生,其中訊維智能
    的頭像 發(fā)表于 11-15 15:27 ?1055次閱讀
    精準(zhǔn)高效,訊維智能<b class='flag-5'>語音</b><b class='flag-5'>轉(zhuǎn)寫</b><b class='flag-5'>系統(tǒng)</b>打造智慧會(huì)議新體驗(yàn)!

    訊維智能語音轉(zhuǎn)寫系統(tǒng)核心優(yōu)勢大解析!

    憑借其高精度識(shí)別、實(shí)時(shí)轉(zhuǎn)寫、智能糾錯(cuò)以及多語種支持等核心優(yōu)勢,正在深刻改變著會(huì)議記錄、教育培訓(xùn)、采訪報(bào)道和法律取證等多個(gè)領(lǐng)域的工作方式,成為提升工作效率和優(yōu)化信息處理的重要工具。下面我們來整理下訊維智能語音
    的頭像 發(fā)表于 11-15 15:24 ?1028次閱讀
    訊維智能<b class='flag-5'>語音</b><b class='flag-5'>轉(zhuǎn)寫</b><b class='flag-5'>系統(tǒng)</b>核心優(yōu)勢大解析!

    香橙與昇思MindSpore合作提速,軟硬結(jié)合助力開發(fā)者構(gòu)建創(chuàng)新AI應(yīng)用

    AIpro開發(fā)板構(gòu)建創(chuàng)新AI應(yīng)用,助力開發(fā)者積累開發(fā)經(jīng)驗(yàn)、繁榮人工智能產(chǎn)業(yè)生態(tài)。目前,昇思MindSporeAI框架已實(shí)現(xiàn)預(yù)置在香橙AIp
    的頭像 發(fā)表于 11-01 17:02 ?1275次閱讀
    香橙<b class='flag-5'>派</b>與昇思MindSpore合作提速,軟硬結(jié)合助力<b class='flag-5'>開發(fā)者</b>構(gòu)建創(chuàng)新AI應(yīng)用

    KaihongOS 4.1.2開發(fā)者預(yù)覽版正式上線,誠邀開發(fā)者免費(fèi)試用!

    獨(dú)特的搶先體驗(yàn)機(jī)會(huì),涵蓋了原生應(yīng)用開發(fā)、分布式能力、原子化服務(wù)等核心功能特性,助力開發(fā)者探索國產(chǎn)操作系統(tǒng)的更多可能性。此次發(fā)布的預(yù)覽版適配RK3568、RK358
    的頭像 發(fā)表于 09-28 08:07 ?740次閱讀
    KaihongOS 4.1.2<b class='flag-5'>開發(fā)者</b>預(yù)覽版正式上線,誠邀<b class='flag-5'>開發(fā)者</b>免費(fèi)試用!

    KaihongOS 4.1.2開發(fā)者預(yù)覽版正式上線,誠邀開發(fā)者免費(fèi)試用!

    開發(fā)者提供了獨(dú)特的搶先體驗(yàn)機(jī)會(huì),涵蓋了原生應(yīng)用開發(fā)、分布式能力、原子化服務(wù)等核心功能特性,助力開發(fā)者探索國產(chǎn)操作系統(tǒng)的更多可能性。 此次發(fā)布的預(yù)覽版適配RK3568、RK3588、ES
    的頭像 發(fā)表于 09-26 15:59 ?749次閱讀

    開發(fā)者空間實(shí)踐指導(dǎo):基于 3 大 PaaS 主流服務(wù)輕松實(shí)現(xiàn)文字轉(zhuǎn)換語音

    【摘要】 基于 CodeArts API 設(shè)計(jì)語音合成接口,基于 API Explorer 調(diào)試接口,并利用 CodeArts IDE 實(shí)現(xiàn)數(shù)據(jù)流轉(zhuǎn)換為音頻 案例簡介 開發(fā)者將在云主機(jī)中
    的頭像 發(fā)表于 09-13 16:25 ?750次閱讀
    <b class='flag-5'>開發(fā)者</b>空間實(shí)踐指導(dǎo):基于 <b class='flag-5'>3</b> 大 PaaS 主流服務(wù)輕松<b class='flag-5'>實(shí)現(xiàn)</b>文字轉(zhuǎn)換<b class='flag-5'>語音</b>

    訊維智能語音轉(zhuǎn)寫系統(tǒng)確保企業(yè)數(shù)據(jù)的安全性

    隨著人工智能技術(shù)的飛速發(fā)展,智能語音轉(zhuǎn)寫系統(tǒng)逐漸走進(jìn)我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語音轉(zhuǎn)寫
    的頭像 發(fā)表于 08-02 15:53 ?1099次閱讀