一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Seeing AI幫助盲人和弱視用戶“看”世界

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 作者:胡薇 ? 2018-05-15 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)盲犬可以很好地幫助盲人或視障人士出行,但是如果想辨別出前面路口的標(biāo)識(shí),或者想知道錢包里還有多少錢,導(dǎo)盲犬可就辦不到了。

由微軟AI研究小組開發(fā)的應(yīng)用程序Seeing AI為這個(gè)問題給出了解決方案。該應(yīng)用程序可為盲人和弱視用戶描述這個(gè)世界,使他們可以使用自己的智能手機(jī)來識(shí)別一切:包括單個(gè)物體、顏色、鈔票、文檔等。

自去年問世以來,這一應(yīng)用程序的下載量已突破15萬次,執(zhí)行任務(wù)500萬次,其中一些任務(wù)的服務(wù)對(duì)象還是全球知名的盲人。

“Stevie Wonder(美國(guó)知名藝人)每天都會(huì)用,這確實(shí)很令人振奮。”微軟高級(jí)數(shù)據(jù)科學(xué)家Anirudh Koul在3月于圣何塞舉行的GPU技術(shù)大會(huì)上發(fā)表演講時(shí)說道。

該應(yīng)用程序的現(xiàn)場(chǎng)演示就已展現(xiàn)出了其強(qiáng)大的功能。和Koul一同上臺(tái)的還有他的一位同事,當(dāng)他在自己的智能手機(jī)上運(yùn)行應(yīng)用程序,并將手機(jī)朝向他的同事時(shí),應(yīng)用程序描述他看到的是“一位31歲、有著黑頭發(fā)、戴著眼鏡且看起來很開心的男士”。

如果這位同事在他的聯(lián)系人列表中,則有更佳的使用效果,因?yàn)镾eeing AI可以與用戶的聯(lián)系人進(jìn)行整合,并能識(shí)別出朋友的名字。

Koul還分享了幾個(gè)令人嘆服的使用案例:一位盲人教師將運(yùn)行該應(yīng)用的手機(jī)面朝教室門口,這樣孩子們就不會(huì)因她是盲人而趁機(jī)偷偷進(jìn)出教室;另一位用戶在颶風(fēng)肆虐的地區(qū)穿行時(shí),利用這款應(yīng)用程序避開了倒落的電線和其他障礙物。

Seeing AI的開發(fā)始于2014年2月,開發(fā)人員曾試圖創(chuàng)建一個(gè)能發(fā)現(xiàn)并識(shí)別周圍物體的卷積神經(jīng)網(wǎng)絡(luò)。但是其延遲時(shí)間達(dá)10秒,這樣的速度不能及時(shí)幫助人們快速作出決策。

第二年,微軟贊助了一場(chǎng)為期一周的黑客馬拉松,活動(dòng)共吸引了13000人參與,并由此引發(fā)了第二次嘗試:在用戶的頭上配備手機(jī)。

在使用智能眼鏡進(jìn)行試驗(yàn)后,Koul的團(tuán)隊(duì)開始著手于應(yīng)用程序本身的開發(fā)工作。網(wǎng)絡(luò)本地訓(xùn)練過程在NVIDIA GPU上進(jìn)行,而較為繁重的工作則交給了基于NVIDIA Tesla P100 GPU運(yùn)行的Azure云實(shí)例。通過逐幀分析確定每一部分訓(xùn)練的發(fā)生位置。

AI調(diào)優(yōu)

應(yīng)用程序需要辨別不同圖像,而圖像屬性具有不確定性,所以開發(fā)人員針對(duì)此特性對(duì)模型進(jìn)行了訓(xùn)練。例如,如果訓(xùn)練應(yīng)用程序識(shí)別貨幣,則需要向訓(xùn)練網(wǎng)絡(luò)內(nèi)輸入不清晰和無背景的貨幣圖片,以及貨幣某一極小部分放大后的圖片,再讓其識(shí)別出圖片的真實(shí)內(nèi)容。

該團(tuán)隊(duì)向志愿者征集,最終得到了各種類型的圖片,其中包括一張貓咪玩紙幣的圖片,以及紙幣被封在冰塊中的照片。通過這些變量對(duì)模型進(jìn)行訓(xùn)練,最終就能夠計(jì)算出識(shí)別圖片所需的最小參數(shù)。

Koul的團(tuán)隊(duì)對(duì)網(wǎng)絡(luò)進(jìn)行了調(diào)整,使其傾向于得出否定性分類或不分類的結(jié)果,而不是猜測(cè)結(jié)果(這樣可能將5元鈔票識(shí)別成10元),因?yàn)椴聹y(cè)很顯然會(huì)給盲人用戶造成麻煩。

隨著用戶人數(shù)的增多,這款應(yīng)用程序也將變得越好、越準(zhǔn)確。AI將會(huì)成為盲人和視障用戶的福音。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能手機(jī)
    +關(guān)注

    關(guān)注

    66

    文章

    18621

    瀏覽量

    183742
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279135

原文標(biāo)題:重見光明:深度學(xué)習(xí)幫助盲人“看”到世界

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI智能體對(duì)電子企業(yè)的幫助是什么

    對(duì)企業(yè)的具體幫助,并聚焦于萬達(dá)寶LAIDFU(來福)這一創(chuàng)新產(chǎn)品,展示其如何通過自定義應(yīng)用場(chǎng)景,輕松觸及傳統(tǒng)數(shù)據(jù)難以覆蓋的領(lǐng)域。一、AI智能體:企業(yè)轉(zhuǎn)型升級(jí)的催化劑
    的頭像 發(fā)表于 05-21 10:08 ?187次閱讀
    <b class='flag-5'>AI</b>智能體對(duì)電子企業(yè)的<b class='flag-5'>幫助</b>是什么

    機(jī)器人和自動(dòng)化的未來(2)

    本文是第二屆電力電子科普征文大賽的獲獎(jiǎng)作品,來自西南交通大學(xué)黃雯珂的投稿。3機(jī)器人與自動(dòng)化的未來展望隨著機(jī)器人和自動(dòng)化技術(shù)的不斷進(jìn)步,未來的世界將會(huì)是一個(gè)高度自動(dòng)化的世界。智能工廠、智慧家庭
    的頭像 發(fā)表于 04-26 08:33 ?324次閱讀
    機(jī)器<b class='flag-5'>人和</b>自動(dòng)化的未來(2)

    NVIDIA Cosmos加速機(jī)器人和自動(dòng)駕駛汽車物理AI發(fā)展

    NVIDIA Cosmos 通過可預(yù)測(cè)未來世界狀態(tài)的世界基礎(chǔ)模型加速物理 AI 的發(fā)展。
    的頭像 發(fā)表于 04-24 11:01 ?530次閱讀
    NVIDIA Cosmos加速機(jī)器<b class='flag-5'>人和</b>自動(dòng)駕駛汽車物理<b class='flag-5'>AI</b>發(fā)展

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    新模型可實(shí)現(xiàn)物理 AI 的預(yù)測(cè)、可控世界生成和推理。 兩款全新Blueprint為機(jī)器人和自動(dòng)駕駛汽車后訓(xùn)練提供海量物理 AI 合成數(shù)據(jù)生成技術(shù)。 1X、Agility Robotic
    的頭像 發(fā)表于 03-20 19:01 ?871次閱讀

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計(jì)算、嵌入式系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺(tái)旨在滿足開發(fā)者和企業(yè)用戶對(duì)高性能、低功耗和靈活擴(kuò)展的需求。 []() 領(lǐng)先的計(jì)算
    發(fā)表于 03-19 17:54

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》是一本為普通人量身打造的AI開發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展,還通過詳細(xì)的工具介紹和實(shí)戰(zhàn)案例,幫助讀者快速掌握
    發(fā)表于 03-18 12:03

    中興通訊亮相2025年世界移動(dòng)通信大會(huì)

    近日,中興通訊攜全隊(duì)列多形態(tài)AI終端亮相世界移動(dòng)通信大會(huì)(MWC25巴塞羅那),為全球用戶帶來全場(chǎng)景AI體驗(yàn)。
    的頭像 發(fā)表于 03-10 10:12 ?687次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個(gè)視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)。通?;谏疃?/div>
    發(fā)表于 03-05 19:52

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    ”“大模型圈的大黑馬”“硅谷震驚了”“來自中國(guó)的學(xué)霸級(jí)AI”…… 從智能手機(jī)到自動(dòng)駕駛,從數(shù)據(jù)中心到物聯(lián)網(wǎng),F(xiàn)PGA 正悄然改變著我們的生活。未來,F(xiàn)PGA 又將如何塑造世界?DeepSeek 帶你一起
    發(fā)表于 03-03 11:21

    傳音深耕小語種AI語音技術(shù) 賦能新興市場(chǎng)用戶智慧生活

    在科技飛速發(fā)展的當(dāng)下,AI已成為全球科技浪潮的弄潮兒。據(jù)移動(dòng)應(yīng)用分析機(jī)構(gòu)SensorTower數(shù)據(jù)顯示,2024年全球手機(jī)用戶AI聊天機(jī)器人和AI
    的頭像 發(fā)表于 02-25 11:29 ?612次閱讀
    傳音深耕小語種<b class='flag-5'>AI</b>語音技術(shù) 賦能新興市場(chǎng)<b class='flag-5'>用戶</b>智慧生活

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    在數(shù)字化轉(zhuǎn)型的浪潮中,AI與邊緣計(jì)算的結(jié)合正掀起一場(chǎng)深刻的產(chǎn)業(yè)變革。邊緣網(wǎng)關(guān)作為連接物理世界與數(shù)字世界的橋梁,在AI技術(shù)的加持下,正從簡(jiǎn)單的數(shù)據(jù)采集傳輸節(jié)點(diǎn),進(jìn)化為具備智能決策能力的邊
    發(fā)表于 02-15 11:41

    全球手機(jī)用戶2024年為AI應(yīng)用消費(fèi)超12億美元

    據(jù)最新數(shù)據(jù)顯示,全球手機(jī)用戶在2024年為AI應(yīng)用,特別是AI聊天機(jī)器人和AI藝術(shù)生成工具的消費(fèi)金額達(dá)到了驚人的12.7億美元。這一數(shù)據(jù)由知
    的頭像 發(fā)表于 02-05 16:11 ?469次閱讀

    AI基礎(chǔ)數(shù)據(jù)服務(wù)是AI產(chǎn)業(yè)的關(guān)鍵支撐

    數(shù)據(jù)、算法和算力是構(gòu)建AI系統(tǒng)的三大核心要素,三者的協(xié)同使現(xiàn)代AI技術(shù)實(shí)現(xiàn)了從理論到應(yīng)用的飛躍。算法是處理信息、提取特征、進(jìn)行預(yù)測(cè)的邏輯框架;算力支持算法處理龐人和復(fù)雜的數(shù)據(jù)集,使得研究人員能夠探索
    的頭像 發(fā)表于 12-13 15:45 ?676次閱讀
    <b class='flag-5'>AI</b>基礎(chǔ)數(shù)據(jù)服務(wù)是<b class='flag-5'>AI</b>產(chǎn)業(yè)的關(guān)鍵支撐

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料。
    發(fā)表于 09-09 15:36

    FMEA:解鎖AI用戶體驗(yàn)新境界,直擊用戶心坎的智能鑰匙

    在復(fù)雜多變的AI系統(tǒng)中,F(xiàn)MEA不僅僅是傳統(tǒng)制造業(yè)中預(yù)防缺陷的工具,它更是一把解鎖AI用戶體驗(yàn)新境界的鑰匙。通過系統(tǒng)地識(shí)別、評(píng)估AI系統(tǒng)可能面臨的失效模式及其對(duì)
    的頭像 發(fā)表于 09-05 11:02 ?627次閱讀