一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟開發(fā)了一種新的AI圖像字幕算法

姚小熊27 ? 來源:cnBeta.COM ? 作者:cnBeta.COM ? 2020-10-15 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟開發(fā)了一種新的圖像字幕算法,在某些有限的測試中,其準確率超過了人類。該人工智能系統(tǒng)已被用于更新該公司為視障人士提供的助理應用程序 “Seeing AI”,并將很快被納入Word、Outlook和PowerPoint等其他微軟產品中。在那里,它將被用于為圖像創(chuàng)建alt文本等任務,這一功能對于提高無障礙性尤為重要。

這些應用包括微軟自己的Seeing AI,該公司于2017年首次發(fā)布。Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。它可以識別家庭物品,閱讀和掃描文本,描述場景,甚至識別朋友。它還可以用來描述其他應用中的圖像,包括電子郵件客戶端、社交媒體應用和WhatsApp等消息應用。

微軟沒有披露Seeing AI的用戶數量,但Azure AI的企業(yè)副總裁Eric Boyd告訴The Verge,該軟件是 “為盲人或低視力人士提供的領先應用之一”。Seeing AI已經連續(xù)三年被盲人和低視力iOS用戶社區(qū)AppleVis評選為最佳應用或最佳輔助應用。

微軟新的圖像字幕算法將顯著提高Seeing AI的性能,因為它不僅能識別物體,還能更精確地描述它們之間的關系。因此,該算法可以在看一張圖片時,不僅能說出圖片中包含哪些物品和物體(如 “一個人、一把椅子、一個手風琴”),還能說出它們之間的互動關系(如 “一個人坐在椅子上,正在拉手風琴”)。微軟表示,該算法是其之前自2015年開始使用的圖像字幕系統(tǒng)的兩倍。

該算法在9月份發(fā)表的一篇預印論文中進行了描述,在一個被稱為 “nocaps ”的圖像字幕基準測試上取得了有史以來最高的分數。這是一個業(yè)界領先的圖像字幕評分板,不過它有自己的限制條件。nocaps基準測試由超過166,000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15,100張圖片。這些圖片涵蓋了一系列場景,從運動到假日抓拍,再到美食攝影等等。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6686

    瀏覽量

    105767
  • AI
    AI
    +關注

    關注

    88

    文章

    35164

    瀏覽量

    279950
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Nordic收購 Neuton.AI 關于產品技術的分析

    Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是家專注于超小型機器學習(TinyML)解決方案的公司。 Neuton 開發(fā)了一種獨特的神經網
    發(fā)表于 06-28 14:18

    在 KiCad 中添加AI 助手是一種什么體驗?

    一種什么體驗? 文章出處:【微信公眾號:KiCad】歡迎添加關注!文章轉載請注明出處。
    的頭像 發(fā)表于 05-15 14:28 ?281次閱讀

    【「零基礎開發(fā)AI Agent」閱讀體驗】+讀《零基礎開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    收到發(fā)燒友網站寄來的《零基礎開發(fā)AI Agent》這本書已經有好些天了,這段時間有幸拜讀了下全書,掌握了開發(fā)智能體的方法。 該書充分從
    發(fā)表于 05-14 19:51

    基于RV1126開發(fā)板的AI算法開發(fā)流程

    AI算法開發(fā)流程由需求分析到準備數據,然后到選取模型,訓練模型,接著模型轉換后進行模型部署
    的頭像 發(fā)表于 04-18 14:03 ?1451次閱讀
    基于RV1126<b class='flag-5'>開發(fā)</b>板的<b class='flag-5'>AI</b><b class='flag-5'>算法</b><b class='flag-5'>開發(fā)</b>流程

    基于RV1126開發(fā)板的AI算法開發(fā)流程

    AI算法開發(fā)流程由需求分析到準備數據,然后到選取模型,訓練模型,接著模型轉換后進行模型部署
    的頭像 發(fā)表于 04-18 10:47 ?280次閱讀
    基于RV1126<b class='flag-5'>開發(fā)</b>板的<b class='flag-5'>AI</b><b class='flag-5'>算法</b><b class='flag-5'>開發(fā)</b>流程

    AI算法托管平臺是什么

    AI算法托管平臺是一種提供AI模型運行、管理和優(yōu)化等服務的云端或邊緣計算平臺。下面,AI部落小編帶您詳細了解
    的頭像 發(fā)表于 03-06 10:22 ?392次閱讀

    AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應用與項目實戰(zhàn)》這本書學習如何構建開發(fā)個視頻應用。AI Agent是一種智能
    發(fā)表于 03-05 19:52

    微軟AI開發(fā)者挑戰(zhàn)賽即將開啟

    人工智能,正在重塑世界。2 月 5 日至 4 月 23 日,加入我們,共赴場聚焦 AI 技術的開發(fā)者挑戰(zhàn)賽!在這里,創(chuàng)意、技術和無限可能將碰撞出耀眼火花。無論你是開發(fā)新秀還是經驗豐富
    的頭像 發(fā)表于 02-12 16:18 ?444次閱讀

    微軟或將Windows11開發(fā)重心偏向AI

    據報道,科技媒體 Windows Latest 于 1 月 21 日 報道認為 微軟已將 Windows 11 系統(tǒng)的開發(fā)重心放在 AI 應用方面。相關表現(xiàn)和舉措如下: 功能更新方面:在 2024
    的頭像 發(fā)表于 01-22 11:09 ?640次閱讀

    微軟起訴繞過云AI安全工具開發(fā)

    微軟公司近期針對某組織提起了宗法律訴訟,指控該組織故意開發(fā)并使用非法工具,以繞過微軟AI產品的安全防護措施。這
    的頭像 發(fā)表于 01-13 14:46 ?490次閱讀

    AI圖像識別攝像機

    AI圖像識別攝像機是一種集成了先進算法和深度學習模型的智能監(jiān)控設備。這些攝像機不僅能夠捕捉視頻畫面,還能實時分析和處理所拍攝的內容,從而實現(xiàn)對特定對象、場景或行
    的頭像 發(fā)表于 11-08 10:38 ?874次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識別攝像機

    愛普生開發(fā)了一種烤箱控制的晶體振蕩器,其功耗比傳統(tǒng)OCXOs1低56%

    愛普生開發(fā)了一種烤箱控制的晶體振蕩器,其功耗比傳統(tǒng)OCXOs1低56%-該振蕩器小巧且節(jié)能,是下代通信基礎設施中參考信號源應用的理想選擇-精工愛普生公司(TSE:6724,“愛普生”)開發(fā)了
    的頭像 發(fā)表于 10-29 11:28 ?602次閱讀
    愛普生<b class='flag-5'>開發(fā)了</b><b class='flag-5'>一種</b>烤箱控制的晶體振蕩器,其功耗比傳統(tǒng)OCXOs1低56%

    AI大模型在圖像識別中的優(yōu)勢

    AI大模型在圖像識別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強大的計算能力、深度學習算法以及大規(guī)模的數據處理能力。以下是對AI大模型在圖像
    的頭像 發(fā)表于 10-23 15:01 ?2439次閱讀

    BitEnergy AI公司開發(fā)一種AI處理方法

    BitEnergy AI公司,家專注于人工智能(AI)推理技術的企業(yè),其工程師團隊創(chuàng)新性地開發(fā)了一種名為線性復雜度乘法(L-Mul)的
    的頭像 發(fā)表于 10-22 15:15 ?836次閱讀

    HOMEE AI利用NVIDIA Omniverse開發(fā)出“AI即服務”空間規(guī)劃解決方案

    HOMEE AI 是 NVIDIA 初創(chuàng)加速計劃成員。該公司開發(fā)了一種AI 即服務”空間規(guī)劃解決方案,旨在為價值 6500 億美元的全球家居裝飾市場帶來變革。目前,該公司正在幫助家具
    的頭像 發(fā)表于 09-09 10:00 ?836次閱讀
    HOMEE <b class='flag-5'>AI</b>利用NVIDIA Omniverse<b class='flag-5'>開發(fā)</b>出“<b class='flag-5'>AI</b>即服務”空間規(guī)劃解決方案