一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

微軟新AI項目為文檔和電子郵件的圖像添加字幕

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2020-11-18 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟的一項新AI項目旨在自動為文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟件讀取圖像。

微軟的研究人員在有關預印本存儲庫arXiv的論文中解釋了他們的機器學習模型的原理。

該模型使用可視語音詞匯預訓練(VIVO),它利用大量成對的圖像標簽數(shù)據(jù)來學習視覺詞匯。然后,使用帶有適當字幕的圖像的第二個數(shù)據(jù)以幫助教AI如何最好地描述圖片。

“理想情況下,每個人都應在文檔,網(wǎng)絡,社交媒體中為所有圖像添加替代文本,因為這可以使盲人訪問內(nèi)容并參與對話。但是,可惜,人們卻沒有?!蔽④汚I平臺小組的軟件工程經(jīng)理Saqib Shaikh說。

總體而言,研究人員希望AI能夠提供Microsoft現(xiàn)有字幕系統(tǒng)兩倍的性能。

為了對新AI的性能進行基準測試,研究人員將其納入了“無上限”挑戰(zhàn)。在撰寫本文時,Microsoft的AI現(xiàn)在在其排行榜上排名第一。

“無上限的挑戰(zhàn)實際上是如何描述您在訓練數(shù)據(jù)中沒有看到的那些新穎的物體?”微軟研究實驗室的首席研究經(jīng)理王麗娟評論道。

希望使用Microsoft自動字幕AI來構建應用程序的開發(fā)人員已經(jīng)可以這樣做,因為Azure Cognitive Services的Computer Vision軟件包中提供了該功能。

微軟令人印象深刻的SeeingAI應用程序?qū)⑹褂眯碌腁I進行更新,該應用程序使用計算機視覺描述視力障礙者的周圍環(huán)境。

“圖像字幕是可以實現(xiàn)廣泛服務的核心計算機視覺功能之一,”Azure AI認知服務的CTO黃表示。

黃繼續(xù)說:“我們AI的這一突破以Azure為平臺,以服務于更多客戶?!?“這不僅是研究上的突破;在Azure上將突破轉(zhuǎn)化為生產(chǎn)所需的時間也是突破?!?/p>

改進的自動字幕功能也有望在今年晚些時候在Outlook,Word和PowerPoint中使用。
責任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6686

    瀏覽量

    105793
  • AI
    AI
    +關注

    關注

    88

    文章

    35194

    瀏覽量

    280265
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進來呢?

    實踐。 開源項目貢獻代碼或者文檔。比如,幫助完善一個機器學習數(shù)據(jù)集的加載模塊的代碼,或者撰寫某個AI算法的使用說明文檔。這不僅可以提升自己
    發(fā)表于 07-08 17:44

    AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應用與項目實戰(zhàn)》這本書學習如何構建開發(fā)一個視頻應用。AI Agent是一種智能應用,能夠根據(jù)用戶需求和環(huán)境變化做出相應響應。通?;谏疃?/div>
    發(fā)表于 03-05 19:52

    DLPDLCR3310EVM如何添加1920*1080的圖像?

    我使用GUI的firmware功能更新Splash images,我添加了四副1920*1080,8位的bmp圖像,提示分辨率超過了顯示分辨率。經(jīng)嘗試,最大只能添加766*1366的圖像
    發(fā)表于 02-18 06:49

    The Bat! Voyager便攜式電子郵件客戶端軟件介紹

    ? ? The Bat! Voyager是一款便攜式電子郵件客戶端軟件,可以在任何運行 Microsoft Windows 的電腦上通過 USB 或便攜式媒體啟動。The Bat! Voyager
    的頭像 發(fā)表于 02-13 11:01 ?428次閱讀

    Spire.Cloud.Word云端Word文檔處理SDK介紹

    Microsoft Office。 Spire.Cloud.Word 能執(zhí)行多種 Word 文檔處理任務,包括生成、讀取、轉(zhuǎn)換和打印 Word 文檔,插入圖片,添加頁眉和頁腳,創(chuàng)建表格,添加
    的頭像 發(fā)表于 02-11 11:11 ?503次閱讀
    Spire.Cloud.Word云端Word<b class='flag-5'>文檔</b>處理SDK介紹

    微軟或?qū)indows11開發(fā)重心偏向AI

    年 11 月 1 日開始,微軟向 Windows 11 24H2 分批推送 5 大 AI 功能,包括可進行圖像相關操作的 ClickToDo、照片超分辨率功能、畫圖中的生成擦除和填充功能、改進
    的頭像 發(fā)表于 01-22 11:09 ?648次閱讀

    微軟Office引入AI助手Copilot并漲價

    OneNote等常用軟件中,體驗到由Copilot帶來的智能化輔助。 據(jù)悉,Copilot作為一款功能強大的AI助手,旨在幫助用戶更加高效地完成各種文檔編輯、數(shù)據(jù)分析、演示文稿制作以及郵件處理等任務。其智能化的特性和對用戶需求的
    的頭像 發(fā)表于 01-18 11:29 ?980次閱讀

    微軟與重要伙伴深化AI領域技術合作

    專場活動,展示微軟最新的智能云與AI產(chǎn)品解決方案,及生態(tài)合作伙伴的創(chuàng)新應用。立足于消費電子行業(yè)企業(yè)加速拓展全球機遇的迫切需求,微軟攜手眾多知名廠商帶來前瞻趨勢洞察與實踐案例,探索如何應
    的頭像 發(fā)表于 01-09 16:41 ?789次閱讀

    ONLYOFFICE工作區(qū):Web捆綁包助力高效團隊管理和協(xié)作

    式的媒體播放器 可填寫的在線表單 用于端到端加密文檔協(xié)作的私密房間 郵件 讓您的郵箱井井有條。在您的域名上創(chuàng)建企業(yè)郵箱或使用默認的郵箱。連接多個電子郵件賬戶,管理和標記郵件。創(chuàng)建簽名并
    的頭像 發(fā)表于 01-06 17:08 ?617次閱讀
    ONLYOFFICE工作區(qū):Web捆綁包助力高效團隊管理和協(xié)作

    萬里紅電子郵件內(nèi)容保密檢查系統(tǒng)的優(yōu)勢

    電子郵件,作為一種更正式、專業(yè)的溝通渠道,是黨政機關單位處理業(yè)務工作中必不可少的通信方式之一。電子郵件傳輸迅速、使用便捷、長期保存,很多機關單位建設了專有的電子郵件系統(tǒng),進行公文傳遞、修改和審批
    的頭像 發(fā)表于 12-13 10:11 ?697次閱讀

    微軟發(fā)布Azure AI Foundry,推動云服務增長

    。 Azure AI Foundry用戶提供了一個更為便捷的平臺,使得在支持人工智能的大型語言模型之間切換變得輕松自如。這一創(chuàng)新工具的發(fā)布,無疑將極大地降低AI應用的開發(fā)門檻,進一步推動AI
    的頭像 發(fā)表于 11-21 11:32 ?892次閱讀

    使用API連接SMTP服務器的方法

    在現(xiàn)代軟件開發(fā)中,電子郵件功能是許多應用程序的必備組件。無論是用戶注冊、密碼重置、通知發(fā)送還是營銷活動,電子郵件都是與用戶溝通的重要方式。SMTP(簡單郵件傳輸協(xié)議)是處理電子郵件發(fā)送
    的頭像 發(fā)表于 10-30 18:13 ?734次閱讀

    圖像采集卡的接口類型有哪些?

    拍攝的視頻信號從錄像帶傳送到計算機中,并能利用相關的視頻編輯軟件對數(shù)字視頻信號進行后期編輯,如切畫面,添加濾鏡、字幕和音效,設置轉(zhuǎn)場效果,添加各種視頻特效等。然后將
    的頭像 發(fā)表于 10-24 17:07 ?754次閱讀
    <b class='flag-5'>圖像</b>采集卡的接口類型有哪些?

    【免費領取】AI人工智能學習資料(學習路線圖+100余講課程+虛擬仿真平臺體驗+項目源碼+AI論文)

    想要深入學習AI人工智能嗎?現(xiàn)在機會來了!我們初學者們準備了一份全面的資料包,包括學習路線、100余講視頻課程、AI在線實驗平合體驗、項目源碼、A
    的頭像 發(fā)表于 09-27 15:50 ?841次閱讀
    【免費領取】<b class='flag-5'>AI</b>人工智能學習資料(學習路線圖+100余講課程+虛擬仿真平臺體驗+<b class='flag-5'>項目</b>源碼+<b class='flag-5'>AI</b>論文)

    Freepik攜手Magnific AI推出AI圖像生成器

    。Freepik Mystic自詡目前市場上最先進的AI圖像生成器,其獨特之處在于能夠直接生成全高清圖像,這在業(yè)界尚屬首例。
    的頭像 發(fā)表于 08-30 16:23 ?1596次閱讀