一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里AI打破視覺對話識別紀(jì)錄,AI的認知能力邁上新臺階!

PCB行業(yè)工程師技術(shù)交流 ? 來源:YXQ ? 2019-07-02 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日, 在第二屆視覺對話競賽Visual Dialogue Challenge中,阿里AI擊敗了微軟、首爾大學(xué)等十支參賽隊伍,獲得冠軍。

(阿里AI在視覺對話競賽中得冠)

據(jù)了解,視覺對話競賽由美國佐治亞理工大學(xué)、Facebook人工智能實驗室(FAIR)等機構(gòu)聯(lián)合全球視覺技術(shù)領(lǐng)域頂級學(xué)術(shù)會議CVPR發(fā)起,是目前視覺對話領(lǐng)域最權(quán)威的競賽之一。

該競賽要求參賽的AI在看完近萬張圖片后,回答出人類對于任一圖片任一內(nèi)容的提問。競賽結(jié)果顯示,阿里AI以74.57%的準(zhǔn)確率獲得冠軍,將上一屆比賽的紀(jì)錄提高了16.82%。在相同的數(shù)據(jù)集中,人類的準(zhǔn)確率僅為64.27%。

傳統(tǒng)的視覺AI主要針對目標(biāo)的檢測和識別,例如識別出圖片是否是一只貓,但對復(fù)雜場景中目標(biāo)之間的邏輯關(guān)系理解、推理能力較弱,無法回答“這只貓旁邊的男生穿了什么顏色的衣服”等復(fù)雜問題,也難以將圖片信息轉(zhuǎn)化為人類理解的語言輸出。

阿里AI的突破在于提出了“遞歸探索對話模型”,綜合集成了圖像識別、關(guān)系推理與自然語言理解三大能力,它通過高效利用標(biāo)注信息學(xué)習(xí)出模仿人類認知復(fù)雜場景的思維方式,能夠有效識別圖片里的實體以及它們之間的關(guān)系,推理出圖片所描述的事件內(nèi)容,并通過對上下文進行有效建模,理解人類提出的問題及真實意圖,給出自然準(zhǔn)確的回復(fù)。

視覺對話是近年來快速崛起的AI研究方向,目的在于教會機器用自然語言與人類討論視覺內(nèi)容。如果說視覺識別技術(shù),讓機器具備了視覺能力;那么視覺對話技術(shù),則使得機器擁有了對真實視覺世界的理解與推斷能力,意味著AI的認知能力將邁上新的臺階。

據(jù)了解,這項技術(shù)未來將被應(yīng)用在人機交互諸多場景:地震后在廢墟中尋找幸存者的救援機器人,能夠更加及時、高效地綜合指揮指令和場景信息作出行動;視障人士可以通過提問阿里AI,理解網(wǎng)絡(luò)照片中的內(nèi)容,了解自身所處的周圍環(huán)境;無人駕駛車輛對影響因子的意圖理解會更為準(zhǔn)確,乘客的乘坐體驗更好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279919
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1638

    瀏覽量

    48242

原文標(biāo)題:不忘初心 奮勇當(dāng)先——光華科技連續(xù)9年成為中國電子電路專用化學(xué)品民族企業(yè)No.1

文章出處:【微信號:ruziniubbs,微信公眾號:PCB行業(yè)工程師技術(shù)交流】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發(fā)個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    無人機AI視覺行為識別系統(tǒng)

    的需求。同時,人工監(jiān)控存在效率低下、易疲勞、反應(yīng)滯后等問題,無法應(yīng)對日益復(fù)雜的安全管理挑戰(zhàn)。 在這一背景下,陜西廣合通結(jié)合無人機機動性與人工智能分析能力視覺行為識別系統(tǒng)為基礎(chǔ)研發(fā)了無人機AI
    的頭像 發(fā)表于 07-04 16:53 ?201次閱讀

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡(luò)即可實現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語音視覺
    發(fā)表于 07-04 11:14

    AI視覺識別收銀稱:水果生鮮店的“智能店員”

    在水果生鮮店中,采用AI視覺識別收銀稱不僅提升了顧客的購物體驗,也為商家?guī)砹酥T多便利和效益。本文將詳細介紹這一技術(shù)的好處。一、提升收銀效率傳統(tǒng)的收銀方式需要人工逐一識別商品并進行稱重
    的頭像 發(fā)表于 06-07 10:19 ?139次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視覺</b><b class='flag-5'>識別</b>收銀稱:水果生鮮店的“智能店員”

    小智AI移植到ESP32P4-Fucntion-EV-Board實機演示

    最近參加論壇的五一活動,獲得一套小智AI的套件。當(dāng)時正好在嘗試移植小智AI到ESP32P4-Fucntion-EV-Board。最近完成了大部分功能的移植,以及可以對話了,話說屏幕大
    發(fā)表于 05-10 12:40

    正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續(xù)航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級交互體驗 ① AI情感對話:不止問答,更能陪你聊心事、講笑話,像朋友一樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換一種聲音陪伴
    發(fā)表于 04-24 16:11

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    低功耗特性。搭載 Renesas 獨有的 DRP-AI 加速器,支持 15 Sparse TOPS的 AI 計算能力,使其在計算機視覺、邊緣 AI
    發(fā)表于 03-19 17:54

    AI Agent 應(yīng)用與項目實戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    學(xué)習(xí)、自然語言處理(NLP)、計算機視覺(CV)等先進技術(shù)提供的強大的數(shù)據(jù)處理和分析能力。 在視頻應(yīng)用開發(fā)中,AI Agent可以用于視頻內(nèi)容分析、推薦、編輯等。 下面跟隨作者的指導(dǎo),使用語聚
    發(fā)表于 03-05 19:52

    行業(yè)集結(jié):共同定制 RK3566 集成 AI 眼鏡的前沿 AR 方案

    在技術(shù)革新浪潮席卷全球的當(dāng)下,一款智能視覺終端設(shè)備 —— 以 AI 眼鏡為典型代表,正以革命性姿態(tài)打破物理與數(shù)字世界的藩籬,在虛實交融的界面中搭建起多維度的認知通道。 而深圳市新創(chuàng)云智
    發(fā)表于 02-20 18:44

    杰和科技GAM-AI視覺識別管理系統(tǒng),讓AI走進零售營銷

    在數(shù)字化浪潮席卷全球零售業(yè)的今天,如何精準(zhǔn)觸達顧客需求、優(yōu)化運營效率、提升門店業(yè)績,成為實體商業(yè)破局的關(guān)鍵。GAM-AI視覺識別管理系統(tǒng)杰和科技智能零售管理系統(tǒng):GAM-AI
    的頭像 發(fā)表于 02-20 11:32 ?613次閱讀
    杰和科技GAM-<b class='flag-5'>AI</b><b class='flag-5'>視覺</b><b class='flag-5'>識別</b>管理系統(tǒng),讓<b class='flag-5'>AI</b>走進零售營銷

    AI Agent 應(yīng)用與項目實戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺的應(yīng)用

    交互模式,實現(xiàn)視覺、語音、文本的深度整合。這種整合不是簡單疊加,而是模仿人類認知系統(tǒng)的多維感知能力。 群智協(xié)作:單Agent向多Agent協(xié)同演進,通過專業(yè)分工和角色互補,處理更復(fù)雜的任務(wù)場景。這種協(xié)作
    發(fā)表于 02-19 16:35

    巨人網(wǎng)絡(luò)與阿里云深化AI合作

    基礎(chǔ),巨人網(wǎng)絡(luò)與阿里云此次深化合作,旨在探索AI在游戲領(lǐng)域的更多可能性。巨人網(wǎng)絡(luò)表示,公司正在積極研究AI的通用泛化能力、多模態(tài)內(nèi)容理解與生成,以及
    的頭像 發(fā)表于 02-14 14:06 ?567次閱讀

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能對話

    顯示發(fā)送的時間戳,以便用戶了解消息的發(fā)送時間。 這個DEMO展示了如何使用ArkTS和擴展后的ChatUI框架(或類似功能的庫)在HarmonyOS NEXT創(chuàng)建一個功能豐富的AI智能對話框。我們可以根據(jù)需要進一步定制和擴展這
    發(fā)表于 01-03 11:29

    莫拉維克悖論與多模態(tài)AI:邁向機器人認知的新時代

    莫拉維克悖論揭示了人工智能系統(tǒng)在處理高級推理與基本感知運動技能上的巨大差異。對于AI而言,復(fù)雜的邏輯任務(wù)似乎比人類習(xí)以為常的感知運動技能更容易實現(xiàn)。這一悖論凸顯了當(dāng)前AI與人類認知能力之間的鴻溝。
    的頭像 發(fā)表于 10-26 15:00 ?1247次閱讀

    基于迅為RK3588開發(fā)板的AI圖像識別方案

    源源不斷的動力。 ■ 無與倫比的視覺盛宴最高支持8K編碼+8K解碼,能夠同時處理多路視頻流,確保每一幀畫面都流暢如絲,細膩入微。 ■ 智馭未來的AI力量RK3588內(nèi)置了6Tops(即每秒處理6萬億次
    發(fā)表于 08-13 11:26