一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型

Felix分析 ? 來源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2025-06-15 01:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)根據(jù)門薩智商(IQ)測試中的表現(xiàn),OpenAI o3 在全球 “智商最高” 的人工智能模型 TOP 24 中位居榜首,在門薩測試中獲得了 135 的高分,躋身 “天才” 行列;Anthropic 的 Claude-4 Sonnet 和谷歌的 Gemini 2.0 Flash Thinking 緊隨其后,測試得分分別為 127 和 126。


如圖所示,排名前十的人工智能模型均為純文本模型,新一代的 Gemini 2.5 Pro、OpenAI o4 mini、馬斯克旗下 xAI 的 Grok-3 Think 的得分高于人類的平均智商范圍。另外,排名后五位的均為多模態(tài)模型,這類模型具備讀取和處理圖像的能力。其中,OpenAI GPT-4o(Vision)和 Grok-3 Think(Vision)的得分分別為 63 分和 60 分,遠低于人類平均水平。

wKgZPGhL9fOAKDjCAAOX_NiuXik498.jpg

OpenAI o3 名副其實

實際上,就在此次測試之前,OpenAI 公司就曾公開透露,OpenAI o3 是全球最聰明的 AI 大模型。作為 OpenAI 公司于 2025 年 4 月 17 日最新發(fā)布的大模型,OpenAI o3 首次能夠智能地使用和組合 ChatGPT 中的所有工具 —— 包括搜索網(wǎng)頁、使用 Python 分析上傳的文件和其他數(shù)據(jù)、對視覺輸入進行深度推理,甚至生成圖像。據(jù)介紹,這些模型經(jīng)過訓練,能夠推理何時以及如何使用工具,以正確的輸出格式生成詳細且周全的答案,從而解決更復雜的問題。

OpenAI 表示,o3 模型特別針對數(shù)學、編碼、科學和圖像理解進行了優(yōu)化,定位為 OpenAI 當前最強大、最前沿的推理引擎,擅長處理答案不明確、需要多方面綜合分析的復雜查詢。o3 模型引入 “私人思想鏈”(private chain of thought),在生成回答前暫停并模擬人類逐步推理過程,通過動態(tài)分配計算資源(低 / 中 / 高模式),平衡速度與準確性。

不過,根據(jù)此前的報道,OpenAI o3 似乎過于聰明,出現(xiàn)不聽人類指令、拒絕自我關(guān)閉的情況。美國 AI 安全機構(gòu)帕利塞德研究所說,o3 破壞關(guān)閉機制以阻止自己被關(guān)閉,“甚至在得到清晰指令時”。這家研究所說:“據(jù)我們所知,這是 AI 模型首次被發(fā)現(xiàn)在收到…… 清晰指令后阻止自己被關(guān)閉,目前無法確定 o3 不服從關(guān)閉指令的原因?!?br />

多模態(tài)大模型為何 IQ 不高?

多模態(tài)大模型在門薩智商測試中表現(xiàn)不佳,主要源于其技術(shù)特性與人類認知能力的本質(zhì)差異。門薩測試的核心是通過圖形、數(shù)列等題目考察抽象邏輯規(guī)則的發(fā)現(xiàn)與應用能力。例如,圖形推理題要求識別旋轉(zhuǎn)、鏡像、數(shù)量變化等復雜規(guī)律,并將其遷移到新情境中。雖然多模態(tài)模型能通過統(tǒng)計學習捕捉表面模式,但缺乏對規(guī)則本質(zhì)的理解。

首先,多模態(tài) AI 大模型存在規(guī)則泛化不足的問題,模型傾向于依賴訓練數(shù)據(jù)中的具體模式,而非真正掌握邏輯關(guān)系。例如,在涉及多維度交叉分析的高階圖形題中,模型常因無法同時處理形狀、顏色、位置等多個變量而失敗。

其次,多模態(tài) AI 大模型數(shù)學邏輯薄弱,門薩智商測試的中階題目需要挖掘隱藏的數(shù)學關(guān)系(如數(shù)列中的遞推公式),但模型往往停留在直觀層面,難以進行深度運算。

因此,多模態(tài)大模型在門薩測試中的低分反映了當前 AI 技術(shù)的核心瓶頸:缺乏真正的抽象推理、常識理解和動態(tài)決策能力。盡管模型在特定任務(wù)上表現(xiàn)出色,但其智能本質(zhì)上是 “模式擬合” 而非 “認知理解”。未來,需通過改進跨模態(tài)融合機制、增強物理常識建模、優(yōu)化快速推理算法等方向?qū)で笸黄?,但短期?nèi)仍難以達到人類水平的綜合智商。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1204

    瀏覽量

    8739
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DeepSeek開源新版R1 媲美OpenAI o3

    ;還有一些網(wǎng)友的實測評價都顯示,?DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性價比的平替。 此外,關(guān)于DeepSeek的R2大模型的傳聞也很多
    的頭像 發(fā)表于 05-29 11:23 ?394次閱讀

    這個超強AI模型!開始不聽人類指令,拒絕關(guān)閉!

    這項研究,并表示尚不清楚OpenAI的軟件為何會違抗命令。 ? Palisade表示,o3模型破壞了一個用于關(guān)閉系統(tǒng)的機制,以阻止自身被關(guān)閉。OpenAI的另外兩個
    的頭像 發(fā)表于 05-28 00:06 ?6455次閱讀

    啟明智顯集成DeepSeek、豆包、OpenAI全球先進AI模型,助力傳統(tǒng)產(chǎn)品AI智能升級

    啟明智顯借助豆包、Deepseek、OpenAI全球先進AI模型,助力傳統(tǒng)產(chǎn)品實現(xiàn)AI智能升級
    的頭像 發(fā)表于 02-24 16:12 ?869次閱讀
    啟明智顯集成DeepSeek、豆包、<b class='flag-5'>OpenAI</b>等<b class='flag-5'>全球</b>先進<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,助力傳統(tǒng)產(chǎn)品<b class='flag-5'>AI</b>智能升級

    OpenAI O3與DeepSeek R1:推理模型性能深度分析

    OpenAI剛推出的O3和DeepSeek的R1代表了推理模型領(lǐng)域的重大進步。這兩種模型都因在各種基準測試中的出色表現(xiàn)而備受關(guān)注,引發(fā)了人們對人工智能的未來及其對各個行業(yè)的潛在影響的討
    的頭像 發(fā)表于 02-18 11:07 ?901次閱讀

    今日看點丨OpenAI將發(fā)布新的GPT-4.5模型;三星西安工廠將升級286層NAND閃存工藝

    OpenAI期望的性能。阿爾特曼表示,該模型將是公司推出的最后一款不使用額外計算能力來模仿人類推理方式的模型OpenAI在一些更新的模型
    發(fā)表于 02-13 11:22 ?525次閱讀

    OpenAI即將推出GPT-5模型

    先進技術(shù),其中包括備受矚目的o3工具。通過整合這些技術(shù),GPT-5模型將實現(xiàn)更加強大的功能和性能。 值得一提的是,GPT-5模型將被廣泛應用于OpenAI的聊天機器人ChatGPT以及
    的頭像 發(fā)表于 02-13 11:21 ?561次閱讀

    OpenAIo3-mini和DeepSeek R1高級AI推理的完整比較

    科學任務(wù)而設(shè)計的,但它們在設(shè)計、性能、成本和方法上都有所不同。 本文用簡單而專業(yè)的語言解釋了這些差異,檢查每個模型的架構(gòu)、性能基準、定價和用例,以幫助讀者決定哪一個最適合您的需求。 OpenAI o3-mini概述
    的頭像 發(fā)表于 02-11 11:30 ?802次閱讀
    <b class='flag-5'>OpenAI</b>的<b class='flag-5'>o3</b>-mini和DeepSeek R1高級<b class='flag-5'>AI</b>推理的完整比較

    OpenAI o3-mini模型思維鏈遭質(zhì)疑

    近日,OpenAI公開了其大模型o3-mini的推理思維鏈,這一舉措使得免費用戶和付費用戶都能深入了解模型的思考過程。這一透明度的提升,原本旨在增強用戶對
    的頭像 發(fā)表于 02-08 10:57 ?614次閱讀

    OpenAI將推出o3滿血版

    據(jù)OpenAI聯(lián)合創(chuàng)始人薩姆?阿爾特曼(Sam Altman)透露,未來幾周,OpenAI將正式推出其備受期待的o3滿血版。這一消息無疑為AI領(lǐng)域注入了新的活力。 在此之前,
    的頭像 發(fā)表于 02-05 15:53 ?420次閱讀

    OpenAI將發(fā)布更智能GPT模型AI智能體工具

    OpenAI近日透露了其未來發(fā)展的重要動向。據(jù)OpenAI首席產(chǎn)品官凱文·維爾(Kevin Weil)介紹,公司計劃推出更智能的GPT o3模型,并首次亮相
    的頭像 發(fā)表于 01-24 13:54 ?521次閱讀

    OpenAI報告GPT-4o及4o-mini模型性能下降,正緊急調(diào)查

    近日,全球領(lǐng)先的AI研究機構(gòu)OpenAI發(fā)布了一份事故報告,引起了業(yè)界的廣泛關(guān)注。報告中指出,OpenAI目前正面臨GPT-4o和4
    的頭像 發(fā)表于 01-23 10:22 ?813次閱讀

    OpenAI或?qū)⑼瞥?b class='flag-5'>o3 mini推理AI模型

    近日,據(jù)最新消息,OpenAI即將在幾周內(nèi)推出一款全新的推理AI模型——o3 mini。這一消息由OpenAI的首席執(zhí)行官Sam Altma
    的頭像 發(fā)表于 01-21 10:06 ?621次閱讀

    OpenAI即將推出o3 mini推理AI模型

    近日,OpenAI首席執(zhí)行官Sam Altman在社交媒體平臺X上發(fā)表了一篇引人關(guān)注的文章。在文章中,他透露了一個重要信息:OpenAI已經(jīng)成功完成了全新推理AI模型
    的頭像 發(fā)表于 01-20 10:54 ?541次閱讀

    OpenAI發(fā)布新一代推理模型o3o3-mini

    近日,OpenAI在為期12天的發(fā)布會上宣布了新一代推理模型o3及其精簡版o3-mini。這兩款模型被專門設(shè)計用于在回答問題之前進行更深入的
    的頭像 發(fā)表于 12-24 09:29 ?826次閱讀

    OpenAI推出新一代推理模型o3系列

    AI技術(shù)日新月異的今天,OpenAI再次引領(lǐng)潮流,于近日正式發(fā)布了其新一代的推理模型系列——o3。此次發(fā)布的o3系列包括兩個版本,分別是標
    的頭像 發(fā)表于 12-23 11:00 ?776次閱讀