一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

訓練量暴增100倍!Grok 4推理碾壓,馬斯克預言兩年內(nèi)發(fā)現(xiàn)新物理定律

Monika觀察 ? 來源:電子發(fā)燒友 ? 作者:莫婷婷 ? 2025-07-13 06:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群




電子發(fā)燒友網(wǎng)報道(文/莫婷婷)7月10日,馬斯克的AI公司xAI正式發(fā)布旗艦大模型Grok 4、Grok 4 API,同時推出AI訂閱計劃Super Grok Heavy,每月300美元(約合2153元人民幣)。

馬斯克對Grok 4的能力給予了高度評價,他表示,Grok 4的推理能力已超越人類水平,甚至比幾乎所有學科的研究生具備更強的綜合理解與分析能力。

在被稱為“人類的最后考試”(Humanity's Last Exam)的綜合性測試中,Grok 4取得了25.4%的準確率,且完全不依賴任何外部“工具”輔助。相比之下,谷歌Gemini 2.5 Pro的得分為21.6%,而OpenAI的o3(高版本)僅為21%。在這場全球頂尖模型的較量中,Grok 4一舉超越了多位此前公認的領先選手,成為新一代大模型中的佼佼者。



除了Humanity's Last Exam的測試,Grok 4還在GPQA、AIME25、LCB(Jan-May)、HMMT25等測試中,超過了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等大模型。

馬斯克介紹,Grok 4未來將達到以下目標:它能在所有考試中答對所有題目;如果答錯,它會指出問題出在哪里;如果題目存在歧義,它會將問題拆解為答案A、B和C,并消除歧義后的問題下,對選項A、B、C分別對應的解答。


馬斯克表示,Grok 4每個學科都達到超博士水平,目前Grok 4還沒有發(fā)明新技術或發(fā)現(xiàn)新物理定律的能力,但他認為在下半年、最遲也會在明年就能看到Grok 4發(fā)現(xiàn)具有實用價值的新技術,兩年之內(nèi)就會發(fā)現(xiàn)新物理定律。

Grok 4是如何實現(xiàn)如此高水平的推理能力。根據(jù)介紹,在訓練層,每一代模型的訓練規(guī)模都實現(xiàn)了數(shù)量級提升,Grok 4的訓練量是Grok 2的100倍。馬斯克明確表示,這個訓練量還會持續(xù)增長。



訓練算力有兩種類型:一是Grok 2到Grok 3階段的訓練預算力,二是在Grok 3到Grok 4階段,團隊在強化學習的推理環(huán)節(jié)投入了大量算力。xAI團隊通過訓練Grok 2,首次實現(xiàn)了預訓練規(guī)模的突破,團隊發(fā)現(xiàn)如果真正精細地進行數(shù)據(jù)消融實驗,以及基礎設備、算法,就可以通過1.0倍的量大幅推進預訓練,打造最佳的預訓練基礎模型。xAI將動用了有20萬塊H100 GPU的超級算力中心。

與Grok 3不同,Grok 4將工具直接融入訓練過程,使其成為模型的原生能力。在單智能體情況下,團隊能解決40%的問題;隨著測試與計算規(guī)模的擴大,團隊已經(jīng)能解決HRE問題中純文本子集超過50%的內(nèi)容。這是一個極其困難的任務,xAI表示。

在發(fā)布會上,xAI也正式推出了多智能體版本Grok 4 Heavy。在人類的最后考試測試中,Grok 4 Heavy取得44.4%的準確率。

馬斯克指出Grok最大的弱點在圖像理解、圖像生成,xAI正在進行相關的訓練。Grok 4基于第六代基礎模型,第七代基礎模型將在幾周后完成,屆時將改善圖像領域的不足。

在開通AI訂閱計劃Super Grok后,用戶就可以訪問Grok 4,訂閱費為每月30美金。如果成為Super Grok Heavy用戶,就可以同時訪問Grok 4和Grok 4 Heavy,訂閱費為每月300美金。xAI表示,屆時你將成為“一群Grok研究智能體的任務主管”,讓你變得更聰明。

Grok 4以其超人類推理能力與跨學科統(tǒng)治力引發(fā)關注。此次發(fā)布不僅讓Grok 4成為大模型性能天花板,也意味著xAI正以算力筑壁壘。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 大模型
    +關注

    關注

    2

    文章

    3146

    瀏覽量

    4073
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    炸場!Grok 3擊敗Deepseek?馬斯克20萬顯卡造AI

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)美國太平洋時間周一晚上8點(北京時間周二12點),馬斯克旗下人工智能公司xAI正式發(fā)布新一代人工智能大模型Grok 3。在這款產(chǎn)品還未發(fā)布之前,馬斯克就為它站臺,表示
    的頭像 發(fā)表于 02-19 09:03 ?1993次閱讀
    炸場!<b class='flag-5'>Grok</b> 3擊敗Deepseek?<b class='flag-5'>馬斯克</b>20萬顯卡造AI

    馬斯克的“秘密武器”:Grok 3真的能輕松碾壓DeepSeek和ChatGPT?

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 2月17日,埃隆·馬斯克旗下的xAI公司正式推出最新版聊天機器人Grok 3。馬斯克稱其為“地球上最聰明的人工智能”,這款備受矚目的AI究竟有多厲害?它又
    的頭像 發(fā)表于 02-19 16:41 ?1839次閱讀
    <b class='flag-5'>馬斯克</b>的“秘密武器”:<b class='flag-5'>Grok</b> 3真的能輕松<b class='flag-5'>碾壓</b>DeepSeek和ChatGPT?

    馬斯克發(fā)布Grok 3大模型,超越GPT-4o

    多項benchmark測試中,Grok 3取得了比DeepSeek-v3、GPT-4o以及Gemini-2 pro更優(yōu)的效果。這一成績無疑彰顯了Grok 3在人工智能領域的卓越實力。 值得一提的是,
    的頭像 發(fā)表于 02-19 13:50 ?432次閱讀

    馬斯克發(fā)布Grok-3,X平臺用戶可優(yōu)先訂閱

    近日,馬斯克正式發(fā)布了備受期待的新一代人工智能模型Grok-3。據(jù)馬斯克介紹,Grok-3及其迷你版Grok-3 mini在多方面的測試中均
    的頭像 發(fā)表于 02-19 09:57 ?466次閱讀

    馬斯克揭秘Grok 3訓練成本:20萬塊英偉達GPU

    近日,馬斯克旗下的xAI公司正式推出了其新一代大模型——Grok 3。在備受矚目的發(fā)布會直播中,馬斯克親自披露了Grok 3的訓練成本,這一
    的頭像 發(fā)表于 02-19 09:39 ?832次閱讀

    馬斯克即將發(fā)布Grok 3大模型,自詡“最聰明”AI

    近日,科技界迎來一則重大消息。特斯拉及SpaceX創(chuàng)始人馬斯克在社交平臺X上親自宣布,其旗下人工智能公司傾力打造的大模型Grok 3將于北京時間18日中午12點震撼發(fā)布。馬斯克對這款大模型充滿信心
    的頭像 發(fā)表于 02-18 15:02 ?653次閱讀

    馬斯克盛贊:xAI發(fā)布Grok 3推理模型,被譽為地球上最聰明的AI

    發(fā)布了 Grok 3 推理模型。 ? 馬斯克在直播中說道:“我們非常高興能夠推出 Grok-3,它的功能比 Grok-2 強大一個數(shù)量級。能
    的頭像 發(fā)表于 02-18 14:44 ?735次閱讀
    <b class='flag-5'>馬斯克</b>盛贊:xAI發(fā)布<b class='flag-5'>Grok</b> 3<b class='flag-5'>推理</b>模型,被譽為地球上最聰明的AI

    馬斯克即將發(fā)布Grok 3大模型,譽為最聰明AI

    近日,科技巨頭馬斯克在社交平臺X上宣布了一項重要消息。據(jù)他透露,其旗下的人工智能公司即將于北京時間18日中午12點正式發(fā)布大模型Grok 3。馬斯克對這款新產(chǎn)品充滿信心,甚至稱其為“地球上最聰明的人
    的頭像 發(fā)表于 02-17 14:27 ?772次閱讀

    馬斯克宣布Grok 3預訓練完成,計算量大幅提升

    近日,特斯拉和SpaceX的創(chuàng)始人埃隆·馬斯克在社交平臺上發(fā)布了一條令人矚目的消息。他宣布,公司研發(fā)的最新人工智能模型Grok 3已經(jīng)完成了預訓練階段,并且其計算相較于上一代產(chǎn)品
    的頭像 發(fā)表于 01-06 10:42 ?1186次閱讀

    馬斯克預言:AI將全面超越人類智力

    ,到2025年底之前,AI的智力水平將有望超越單個人類的智力。而到了2027年至2028年間,AI超越所有人類智力的可能性正在迅速增大。更令人震驚的是,馬斯克認為,到2030年,人工智能超越所有人類智力的概率幾乎達到了100%。 這一預測無疑引發(fā)了廣泛
    的頭像 發(fā)表于 12-28 14:23 ?759次閱讀

    馬斯克xAI計劃:孟菲斯超算集群將擴大十

    個增加到至少100萬個。這一舉措將標志著Colossus超級計算機集群的十擴張,彰顯出xAI在人工智能領域的雄心壯志。 據(jù)了解,Colossus超級計算機集群目前主要用于訓練xAI的聊天機器人
    的頭像 發(fā)表于 12-05 11:23 ?763次閱讀

    特斯拉市值8500億 馬斯克坐穩(wěn)世界首富的寶座

    美國總統(tǒng)選舉結果出爐,隨著而來是美國資本市場迎來了“特朗普交易”的情緒釋放。大手筆押注特朗普的馬斯克似乎已經(jīng)成為特斯拉的大利好。 據(jù)外媒報道,馬斯克這個大金主一共花費了1.3億美元來支持特朗普競選
    的頭像 發(fā)表于 11-07 16:55 ?1024次閱讀

    馬斯克旗下xAI對Grok-2-mini進行速度升級

    科技巨頭馬斯克旗下的xAI公司近日宣布了一項重大進展,其熱門語言模型Grok-2-mini成功完成了速度升級。
    的頭像 發(fā)表于 08-27 15:28 ?631次閱讀

    馬斯克旗下AI初創(chuàng)公司發(fā)布Grok-2聊天機器人

    埃隆·馬斯克麾下的創(chuàng)新AI企業(yè)xAI今日震撼發(fā)布了其最新力作——Grok-2聊天機器人,該產(chǎn)品在性能上自信地宣稱已能與業(yè)界巨頭OpenAI、谷歌及Anthropic的頂尖產(chǎn)品并駕齊驅。
    的頭像 發(fā)表于 08-15 16:05 ?1166次閱讀

    馬斯克宣布開始在“全球最大AI訓練集群”上訓練

    訓練項目,這一壯舉被馬斯克本人譽為“全球最強大的AI訓練集群”,標志著人工智能算力競賽進入了一個全新的紀元。
    的頭像 發(fā)表于 07-23 17:44 ?944次閱讀