国产男女拍拍拍拍免费视频,综合婷婷蜜乳一起草,国产绯色AV成人

電子發(fā)燒友網(wǎng)報道（文/莫婷婷）7月10日，馬斯克的AI公司xAI正式發(fā)布旗艦大模型Grok 4、Grok 4 API，同時推出AI訂閱計劃Super Grok Heavy，每月300美元（約合2153元人民幣）。

馬斯克對Grok 4的能力給予了高度評價，他表示，Grok 4的推理能力已超越人類水平，甚至比幾乎所有學科的研究生具備更強的綜合理解與分析能力。

在被稱為“人類的最后考試”（Humanity's Last Exam）的綜合性測試中，Grok 4取得了25.4%的準確率，且完全不依賴任何外部“工具”輔助。相比之下，谷歌Gemini 2.5 Pro的得分為21.6%，而OpenAI的o3（高版本）僅為21%。在這場全球頂尖模型的較量中，Grok 4一舉超越了多位此前公認的領先選手，成為新一代大模型中的佼佼者。

除了Humanity's Last Exam的測試，Grok 4還在GPQA、AIME25、LCB（Jan-May）、HMMT25等測試中，超過了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等大模型。

馬斯克介紹，Grok 4未來將達到以下目標：它能在所有考試中答對所有題目；如果答錯，它會指出問題出在哪里；如果題目存在歧義，它會將問題拆解為答案A、B和C，并消除歧義后的問題下，對選項A、B、C分別對應的解答。

馬斯克表示，Grok 4每個學科都達到超博士水平，目前Grok 4還沒有發(fā)明新技術或發(fā)現(xiàn)新物理定律的能力，但他認為在下半年、最遲也會在明年就能看到Grok 4發(fā)現(xiàn)具有實用價值的新技術，兩年之內(nèi)就會發(fā)現(xiàn)新物理定律。

Grok 4是如何實現(xiàn)如此高水平的推理能力。根據(jù)介紹，在訓練層，每一代模型的訓練規(guī)模都實現(xiàn)了數(shù)量級提升，Grok 4的訓練量是Grok 2的100倍。馬斯克明確表示，這個訓練量還會持續(xù)增長。

訓練算力有兩種類型：一是Grok 2到Grok 3階段的訓練預算力，二是在Grok 3到Grok 4階段，團隊在強化學習的推理環(huán)節(jié)投入了大量算力。xAI團隊通過訓練Grok 2，首次實現(xiàn)了預訓練規(guī)模的突破，團隊發(fā)現(xiàn)如果真正精細地進行數(shù)據(jù)消融實驗，以及基礎設備、算法，就可以通過1.0倍的量大幅推進預訓練，打造最佳的預訓練基礎模型。xAI將動用了有20萬塊H100 GPU的超級算力中心。

與Grok 3不同，Grok 4將工具直接融入訓練過程，使其成為模型的原生能力。在單智能體情況下，團隊能解決40%的問題；隨著測試與計算規(guī)模的擴大，團隊已經(jīng)能解決HRE問題中純文本子集超過50%的內(nèi)容。這是一個極其困難的任務，xAI表示。

在發(fā)布會上，xAI也正式推出了多智能體版本Grok 4 Heavy。在人類的最后考試測試中，Grok 4 Heavy取得44.4%的準確率。

馬斯克指出Grok最大的弱點在圖像理解、圖像生成，xAI正在進行相關的訓練。Grok 4基于第六代基礎模型，第七代基礎模型將在幾周后完成，屆時將改善圖像領域的不足。

在開通AI訂閱計劃Super Grok后，用戶就可以訪問Grok 4，訂閱費為每月30美金。如果成為Super Grok Heavy用戶，就可以同時訪問Grok 4和Grok 4 Heavy，訂閱費為每月300美金。xAI表示，屆時你將成為“一群Grok研究智能體的任務主管”，讓你變得更聰明。

Grok 4以其超人類推理能力與跨學科統(tǒng)治力引發(fā)關注。此次發(fā)布不僅讓Grok 4成為大模型性能天花板，也意味著xAI正以算力筑壁壘。