一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

炸場(chǎng)!Grok 3擊敗Deepseek?馬斯克20萬顯卡造AI

Monika觀察 ? 來源:電子發(fā)燒友 ? 作者:莫婷婷 ? 2025-02-19 09:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)美國(guó)太平洋時(shí)間周一晚上8點(diǎn)(北京時(shí)間周二12點(diǎn)),馬斯克旗下人工智能公司xAI正式發(fā)布新一代人工智能大模型Grok 3。在這款產(chǎn)品還未發(fā)布之前,馬斯克就為它站臺(tái),表示“Grok 3將是地球上最聰明的人工智能”。那么,這款史上最聰明的AI大模型到底有哪些亮點(diǎn)?

Grok 3系列多項(xiàng)測(cè)試登頂,即將接入SpaceX火箭

此次直播有四人參與,分別是xAI工程師Igor Babuschkin,還有兩位華人研究員:多倫多大學(xué)計(jì)算機(jī)科學(xué)助理教授Jimmy Ba,斯坦福大學(xué)博士后吳宇懷(Yuhuai "Tony" Wu),以及伊隆·馬斯克。

wKgZO2e1LjOAIrb4AADrx6e4Gyo971.png
此次發(fā)布的Grok 3系列有兩個(gè)版本,分別為Grok 3和輕量版Grok 3 mini。Grok 3 mini經(jīng)過了更長(zhǎng)時(shí)間的訓(xùn)練,在某些情況下能夠更快地解答問題。xAI還發(fā)布了推理模型Grok-3 Reasoning和Grok-3 mini Reasoning,以及首個(gè)AI智能體DeepSearch。

在近期的世界政府峰會(huì)上,馬斯克提到Grok 3時(shí)表示,“Grok 3有極強(qiáng)的推理能力,在我們迄今為止所做的測(cè)試中,其表現(xiàn)優(yōu)于我們所知的任何已發(fā)布產(chǎn)品。”

為了讓Grok 3更加聰明,xAI團(tuán)隊(duì)在進(jìn)行訓(xùn)練時(shí)用到了更多的計(jì)算資源。此前,Grok 2訓(xùn)練規(guī)模為2000 萬GPU 小時(shí)。而Grok 3訓(xùn)練規(guī)模是Grok 2的10倍,約為2 億GPU 小時(shí)。

wKgZPGe1Lj6AGjk2AADXEjAfgl0186.png

馬斯克在現(xiàn)場(chǎng)展示了Grok 3進(jìn)行AIME'24數(shù)學(xué)能力測(cè)試、GPQA科學(xué)知識(shí)評(píng)估、LCB Oct-Feb編程能力測(cè)試等多個(gè)測(cè)試的實(shí)際表現(xiàn)。馬斯克將Grok 3與Grok 3 mini、Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-40進(jìn)行對(duì)比。在上述多個(gè)測(cè)試中,Grok 3的表現(xiàn)都優(yōu)于其他AI大模型,特別是在LCB Oct-Feb編程能力測(cè)試中,Grok 3的得分為57,GPT-40的得分為34,幾乎是后者的兩倍得分。

在與DeepSeek-V3的對(duì)比中,Grok 3也有優(yōu)異的表現(xiàn),AIME'24數(shù)學(xué)能力測(cè)試以52 分超 過DeepSeek-V3 的 39 分。GPQA 科學(xué)知識(shí)評(píng)估以75 分超過DeepSeek-V3 的65 分。LCB Oct-Feb 編程能力測(cè)試以57 分超過DeepSeek-V3 的 36 分。

wKgZO2e1LkeAfdqTAACGTdEMJHM363.jpg


在眾包大模型評(píng)估平臺(tái)Chatbot Arena(LMSYS)聊天機(jī)器人大模型競(jìng)技場(chǎng)的測(cè)試中,早期版 Grok 3拿到了1402分。xAI團(tuán)隊(duì)興奮地表示,Grok 3是首個(gè)超過1400分的AI大模型,超過了 DeepSeek-R1、OpenAI o1、Gemini-thinking等推理模型?!八窃诹奶焓夜δ堋⒕幊痰雀鞣矫娴男阅苌?,可以說是最強(qiáng)勁的。我們還在不斷地更新。”

在推理能力方面,Grok 3的表現(xiàn)同樣超出預(yù)期。在 AIME 2025 數(shù)學(xué)競(jìng)賽的測(cè)試中,兩個(gè)推理模型Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning兩個(gè)版本分別以93分、90分的成績(jī)超過同比大模型。

wKgZPGe1Lk-ALB6_AAGsrH5WOyk142.png


Grok 3有DeepSearch模式、思考(Think)模式、Big Brain模式。思考(Think)模式時(shí),Grok 3會(huì)展示出思考鏈路、思考時(shí)長(zhǎng),與DeepSeek類似。Big Brain模式則使用了更多的模式。

在發(fā)布會(huì)現(xiàn)場(chǎng),xAI給出了不同的任務(wù),包括發(fā)布讓Grok 3生成“從地球發(fā)射、著陸火星,然后再次返回地球的3D 動(dòng)圖的代碼”“使用 pygame 制作一款結(jié)合了俄羅斯方塊和寶石方塊的游戲,代碼可以很長(zhǎng),效果要炫酷”等任務(wù)。Grok 3都順利完成了上述任務(wù)。

針對(duì)游戲的任務(wù),xAI團(tuán)隊(duì)選擇讓Grok 3結(jié)合俄羅斯方塊和寶石方塊兩個(gè)游戲,這意味著需要把兩個(gè)游戲的一些代碼和要素去復(fù)制和融合在一起,這也展示出AI具備創(chuàng)造力的過程。

在進(jìn)行火箭發(fā)射的任務(wù)時(shí),工作人員一開始用Grok-3 mini進(jìn)行測(cè)試,后面切換了滿血版Grok-3。在經(jīng)過114秒的等待后,Grok-3給出了答案?!鞍l(fā)射時(shí)間窗口的計(jì)算過程中涉及了大量的數(shù)學(xué)和物理模型。那其實(shí)我們也能夠在Grok 3的思維和推理的過程之中,去了解它到底引用了什么樣的算式和推理,所以我們的模型能夠?yàn)楹娇蘸教祛I(lǐng)域提供幫助。但大模型計(jì)算的發(fā)射窗口可能也會(huì)出現(xiàn)失誤的問題,但是我相信它最終會(huì)給我們得出一個(gè)結(jié)論和結(jié)果?!眡AI團(tuán)隊(duì)表示。

wKgZPGe1LliAI5dYAANXBngnrZ0031.png

馬斯克興奮地提到,我們希望能夠用Grok 3解決特別重要的任務(wù),比如說去打造一輛特斯拉,或者說是發(fā)射一個(gè)真正的火箭?!拔蚁嘈畔乱淮沃卮蟮耐黄茣?huì)在明年 11 月份出現(xiàn),我們會(huì)在明年讓 space x 火箭登陸火星,接入Grok 這樣的模型去計(jì)算整個(gè)的發(fā)射過程?!?br />
在發(fā)布會(huì)之前,馬斯克就提到,Grok 3引入了思維鏈(Chain Of Thought)推理機(jī)制可以讓Grok 3像人類一樣,逐步解決復(fù)雜的問題。從發(fā)布會(huì)的測(cè)試任務(wù)結(jié)果來看,Grok 3邏輯推理測(cè)試中能夠提供創(chuàng)新的想法和解決方案。


“全球最強(qiáng)”之爭(zhēng):建立最大H100集群,消耗20萬塊 H100

回顧xAI大模型的發(fā)展歷程:2023年11月,xAI發(fā)布第一款大模型Grok-1,擁有3140億參數(shù),用于訓(xùn)練AI聊天機(jī)器人。2024年3月,Grok宣布開源。2024年8月,Grok-2大模型發(fā)布。在Grok-1的基礎(chǔ)上,訓(xùn)練時(shí)除了采用大規(guī)模合成數(shù)據(jù),還加入真實(shí)世界數(shù)據(jù)。

從Grok 2大模型發(fā)布至今,已將近一年。在這一年中,AI大模型的發(fā)展速度超乎想象,例如中國(guó)DeepSeek大模型的橫空出世,OpenAI 的推理模型o3等。此外,OpenAI還在加速推進(jìn)AI大模型的研發(fā)進(jìn)程,針對(duì)o4模型訓(xùn)練已經(jīng)啟動(dòng)。xAI似乎也感受到緊迫感。

wKgZO2e1LmKAM3ihAACkNNWOyT0937.jpg

可以看到,AI行業(yè)似乎進(jìn)入了一場(chǎng)AI大模型性能的競(jìng)賽,特別是關(guān)于“誰是全球最強(qiáng)”。

為了打造出全球最強(qiáng)的AI大模型,xAI投入了大量的資源。Grok 3優(yōu)異的表現(xiàn)是取決于哪些方面?馬斯克坦言,一是我們有世界上最優(yōu)秀的 AI工程師團(tuán)隊(duì),我們可以重塑推理,真正確保 AI訓(xùn)練達(dá)到相關(guān)的一個(gè)算力極限。其次我們也必須去計(jì)算到底有多少 GPU 可以同時(shí)運(yùn)行,用來突破整個(gè)AI 和大語(yǔ)言模型的邊界。

xAI團(tuán)隊(duì)坦言,我們?cè)谟?xùn)練大模型的過程中也遇到了很多的困難,我們認(rèn)為在模型訓(xùn)練中,能耗能效在 65% 到 80% 之間,可以說是浪費(fèi)了很多能源。如果想要進(jìn)一步推進(jìn)語(yǔ)言模型、AI技術(shù)的發(fā)展,必須去解決數(shù)據(jù)中心的冷卻問題、供能等問題。

因此為了訓(xùn)練Grok 3,xAI團(tuán)隊(duì)提升了數(shù)據(jù)中心的容量,用約四個(gè)月的時(shí)間建立新的數(shù)據(jù)中心,用10萬個(gè)GPU啟動(dòng)并運(yùn)行。隨著技術(shù)的投入,又用92天的時(shí)間把數(shù)據(jù)中心的算力提升了一倍,擴(kuò)大到20 萬塊顯卡。xAI團(tuán)隊(duì)認(rèn)為這將是同類中最大的全連接的H100集群。與此同時(shí)xAI團(tuán)隊(duì)已經(jīng)開始研究下一個(gè)AI集群,將比現(xiàn)在的集群強(qiáng)大5倍。

目前AI大模型競(jìng)賽的核心驅(qū)動(dòng)力包括計(jì)算能力與訓(xùn)練規(guī)模、多模態(tài)與推理能力、開源與商業(yè)化平衡等。

xAI團(tuán)隊(duì)表示,Grok 3測(cè)試版現(xiàn)已面向社交媒體平臺(tái)X用戶推出。Grok 3會(huì)在一周后獲得最佳體驗(yàn),將有語(yǔ)音模式。xAI還將在Grok 3成熟后,開源Grok 2。

進(jìn)入2025年,AI領(lǐng)域新的競(jìng)爭(zhēng)已然開啟。從馬斯克的Grok 3來看,隨著技術(shù)的成熟與強(qiáng)大,未來AI大模型將不僅僅能解決人們?nèi)粘V械膯栴},還能進(jìn)入科研領(lǐng)域。


小結(jié):

隨著Grok 3的震撼發(fā)布,我們看到了通過20萬張GPU訓(xùn)練出的大模型在性能上的巨大飛躍。與此同時(shí),關(guān)于訓(xùn)練成本的話題也引起業(yè)內(nèi)關(guān)注。消息顯示,xAI公司投入巨大,特別是針對(duì)Grok 3的投入。消息顯示,xAI公司進(jìn)行新一輪的融資,此次計(jì)劃籌集約100億美元資金,融資后公司估值達(dá)到約750億美元。另一邊,DeepSeek R1以550萬美元的成本進(jìn)入人們的視野。這不禁讓我們思考:在追求更高性能的AI大模型時(shí),該如何找到成本與性能之間的平衡點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    訓(xùn)練量暴增100倍!Grok 4推理碾壓,馬斯克預(yù)言兩年內(nèi)發(fā)現(xiàn)新物理定律

    ? ? 電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)7月10日,馬斯克AI公司xAI正式發(fā)布旗艦大模型Grok 4、Grok 4 API,同時(shí)推出AI
    的頭像 發(fā)表于 07-13 06:15 ?4781次閱讀
    訓(xùn)練量暴增100倍!<b class='flag-5'>Grok</b> 4推理碾壓,<b class='flag-5'>馬斯克</b>預(yù)言兩年內(nèi)發(fā)現(xiàn)新物理定律

    從性能到商業(yè),Grok3、GPT-4o、DeepSeek如何重塑AI版圖?

    2025年2月,AI領(lǐng)域仿佛上演了一場(chǎng)激烈的“諸神之戰(zhàn)”,馬斯克旗下xAI發(fā)布的Grok3、OpenAI推出的GPT-4o以及持續(xù)憑借R1模型大放異彩的
    的頭像 發(fā)表于 02-19 18:14 ?1086次閱讀
    從性能到商業(yè),<b class='flag-5'>Grok3</b>、GPT-4o、<b class='flag-5'>DeepSeek</b>如何重塑<b class='flag-5'>AI</b>版圖?

    馬斯克的“秘密武器”:Grok 3真的能輕松碾壓DeepSeek和ChatGPT?

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 2月17日,埃隆·馬斯克旗下的xAI公司正式推出最新版聊天機(jī)器人Grok 3。馬斯克稱其為“地球上最聰明的人工智能”,這款備受矚目的
    的頭像 發(fā)表于 02-19 16:41 ?1989次閱讀
    <b class='flag-5'>馬斯克</b>的“秘密武器”:<b class='flag-5'>Grok</b> <b class='flag-5'>3</b>真的能輕松碾壓<b class='flag-5'>DeepSeek</b>和ChatGPT?

    馬斯克發(fā)布Grok 3大模型,超越GPT-4o

    多項(xiàng)benchmark測(cè)試中,Grok 3取得了比DeepSeek-v3、GPT-4o以及Gemini-2 pro更優(yōu)的效果。這一成績(jī)無疑彰顯了Grok
    的頭像 發(fā)表于 02-19 13:50 ?438次閱讀

    馬斯克發(fā)布Grok-3,X平臺(tái)用戶可優(yōu)先訂閱

    近日,馬斯克正式發(fā)布了備受期待的新一代人工智能模型Grok-3。據(jù)馬斯克介紹,Grok-3及其迷你版Grok-3 mini在多方面的測(cè)試中均
    的頭像 發(fā)表于 02-19 09:57 ?473次閱讀

    馬斯克揭秘Grok 3訓(xùn)練成本:20塊英偉達(dá)GPU

    的訓(xùn)練過程極為龐大且復(fù)雜,累計(jì)消耗了高達(dá)20塊的英偉達(dá)GPU。這一數(shù)字不僅彰顯了Grok 3在算力方面的巨大需求,也反映了xAI公司在技術(shù)研發(fā)和數(shù)據(jù)中心建設(shè)方面的雄厚實(shí)力。
    的頭像 發(fā)表于 02-19 09:39 ?843次閱讀

    馬斯克即將發(fā)布Grok 3大模型,自詡“最聰明”AI

    近日,科技界迎來一則重大消息。特斯拉及SpaceX創(chuàng)始人馬斯克在社交平臺(tái)X上親自宣布,其旗下人工智能公司傾力打造的大模型Grok 3將于北京時(shí)間18日中午12點(diǎn)震撼發(fā)布。馬斯克對(duì)這款大
    的頭像 發(fā)表于 02-18 15:02 ?656次閱讀

    馬斯克盛贊:xAI發(fā)布Grok 3推理模型,被譽(yù)為地球上最聰明的AI

    的團(tuán)隊(duì)的辛勤工作,我很榮幸能與這樣一支優(yōu)秀的團(tuán)隊(duì)合作。 馬斯克及其團(tuán)隊(duì)表示,Grok 3 也將具有類似 DeepSeek R1 和 OpenAI o
    的頭像 發(fā)表于 02-18 14:44 ?743次閱讀
    <b class='flag-5'>馬斯克</b>盛贊:xAI發(fā)布<b class='flag-5'>Grok</b> <b class='flag-5'>3</b>推理模型,被譽(yù)為地球上最聰明的<b class='flag-5'>AI</b>

    馬斯克即將發(fā)布Grok 3大模型,譽(yù)為最聰明AI

    近日,科技巨頭馬斯克在社交平臺(tái)X上宣布了一項(xiàng)重要消息。據(jù)他透露,其旗下的人工智能公司即將于北京時(shí)間18日中午12點(diǎn)正式發(fā)布大模型Grok 3。馬斯克對(duì)這款新產(chǎn)品充滿信心,甚至稱其為“地
    的頭像 發(fā)表于 02-17 14:27 ?777次閱讀

    馬斯克宣布Grok 3預(yù)訓(xùn)練完成,計(jì)算量大幅提升

    近日,特斯拉和SpaceX的創(chuàng)始人埃隆·馬斯克在社交平臺(tái)上發(fā)布了一條令人矚目的消息。他宣布,公司研發(fā)的最新人工智能模型Grok 3已經(jīng)完成了預(yù)訓(xùn)練階段,并且其計(jì)算量相較于上一代產(chǎn)品Grok
    的頭像 發(fā)表于 01-06 10:42 ?1191次閱讀

    馬斯克預(yù)言:AI將全面超越人類智力

    近日,科技巨頭馬斯克作出了一個(gè)關(guān)于人工智能(AI)的大膽預(yù)測(cè)。他斷言,AI的發(fā)展速度將超乎人類的想象,并將在不久的將來全面超越人類的智力。 馬斯克在X平臺(tái)上明確表示,
    的頭像 發(fā)表于 12-28 14:23 ?762次閱讀

    馬斯克旗下xAI計(jì)劃推出Grok聊天機(jī)器人獨(dú)立應(yīng)用

    近日,據(jù)最新報(bào)道,埃隆·馬斯克旗下的xAI公司計(jì)劃最早于12月推出一款獨(dú)立的聊天機(jī)器人應(yīng)用程序,這款應(yīng)用將圍繞其旗下的Grok聊天機(jī)器人進(jìn)行打造。此舉被視為xAI在聊天機(jī)器人市場(chǎng)的重要布局,旨在
    的頭像 發(fā)表于 11-29 13:38 ?550次閱讀

    馬斯克xAI洽談?dòng)ミ_(dá)大額投資,加速Grok模型開發(fā)

     11月5日,據(jù)外媒最新報(bào)道,馬斯克旗下的AI初創(chuàng)公司xAI正與英偉達(dá)進(jìn)行洽談,計(jì)劃獲得一筆大額投資,以加速其大型語(yǔ)言模型Grok的研發(fā)進(jìn)程。   據(jù)悉,xAI正在考慮向投資者募集高達(dá)50億
    的頭像 發(fā)表于 11-05 14:48 ?2992次閱讀

    馬斯克旗下xAI對(duì)Grok-2-mini進(jìn)行速度升級(jí)

    科技巨頭馬斯克旗下的xAI公司近日宣布了一項(xiàng)重大進(jìn)展,其熱門語(yǔ)言模型Grok-2-mini成功完成了速度升級(jí)。
    的頭像 發(fā)表于 08-27 15:28 ?637次閱讀

    馬斯克旗下AI初創(chuàng)公司發(fā)布Grok-2聊天機(jī)器人

    埃隆·馬斯克麾下的創(chuàng)新AI企業(yè)xAI今日震撼發(fā)布了其最新力作——Grok-2聊天機(jī)器人,該產(chǎn)品在性能上自信地宣稱已能與業(yè)界巨頭OpenAI、谷歌及Anthropic的頂尖產(chǎn)品并駕齊驅(qū)。
    的頭像 發(fā)表于 08-15 16:05 ?1176次閱讀