91精品久久久中77777,青青草无码不卡性爱AV

電子發(fā)燒友網(wǎng)報(bào)道（文/莫婷婷）美國(guó)太平洋時(shí)間周一晚上8點(diǎn)（北京時(shí)間周二12點(diǎn)），馬斯克旗下人工智能公司xAI正式發(fā)布新一代人工智能大模型Grok 3。在這款產(chǎn)品還未發(fā)布之前，馬斯克就為它站臺(tái)，表示“Grok 3將是地球上最聰明的人工智能”。那么，這款史上最聰明的AI大模型到底有哪些亮點(diǎn)？

Grok 3系列多項(xiàng)測(cè)試登頂，即將接入SpaceX火箭

此次直播有四人參與，分別是xAI工程師Igor Babuschkin，還有兩位華人研究員：多倫多大學(xué)計(jì)算機(jī)科學(xué)助理教授Jimmy Ba，斯坦福大學(xué)博士后吳宇懷（Yuhuai "Tony" Wu），以及伊隆·馬斯克。

此次發(fā)布的Grok 3系列有兩個(gè)版本，分別為Grok 3和輕量版Grok 3 mini。Grok 3 mini經(jīng)過了更長(zhǎng)時(shí)間的訓(xùn)練，在某些情況下能夠更快地解答問題。xAI還發(fā)布了推理模型Grok-3 Reasoning和Grok-3 mini Reasoning，以及首個(gè)AI智能體DeepSearch。

在近期的世界政府峰會(huì)上，馬斯克提到Grok 3時(shí)表示，“Grok 3有極強(qiáng)的推理能力，在我們迄今為止所做的測(cè)試中，其表現(xiàn)優(yōu)于我們所知的任何已發(fā)布產(chǎn)品。”

為了讓Grok 3更加聰明，xAI團(tuán)隊(duì)在進(jìn)行訓(xùn)練時(shí)用到了更多的計(jì)算資源。此前，Grok 2訓(xùn)練規(guī)模為2000 萬GPU 小時(shí)。而Grok 3訓(xùn)練規(guī)模是Grok 2的10倍，約為2 億GPU 小時(shí)。

馬斯克在現(xiàn)場(chǎng)展示了Grok 3進(jìn)行AIME'24數(shù)學(xué)能力測(cè)試、GPQA科學(xué)知識(shí)評(píng)估、LCB Oct-Feb編程能力測(cè)試等多個(gè)測(cè)試的實(shí)際表現(xiàn)。馬斯克將Grok 3與Grok 3 mini、Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-40進(jìn)行對(duì)比。在上述多個(gè)測(cè)試中，Grok 3的表現(xiàn)都優(yōu)于其他AI大模型，特別是在LCB Oct-Feb編程能力測(cè)試中，Grok 3的得分為57，GPT-40的得分為34，幾乎是后者的兩倍得分。

在與DeepSeek-V3的對(duì)比中，Grok 3也有優(yōu)異的表現(xiàn)，AIME'24數(shù)學(xué)能力測(cè)試以52 分超過DeepSeek-V3 的 39 分。GPQA 科學(xué)知識(shí)評(píng)估以75 分超過DeepSeek-V3 的65 分。LCB Oct-Feb 編程能力測(cè)試以57 分超過DeepSeek-V3 的 36 分。

在眾包大模型評(píng)估平臺(tái)Chatbot Arena（LMSYS）聊天機(jī)器人大模型競(jìng)技場(chǎng)的測(cè)試中，早期版 Grok 3拿到了1402分。xAI團(tuán)隊(duì)興奮地表示，Grok 3是首個(gè)超過1400分的AI大模型，超過了 DeepSeek-R1、OpenAI o1、Gemini-thinking等推理模型?！八窃诹奶焓夜δ堋⒕幊痰雀鞣矫娴男阅苌?，可以說是最強(qiáng)勁的。我們還在不斷地更新。”

在推理能力方面，Grok 3的表現(xiàn)同樣超出預(yù)期。在 AIME 2025 數(shù)學(xué)競(jìng)賽的測(cè)試中，兩個(gè)推理模型Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning兩個(gè)版本分別以93分、90分的成績(jī)超過同比大模型。

Grok 3有DeepSearch模式、思考（Think）模式、Big Brain模式。思考（Think）模式時(shí)，Grok 3會(huì)展示出思考鏈路、思考時(shí)長(zhǎng)，與DeepSeek類似。Big Brain模式則使用了更多的模式。

在發(fā)布會(huì)現(xiàn)場(chǎng)，xAI給出了不同的任務(wù)，包括發(fā)布讓Grok 3生成“從地球發(fā)射、著陸火星，然后再次返回地球的3D 動(dòng)圖的代碼”“使用 pygame 制作一款結(jié)合了俄羅斯方塊和寶石方塊的游戲，代碼可以很長(zhǎng)，效果要炫酷”等任務(wù)。Grok 3都順利完成了上述任務(wù)。

針對(duì)游戲的任務(wù)，xAI團(tuán)隊(duì)選擇讓Grok 3結(jié)合俄羅斯方塊和寶石方塊兩個(gè)游戲，這意味著需要把兩個(gè)游戲的一些代碼和要素去復(fù)制和融合在一起，這也展示出AI具備創(chuàng)造力的過程。

在進(jìn)行火箭發(fā)射的任務(wù)時(shí)，工作人員一開始用Grok-3 mini進(jìn)行測(cè)試，后面切換了滿血版Grok-3。在經(jīng)過114秒的等待后，Grok-3給出了答案?！鞍l(fā)射時(shí)間窗口的計(jì)算過程中涉及了大量的數(shù)學(xué)和物理模型。那其實(shí)我們也能夠在Grok 3的思維和推理的過程之中，去了解它到底引用了什么樣的算式和推理，所以我們的模型能夠?yàn)楹娇蘸教祛I(lǐng)域提供幫助。但大模型計(jì)算的發(fā)射窗口可能也會(huì)出現(xiàn)失誤的問題，但是我相信它最終會(huì)給我們得出一個(gè)結(jié)論和結(jié)果?！眡AI團(tuán)隊(duì)表示。

馬斯克興奮地提到，我們希望能夠用Grok 3解決特別重要的任務(wù)，比如說去打造一輛特斯拉，或者說是發(fā)射一個(gè)真正的火箭?！拔蚁嘈畔乱淮沃卮蟮耐黄茣?huì)在明年 11 月份出現(xiàn)，我們會(huì)在明年讓 space x 火箭登陸火星，接入Grok 這樣的模型去計(jì)算整個(gè)的發(fā)射過程?！?br />
在發(fā)布會(huì)之前，馬斯克就提到，Grok 3引入了思維鏈（Chain Of Thought）推理機(jī)制可以讓Grok 3像人類一樣，逐步解決復(fù)雜的問題。從發(fā)布會(huì)的測(cè)試任務(wù)結(jié)果來看，Grok 3邏輯推理測(cè)試中能夠提供創(chuàng)新的想法和解決方案。

“全球最強(qiáng)”之爭(zhēng)：建立最大H100集群，消耗20萬塊 H100

回顧xAI大模型的發(fā)展歷程：2023年11月，xAI發(fā)布第一款大模型Grok-1，擁有3140億參數(shù)，用于訓(xùn)練AI聊天機(jī)器人。2024年3月，Grok宣布開源。2024年8月，Grok-2大模型發(fā)布。在Grok-1的基礎(chǔ)上，訓(xùn)練時(shí)除了采用大規(guī)模合成數(shù)據(jù)，還加入真實(shí)世界數(shù)據(jù)。

從Grok 2大模型發(fā)布至今，已將近一年。在這一年中，AI大模型的發(fā)展速度超乎想象，例如中國(guó)DeepSeek大模型的橫空出世，OpenAI 的推理模型o3等。此外，OpenAI還在加速推進(jìn)AI大模型的研發(fā)進(jìn)程，針對(duì)o4模型訓(xùn)練已經(jīng)啟動(dòng)。xAI似乎也感受到緊迫感。

可以看到，AI行業(yè)似乎進(jìn)入了一場(chǎng)AI大模型性能的競(jìng)賽，特別是關(guān)于“誰是全球最強(qiáng)”。

為了打造出全球最強(qiáng)的AI大模型，xAI投入了大量的資源。Grok 3優(yōu)異的表現(xiàn)是取決于哪些方面？馬斯克坦言，一是我們有世界上最優(yōu)秀的 AI工程師團(tuán)隊(duì)，我們可以重塑推理，真正確保 AI訓(xùn)練達(dá)到相關(guān)的一個(gè)算力極限。其次我們也必須去計(jì)算到底有多少 GPU 可以同時(shí)運(yùn)行，用來突破整個(gè)AI 和大語(yǔ)言模型的邊界。

xAI團(tuán)隊(duì)坦言，我們?cè)谟?xùn)練大模型的過程中也遇到了很多的困難，我們認(rèn)為在模型訓(xùn)練中，能耗能效在 65% 到 80% 之間，可以說是浪費(fèi)了很多能源。如果想要進(jìn)一步推進(jìn)語(yǔ)言模型、AI技術(shù)的發(fā)展，必須去解決數(shù)據(jù)中心的冷卻問題、供能等問題。

因此為了訓(xùn)練Grok 3，xAI團(tuán)隊(duì)提升了數(shù)據(jù)中心的容量，用約四個(gè)月的時(shí)間建立新的數(shù)據(jù)中心，用10萬個(gè)GPU啟動(dòng)并運(yùn)行。隨著技術(shù)的投入，又用92天的時(shí)間把數(shù)據(jù)中心的算力提升了一倍，擴(kuò)大到20 萬塊顯卡。xAI團(tuán)隊(duì)認(rèn)為這將是同類中最大的全連接的H100集群。與此同時(shí)xAI團(tuán)隊(duì)已經(jīng)開始研究下一個(gè)AI集群，將比現(xiàn)在的集群強(qiáng)大5倍。

目前AI大模型競(jìng)賽的核心驅(qū)動(dòng)力包括計(jì)算能力與訓(xùn)練規(guī)模、多模態(tài)與推理能力、開源與商業(yè)化平衡等。

xAI團(tuán)隊(duì)表示，Grok 3測(cè)試版現(xiàn)已面向社交媒體平臺(tái)X用戶推出。Grok 3會(huì)在一周后獲得最佳體驗(yàn)，將有語(yǔ)音模式。xAI還將在Grok 3成熟后，開源Grok 2。

進(jìn)入2025年，AI領(lǐng)域新的競(jìng)爭(zhēng)已然開啟。從馬斯克的Grok 3來看，隨著技術(shù)的成熟與強(qiáng)大，未來AI大模型將不僅僅能解決人們?nèi)粘Ｖ械膯栴}，還能進(jìn)入科研領(lǐng)域。

小結(jié)：

隨著Grok 3的震撼發(fā)布，我們看到了通過20萬張GPU訓(xùn)練出的大模型在性能上的巨大飛躍。與此同時(shí)，關(guān)于訓(xùn)練成本的話題也引起業(yè)內(nèi)關(guān)注。消息顯示，xAI公司投入巨大，特別是針對(duì)Grok 3的投入。消息顯示，xAI公司進(jìn)行新一輪的融資，此次計(jì)劃籌集約100億美元資金，融資后公司估值達(dá)到約750億美元。另一邊，DeepSeek R1以550萬美元的成本進(jìn)入人們的視野。這不禁讓我們思考：在追求更高性能的AI大模型時(shí)，該如何找到成本與性能之間的平衡點(diǎn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

炸場(chǎng)！Grok 3擊敗Deepseek？馬斯克20萬顯卡造AI

評(píng)論

搜索歷史

炸場(chǎng)！Grok 3擊敗Deepseek？馬斯克20萬顯卡造AI

評(píng)論

炸場(chǎng)！Grok 3擊敗Deepseek？馬斯克20萬顯卡造AI