一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌Gemini 2.5模型系列更新

谷歌開發(fā)者 ? 來源:谷歌黑板報 ? 2025-05-23 14:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:谷歌黑板報

作者:

Tulsee Doshi,產(chǎn)品管理高級總監(jiān),代表 Gemini 團(tuán)隊

今年 3 月,我們發(fā)布了迄今為止最智能的模型 Gemini 2.5 Pro,兩周前,我們提前為您帶來了 I/O 更新,以便開發(fā)者構(gòu)建出色的網(wǎng)絡(luò)應(yīng)用。今天,我們分享 Gemini 2.5 模型系列的更多更新:

除了 2.5 Pro 在學(xué)術(shù)基準(zhǔn)測試中令人難以置信的性能外,它現(xiàn)在還是 WebDev Arena 和 LMArena 排行榜上的全球領(lǐng)先模型,并且在幫助人們學(xué)習(xí)方面表現(xiàn)出色。

我們正在為 2.5 Pro 和 2.5 Flash 帶來新功能: 用于更自然對話體驗的原生音頻輸出、更高的安全防護(hù),以及 Project Mariner 的計算機(jī)使用功能。2.5 Pro 還將通過 Deep Think,一種用于高度復(fù)雜的數(shù)學(xué)和編程的實驗性增強(qiáng)推理模式,進(jìn)一步升級。

我們繼續(xù)投資于開發(fā)者體驗,在 Gemini API 和 Vertex AI 中引入了模型推理摘要以提高透明度,將模型推理預(yù)算擴(kuò)展到 2.5 Pro 以實現(xiàn)更多控制,并在 Gemini API 和 SDK 中添加了對 MCP 工具的支持,以便訪問更多開源工具。

2.5 Flash 現(xiàn)在已在 Gemini 應(yīng)用中向所有人開放,我們將在 6 月初在 Google AI Studio 中向開發(fā)者以及在 Vertex AI 中向企業(yè)全面提供更新版本,2.5 Pro 也將緊隨其后。

這一顯著進(jìn)展是 Google 各團(tuán)隊不懈努力的結(jié)果,旨在改進(jìn)我們的技術(shù),并安全負(fù)責(zé)地開發(fā)和發(fā)布它們。下面讓我們從以下方面深入了解。

2.5 Pro 表現(xiàn)更勝以往

我們最近更新了 2.5 Pro,以幫助開發(fā)者構(gòu)建更豐富、更具交互性的網(wǎng)絡(luò)應(yīng)用。非常高興看到用戶和開發(fā)者的積極反響,同時我們正在根據(jù)用戶反饋不斷改進(jìn)。

除了在學(xué)術(shù)基準(zhǔn)測試中的出色表現(xiàn)外,新的 2.5 Pro 現(xiàn)在正領(lǐng)跑流行的編碼排行榜 WebDev Arena,ELO 分?jǐn)?shù)為 1415。它還在 LMArena 排行榜的所有類別中處于領(lǐng)先地位,該排行榜評估人類在不同維度上的偏好。而且,憑借其百萬級令牌的上下文窗口,2.5 Pro 擁有最先進(jìn)的長上下文和視頻理解性能。

自從融入了與教育專家合作構(gòu)建的學(xué)習(xí)模型系列 LearnLM 以來,2.5 Pro 現(xiàn)已成為領(lǐng)先的學(xué)習(xí)模型。在對其教學(xué)法和有效性進(jìn)行的直接比較中,教育工作者和專家在各種場景下都更青睞 Gemini 2.5 Pro,而非其他模型。并且,在構(gòu)建用于輔助學(xué)習(xí)的 AI 系統(tǒng)的學(xué)習(xí)科學(xué)的五項原則中,它在每一項上都超越了頂級模型。

Deep Think

通過探索 Gemini 思維能力的邊界,我們開始測試 Deep Think 的增強(qiáng)推理模式,它采用新的研究技術(shù),使模型能夠在回應(yīng)之前考慮多種假設(shè)。

2.5 Pro Deep Think 在目前最難的數(shù)學(xué)基準(zhǔn)之一 2025 USAMO 上取得了令人印象深刻的分?jǐn)?shù)。它還在一個針對競賽級編程的難度基準(zhǔn) —— LiveCodeBench 上處于領(lǐng)先地位,并在測試多模態(tài)推理的 MMMU 上取得了 84.0% 的分?jǐn)?shù)。

由于 2.5 Pro DeepThink 是一項非常前沿的技術(shù),我們正在額外花費(fèi)時間進(jìn)行更多的前沿安全評估,并從安全專家那里獲得進(jìn)一步的反饋。作為其中的一部分,我們將在廣泛發(fā)布之前,通過 Gemini API 將其提供給受信任的測試人員,以獲取他們的反饋。

更優(yōu)秀的 2.5 Flash

2.5 Flash 是我們最高效的主力模型,專為速度和低成本而設(shè)計——現(xiàn)在它在很多維度上都更優(yōu)秀了。它在推理、多模態(tài)、代碼和長上下文的關(guān)鍵基準(zhǔn)測試中都得到了改進(jìn),同時效率更高,在我們的評估中使用的令牌數(shù)量減少了 20-30%。

新的 2.5 Flash 現(xiàn)在已在 Google AI Studio 中向開發(fā)者、在 Vertex AI 中向企業(yè)用戶以及在 Gemini 應(yīng)用中向所有人提供預(yù)覽版。6 月初,它將全面上線可用。

Gemini 2.5 新功能

原生音頻輸出和 Live API 的改進(jìn)

今天,Live API 正在推出視聽輸入和原生音頻輸出對話的預(yù)覽版,這樣您就可以直接構(gòu)建更自然、更富有表現(xiàn)力的 Gemini 對話體驗。

它還允許用戶控制其說話的語調(diào)、口音和風(fēng)格。例如,您可以告訴模型在講故事時使用戲劇性的聲音。該模型現(xiàn)在還支持工具使用,以便能夠代表您進(jìn)行搜索。

您可以體驗以下一些早期功能:

情感對話 (Affective Dialogue): 模型能夠檢測用戶聲音中的情感并作出適當(dāng)回應(yīng)。

主動音頻 (Proactive Audio): 模型將忽略背景對話并知道何時回應(yīng)。

Live API 中的模型推理能力 (Thinking in the Live API): 模型利用 Gemini 的模型推理能力來支持更復(fù)雜的任務(wù)。

我們還在發(fā)布 2.5 Pro 和 2.5 Flash 的文本轉(zhuǎn)語音新預(yù)覽版。這些版本首次支持多位說話人,能夠通過原生音頻輸出實現(xiàn)兩種聲音的文本轉(zhuǎn)語音。

與原生音頻對話一樣,文本轉(zhuǎn)語音富有表現(xiàn)力,可以捕捉非常微妙的細(xì)微差別,例如耳語。它支持超過 24 種語言,并可以在它們之間無縫切換。

這項文本轉(zhuǎn)語音功能現(xiàn)已在 Gemini API 中可用。

計算機(jī)使用功能

我們正在將 Project Mariner 的計算機(jī)使用功能引入 Gemini API 和 Vertex AI。像 Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company 和 Cartwheel 這樣的公司正在探索其潛力,我們很高興能在今年夏天更廣泛地推出它,供開發(fā)者進(jìn)行實驗。

更高的安全性

我們還顯著增強(qiáng)了對例如間接提示詞注入攻擊等安全威脅的防護(hù)。間接提示詞注入攻擊是指將惡意指令嵌入到 AI 模型檢索的數(shù)據(jù)中。我們的新安全方法有助于顯著提高 Gemini 在使用過程中對抗間接提示詞注入攻擊的防護(hù)率,使 Gemini 2.5 成為我們迄今為止最安全的模型系列。

增強(qiáng)的開發(fā)者體驗

模型推理摘要

2.5 Pro 和 Flash 現(xiàn)在將在 Gemini API 和 Vertex AI 中包含模型推理摘要。模型推理摘要會將模型的原始模型推理組織成清晰的格式,包含標(biāo)題、關(guān)鍵細(xì)節(jié)以及有關(guān)模型操作的信息,例如何時使用工具。

我們希望通過更結(jié)構(gòu)化、更精簡的模型推理過程格式,開發(fā)者和用戶會發(fā)現(xiàn)與 Gemini 模型的交互更容易理解和調(diào)試。

模型推理預(yù)算

我們推出了帶有模型推理預(yù)算的 2.5 Flash,通過平衡延遲和質(zhì)量,讓開發(fā)者更好地控制成本。我們將此功能擴(kuò)展到 2.5 Pro。這允許您控制模型在響應(yīng)前用于模型推理的令牌數(shù)量,甚至可以關(guān)閉其模型推理能力。

帶有預(yù)算功能的 Gemini 2.5 Pro 將在未來幾周內(nèi)與我們?nèi)姘l(fā)布的模型一起,正式用于穩(wěn)定生產(chǎn)環(huán)境。

MCP 支持

我們在 Gemini API 中添加了對模型上下文協(xié)議 (Model Context Protocol, MCP) 定義的原生 SDK 支持,以便更輕松地與開源工具集成。我們還在探索部署 MCP 服務(wù)器和其他托管工具的方法,讓您更容易構(gòu)建智能體應(yīng)用。

我們一直在探索新的方法來改進(jìn)我們的模型和開發(fā)者體驗,包括使其更高效且性能更強(qiáng),并持續(xù)響應(yīng)開發(fā)者的反饋,所以請繼續(xù)提出寶貴意見!同時,我們持續(xù)在基礎(chǔ)研究的廣度和深度上加倍投入——包括推動 Gemini 能力的邊界。更多內(nèi)容即將推出。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    68

    瀏覽量

    7916
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35065

    瀏覽量

    279343
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3517

    瀏覽量

    50386

原文標(biāo)題:Gemini 2.5: 我們最智能的模型系列再升級

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)北京時間5月21日,谷歌2025 Google I/O開發(fā)者大會正式召開,從其發(fā)布的新品來看,這可以說是一場AI盛會。 在AI大模型方面,發(fā)布了Gemini 2.
    的頭像 發(fā)表于 05-22 09:01 ?5237次閱讀
    <b class='flag-5'>谷歌</b>AI霸主歸來!多線反擊OpenAI,開啟安卓<b class='flag-5'>Gemini</b>時代

    Firebase Studio現(xiàn)已集成Gemini 2.5

    。近期,我們通過增強(qiáng)其內(nèi)置的 App Prototyping 智能體,使其采用 Google 強(qiáng)大的 AI 模型 Gemini 2.5。所有 Firebase Studio 預(yù)覽版用戶現(xiàn)在都可以使用升級后集成
    的頭像 發(fā)表于 07-10 18:13 ?277次閱讀

    谷歌推出Gemini 2.5 Pro預(yù)覽版(I/O版本)

    我們目睹了開發(fā)者使用 Gemini 2.5 Pro 取得了令人贊嘆的成就。因此,我們決定提前數(shù)周發(fā)布更新版本,以便開發(fā)者盡早體驗新版模型。
    的頭像 發(fā)表于 06-10 10:43 ?447次閱讀

    谷歌Gemini API最新進(jìn)展

    今年的 Cloud Next 大會上,我們推出了一系列突破性更新與強(qiáng)大功能,旨在賦能廣大開發(fā)者,與大家攜手共創(chuàng)人工智能的未來。本次發(fā)布亮點(diǎn)包括:最新的 Gemini 2.5 思考
    的頭像 發(fā)表于 04-12 16:10 ?1005次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemin
    的頭像 發(fā)表于 02-07 15:07 ?709次閱讀

    三星 Galaxy S25 系列谷歌 Gemini 深度整合

    在Galaxy Unpacked發(fā)布會上,三星Galaxy S25系列手機(jī)震撼登場,其與谷歌Gemini的深度整合成為一大亮點(diǎn)。 此次整合后,Gemini AI助手為Galaxy S2
    的頭像 發(fā)表于 01-23 17:41 ?769次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌Gemini 模型來制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3
    的頭像 發(fā)表于 01-03 10:38 ?889次閱讀
    借助<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>和Imagen<b class='flag-5'>模型</b>生成高質(zhì)量圖像

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型,實現(xiàn)了對網(wǎng)絡(luò)信息的高效檢索與深度挖掘,進(jìn)一步滿足了用戶對精準(zhǔn)、詳盡信息的需求。 據(jù)悉
    的頭像 發(fā)表于 12-16 09:35 ?717次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款A(yù)I模型不僅在性能上實現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和原生工具應(yīng)用方面展現(xiàn)了前所未有的強(qiáng)大功能。 Gemi
    的頭像 發(fā)表于 12-12 14:22 ?813次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報告撰寫輔助。
    的頭像 發(fā)表于 12-12 10:13 ?640次閱讀

    Waymo利用谷歌Gemini模型,研發(fā)端到端自動駕駛系統(tǒng)

    邁新步,為其機(jī)器人出租車業(yè)務(wù)引入了一種基于谷歌多模態(tài)大語言模型(MLLM)“Gemini”的全新訓(xùn)練模型——“端到端多模態(tài)自動駕駛模型”(E
    的頭像 發(fā)表于 10-31 16:55 ?1712次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因為谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而
    的頭像 發(fā)表于 10-29 11:02 ?1132次閱讀

    聯(lián)發(fā)科新一代天璣旗艦芯片針對谷歌大語言模型Gemini Nano優(yōu)化

    近日,聯(lián)發(fā)科宣布了一個重要的技術(shù)進(jìn)展——新一代天璣旗艦芯片已經(jīng)針對谷歌的大語言模型Gemini Nano進(jìn)行了深度優(yōu)化。
    的頭像 發(fā)表于 10-09 16:44 ?815次閱讀

    谷歌Gemini 1.5 Flash模型升級,AI聊天速度飆升50%

    谷歌近期對其Gemini AI系列進(jìn)行了重大更新,推出了Gemini 1.5 Flash模型。此
    的頭像 發(fā)表于 09-06 18:06 ?1257次閱讀

    谷歌推出Gemini Live,開啟AI語音聊天新紀(jì)元

    在萬眾矚目的Pixel 9系列手機(jī)發(fā)布會上,谷歌震撼宣布了一項創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉
    的頭像 發(fā)表于 08-15 17:29 ?1036次閱讀