電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)北京時(shí)間5月21日,谷歌2025 Google I/O開(kāi)發(fā)者大會(huì)正式召開(kāi),從其發(fā)布的新品來(lái)看,這可以說(shuō)是一場(chǎng)AI盛會(huì)。
在AI大模型方面,發(fā)布了Gemini 2.5 Pro、擴(kuò)散語(yǔ)言模型Gemini Diffusion、視頻生成模型Veo 3+ Flow應(yīng)用、圖像生成模型Imagen 4等。在硬件端,分別與三星、Xreal發(fā)布了Android XR頭顯、AR智能眼鏡等。在搜索端,發(fā)布了AI Mode搜索模式、Search Live等。
谷歌宣布新的Gemini訂閱計(jì)劃:AI Pro用戶定價(jià)月付19.99美元(折合人民幣約144元),就能夠使用Veo 2、Gemini 2.5 Pro等入門級(jí)產(chǎn)品;AI Ultra用戶定價(jià)月付249.99美元(折合人民幣約1804元),可一次性獲得Veo 3的無(wú)限訪問(wèn)權(quán)限、使用Gemini 2.5 Pro深度思考模式等多項(xiàng)高級(jí)功能。
從軟件到應(yīng)用,谷歌的AI生態(tài)已經(jīng)越來(lái)越成熟,其AI大模型以及相應(yīng)的服務(wù)也將越來(lái)越強(qiáng)大。
以Gemini 2.5 Pro為技術(shù)底座,谷歌開(kāi)始反擊OpenAI
自上屆Google I/O開(kāi)發(fā)者大會(huì)以來(lái),谷歌已經(jīng)宣布了十幾種模型的突破,并且發(fā)布了20多款A(yù)I產(chǎn)品和功能。自第一代Gemini模型發(fā)布以來(lái),Gemini模型的Elo分?jǐn)?shù)上升了300多分。此外,在AI代碼編輯器Cursor上,Gemini 2.5 Pro是今年增長(zhǎng)最快的模型,能夠?qū)崿F(xiàn)每分鐘產(chǎn)出數(shù)十萬(wàn)行可接受的代碼。
谷歌DeepMind創(chuàng)始人兼CEO戴密斯·哈薩比斯表示,Gemini 2.5 Pro是谷歌有史以來(lái)最智能的模型,也是全球最強(qiáng)大的基礎(chǔ)模型。就在兩周前,谷歌發(fā)布了Gemini 2.5 Pro的預(yù)覽版,因此開(kāi)發(fā)者可以立即使用并構(gòu)建它,例如將草圖轉(zhuǎn)化為交互式應(yīng)用程序、模擬3D城市等。
Gemini 2.5 Pro模型也已經(jīng)接入LearnLM(專為學(xué)習(xí)場(chǎng)景微調(diào)的模型),提升了Gemini 2.5 Pro在學(xué)習(xí)場(chǎng)景的能力。
在大會(huì)上,谷歌還發(fā)布了Gemini 2.5 Flash的升級(jí)版。Gemini 2.5 Flash是一款輕量化AI大模型,具備速度更快、低成本的優(yōu)勢(shì)。Gemini 2.5 Flash的升級(jí)版提升了推理、代碼和長(zhǎng)上下文理解的能力,效率提升了 22%。Gemini 2.5 Flash將在6月初上市,Pro 版本也會(huì)緊隨其后。
Gemini 2.5 Pro 新增“思考預(yù)算”控件、更好的成本控制。Gemini 2.5 Pro和Gemini 2.5 Flash還支持原生音頻輸出,可以輕松地在24種不同語(yǔ)言之間切換,且能夠區(qū)分說(shuō)話者背景聲音,建立更自然的對(duì)話體驗(yàn)。在安全方面,谷歌表示,通過(guò)增強(qiáng)安全防護(hù),Gemini 2.5 Pro和Gemini 2.5 Flash是谷歌迄今為止最安全的型號(hào)。
谷歌還發(fā)布了全新的模型:擴(kuò)散語(yǔ)言模型Gemini Diffusion,其利用并行生成來(lái)實(shí)現(xiàn)極低的延遲,生成速度比Gemini 2.5 Flash還快5倍,編碼能力與之相當(dāng)。
另外,谷歌一直在探索Gemini 思維、推理能力的前沿技術(shù),基于使用 AlphaGo 的經(jīng)驗(yàn),谷歌推出了Gemini 2.5 Pro "Deep Think"(深度思考模式)模型,采用了類AlphaGo的并行推理技術(shù),能夠?qū)崿F(xiàn)更加深入的思考,提升了Gemini 2.5 Pro 在學(xué)術(shù)與推理基準(zhǔn)上應(yīng)用體驗(yàn)。在美國(guó)數(shù)學(xué)奧林匹克2025測(cè)試和Live Codebench編程測(cè)試取得領(lǐng)先的地位。
在過(guò)去十年,谷歌為現(xiàn)代AI時(shí)代奠定了很多技術(shù)基礎(chǔ),從開(kāi)創(chuàng)性推出Transformer等大模型架構(gòu)支撐著所有大語(yǔ)言模型,到AlphaGo 和 Alphazero 等代理系統(tǒng)。谷歌也將持續(xù)加大基礎(chǔ)研究的廣度和深度,以實(shí)現(xiàn)通用AI所需的下一個(gè)突破。
谷歌與OpenAI的AI競(jìng)爭(zhēng),由于ChatGPT的出現(xiàn),讓OpenAI反超谷歌一局,谷歌的搜索業(yè)務(wù)和AI產(chǎn)品都大受打擊。如今Gemini AI的重磅更新,是谷歌奪回技術(shù)和市場(chǎng)高地的關(guān)鍵。谷歌表示,Gemini AI已經(jīng)是最好的基礎(chǔ)模型,但公司的目標(biāo)是:努力拓展Gemini AI,使它成為“世界模型”。
谷歌在AI技術(shù)競(jìng)賽中找回自己的節(jié)奏,選擇主動(dòng)出擊、引領(lǐng)行業(yè)。除了Gemini AI,本次 I/O 大會(huì)的重磅:全新的AI搜索模式AI Mode。AI Mode模式也被認(rèn)為是谷歌的一場(chǎng)“革命”,用AI機(jī)器人替代原來(lái)的搜索功能,將聊天機(jī)器人的對(duì)話能力嵌入搜索體驗(yàn)中,支持繼續(xù)追問(wèn)。該模式將在美國(guó)推出。
從技術(shù)路徑看,AI Mode模式以Gemini 2.5 Pro為底層模型,引入“查詢扇出(query fan-out)”技術(shù),可跨子主題和多個(gè)數(shù)據(jù)源并行處理,再匯總成一段多模態(tài)長(zhǎng)答復(fù)。技術(shù)路徑與DeepResearch相似。但也是谷歌試圖通過(guò)引入更先進(jìn)的多模態(tài)數(shù)據(jù)處理能力、優(yōu)化用戶體驗(yàn)以及加強(qiáng),反擊OpenAI的必要之舉。
當(dāng)前,AI技術(shù)產(chǎn)業(yè)正在以超過(guò)預(yù)期的速度發(fā)展,不僅僅是谷歌和OpenAI。蘋(píng)果也在加速進(jìn)入這個(gè)賽道,例如蘋(píng)果推出了Apple Intelligence。業(yè)內(nèi)消息顯示蘋(píng)果也在推進(jìn)AI技術(shù)的布局,未來(lái)或?qū)⒃试S第三方開(kāi)發(fā)者使用其AI模型編寫(xiě)軟件。這將成為蘋(píng)果推動(dòng)新應(yīng)用的開(kāi)發(fā),成為蘋(píng)果在推動(dòng)AI領(lǐng)域趕超競(jìng)爭(zhēng)對(duì)手的“底牌”。這一消息將在6月9日的全球開(kāi)發(fā)者大會(huì)(WWDC)上有所答案。
“殺回”智能眼鏡戰(zhàn)場(chǎng):Android XR發(fā)布、與生態(tài)伙伴聯(lián)手
除了大模型,谷歌此次Google I/O開(kāi)發(fā)者大會(huì)的亮點(diǎn)還有“殺回”智能眼鏡行業(yè)。谷歌再次介紹了Android XR、Wear OS 6這兩大操作系統(tǒng),并展示了兩款智能眼鏡產(chǎn)品。
谷歌在智能眼鏡項(xiàng)目上也有著超過(guò)10年的經(jīng)驗(yàn),它不僅是這一領(lǐng)域的開(kāi)拓者,也是不斷演進(jìn)的見(jiàn)證者。從2015年的第一款智能眼鏡Google Glass(消費(fèi)版)至今,谷歌在這個(gè)領(lǐng)域經(jīng)歷了起起伏伏。谷歌并沒(méi)有放棄對(duì)智能眼鏡的追求。相反,它利用這段時(shí)間積累了豐富的經(jīng)驗(yàn),并結(jié)合了最新的AI技術(shù),以全新的視角重新審視這個(gè)市場(chǎng)。
一個(gè)有用的AI助手能夠讓你的生活更輕松,但是這種新形式能否讓你以新的方式體驗(yàn)AI助手呢?谷歌表示,這正是我們推出Android XR的原因。
Android XR是谷歌聯(lián)合三星、高通打造的首個(gè)專為 Gemini 時(shí)代打造的 Android 平臺(tái),支持不同形態(tài)的設(shè)備,包括VR頭顯、AR智能眼鏡等,包括支持VST(視頻透視)和OST(光學(xué)透視)在內(nèi)的多樣化沉浸式設(shè)備。開(kāi)發(fā)者可以基于Android XR定制自己的產(chǎn)品。
自去年發(fā)布Android XR開(kāi)發(fā)者預(yù)覽版本以來(lái),已有數(shù)百名開(kāi)發(fā)者為該平臺(tái)進(jìn)行開(kāi)發(fā),并且手機(jī)、平板電腦應(yīng)用程序都可以運(yùn)行。
在大會(huì)上,谷歌演示了基于Android XR的智能眼鏡功能,它支持實(shí)時(shí)翻譯、圖像記憶、地圖導(dǎo)航、拍照等功能。就在演示實(shí)時(shí)翻譯時(shí),Gemini卡住,導(dǎo)致一副智能眼鏡的實(shí)時(shí)窗口死機(jī)。谷歌表示,“這是一個(gè)非常冒險(xiǎn)的演示,但我們會(huì)嘗試一下?!边@也說(shuō)明,真正無(wú)縫銜接的AI虛擬世界還有一段距離,谷歌也在直面這個(gè)過(guò)程中的問(wèn)題。
在大會(huì)上,谷歌介紹了兩款基于Android XR打造的AR設(shè)備,第一款是與三星合作的Project Moohan,這是一款谷歌眼鏡原型機(jī),支持全彩顯示,能夠通過(guò)語(yǔ)音實(shí)現(xiàn)AI交互,搭載攝像頭能夠提供圖像識(shí)別功能。
谷歌宣布,公司與三星的合作關(guān)系將會(huì)提升至新的水平,將Android XR從頭顯拓展至智能眼鏡領(lǐng)域,雙方也已經(jīng)在合作開(kāi)發(fā)軟件和參考硬件平臺(tái)方面取得進(jìn)展。
第二款是Project Aura,這是谷歌聯(lián)合XREAL共同推出的專為 Android XR 平臺(tái)打造的旗艦級(jí) AR 眼鏡,Project Aura 基于 OST(光學(xué)透視)技術(shù)路線。這款產(chǎn)品的發(fā)布也標(biāo)志著AR產(chǎn)業(yè)正式跨入“安卓時(shí)刻”。
Google副總裁、Android XR 負(fù)責(zé)人 Shahram Izadi介紹,表示,通過(guò)平臺(tái)開(kāi)放性與 XREAL 在輕量化、便攜XR 硬件上的領(lǐng)先能力結(jié)合,我們正在推動(dòng)空間體驗(yàn)進(jìn)入更直觀、更可及的 OST 時(shí)代,這是我們生態(tài)系統(tǒng)發(fā)展史上的重要時(shí)刻。
XREAL表示,此次聯(lián)合發(fā)布,集結(jié)了Google、XREAL與高通三方技術(shù)實(shí)力,形成覆蓋“平臺(tái)-硬件-芯片”的黃金鐵三角。
這一次,我們可以相信谷歌在經(jīng)過(guò)多年的技術(shù)投入之后,不會(huì)輕易放棄AI智能眼鏡市場(chǎng)。從2025 Google I/O開(kāi)發(fā)者大會(huì)可以看到,谷歌在智能眼鏡行業(yè)將不再是單打獨(dú)斗,包括與上游芯片企業(yè)合作、與下游智能眼鏡品牌合作。通過(guò)軟件、硬件賦能,加上谷歌在安卓 近數(shù)十億用戶基礎(chǔ),谷歌正在擁抱一個(gè)更大的智能眼鏡生態(tài)。
谷歌認(rèn)為人工智能的機(jī)遇是巨大的,而這取決于開(kāi)發(fā)人員、技術(shù)建設(shè)者和解決方案商,以確保它能被更多人使用。
-
谷歌
+關(guān)注
關(guān)注
27文章
6231瀏覽量
108153 -
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
280018
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論