一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布史上最強(qiáng)大模型Gemini,全方位領(lǐng)先GPT-4,MMLU基準(zhǔn)達(dá)人類專家水平

Felix分析 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:吳子鵬 ? 2023-12-08 00:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)美國(guó)當(dāng)?shù)貢r(shí)間周三,谷歌發(fā)布了其新一代人工智能模型Gemini(雙子星)。谷歌CEO桑達(dá)爾?皮查伊和Deepmind CEO戴密斯·哈薩比斯在谷歌官網(wǎng)聯(lián)名發(fā)文,官宣了最新多模態(tài)大模型Gemini 1.0版本正式上線。

這次發(fā)布是按照谷歌此前的預(yù)期,但是對(duì)于業(yè)界而言非常突然。因?yàn)榫驮谝恢芮斑€有報(bào)告指出,谷歌原本計(jì)劃本周(當(dāng)時(shí)稱下周)發(fā)布Gemini,但現(xiàn)在已經(jīng)推遲到2024年1月。報(bào)告給出的原因是,谷歌“發(fā)現(xiàn)人工智能不能可靠地處理一些非英語(yǔ)查詢”,該公司認(rèn)為全球語(yǔ)言支持是最重要的,這是谷歌追趕和超越OpenAI GPT-4的關(guān)鍵性能之一。

現(xiàn)在,谷歌還是如期將Gemini 1.0上線了。

史上最強(qiáng)的AI大模型

從定位來(lái)看,Gemini 1.0版本是桑達(dá)爾?皮查伊親自督導(dǎo),籌備一年多時(shí)間,并瞄準(zhǔn)OpenAI GPT-4的大模型。很顯然,Gemini 1.0版本的效果是遠(yuǎn)超預(yù)期的,成為目前已經(jīng)上線發(fā)布的最強(qiáng)大的AI大模型,也是有史以來(lái)最強(qiáng)大的AI大模型。

據(jù)介紹,Gemini 1.0版本會(huì)有三個(gè)細(xì)分的版本:
·Gemini Ultra:谷歌最大、最強(qiáng)模型,適用于高度復(fù)雜的任務(wù)
·Gemini Pro:可擴(kuò)展至各種任務(wù)的Gemini模型
·Gemini Nano:適用于端側(cè)設(shè)備的高效Gemini版本(1.8B/3.25B)

Gemini 1.0版本是一個(gè)純正的多模態(tài)AI大模型,為什么要這樣說(shuō)呢?因?yàn)镚emini是以多模態(tài)模型為目標(biāo)重新構(gòu)建的,在復(fù)雜操作以及處理不同類型信息方面,其效率和絲滑度是當(dāng)前其他模型不可比擬的,這些信息包括文本、代碼、音頻、圖像和視頻。所以,Gemini也是迄今為止最靈活的大模型。

在基礎(chǔ)設(shè)施方面,谷歌使用自研的Tensor處理單元(TPU)v4和v5e對(duì)Gemini 1.0進(jìn)行訓(xùn)練。因此,在Gemini 1.0版本發(fā)布的同時(shí),谷歌也宣布推出迄今為止最強(qiáng)大、最高效、最可擴(kuò)展的TPU系統(tǒng)Cloud TPU v5p,專為訓(xùn)練尖端人工智能模型而設(shè)計(jì)。根據(jù)此前的爆料,Gemini 1.0版本訓(xùn)練需要的算力規(guī)模是GPT-4的5倍。

全新的設(shè)計(jì)和強(qiáng)大的算力底座,讓Gemini 1.0版本成了一個(gè)性能怪獸。根據(jù)谷歌發(fā)布的報(bào)告,在32項(xiàng)廣泛使用的基準(zhǔn)測(cè)試中,Gemini Ultra獲得了30個(gè)SOTA(State of the art,特指領(lǐng)先水平的大模型)。能夠看出,Gemini 1.0版本在文本、代碼、音頻、圖像和視頻處理能力方面,以及推理、數(shù)學(xué)、代碼等方面的能力均比GPT-4更加出色,可以說(shuō)是全方位吊打GPT-4。

wKgaomVxm3GAPuUaAAIVrdTtGvI369.gif
圖源:谷歌
wKgaomVxm3qAFIe5AAK33lJNSCI784.gif
圖源:谷歌

根據(jù)以上兩圖,Gemini在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解數(shù)據(jù)集)和MMMU(基于大學(xué)考試的測(cè)試基準(zhǔn))的成績(jī)格外值得關(guān)注。其中,Gemini Ultra在MMLU測(cè)試中的得分率高達(dá) 90.0%,首次超越了人類專家。MMLU數(shù)據(jù)集包含數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等 57 個(gè)科目,用于測(cè)試大模型的知識(shí)儲(chǔ)備和解決問(wèn)題能力。

在權(quán)威MMMU測(cè)試中,Gemini Ultra也獲得了59.4%的SOTA分?jǐn)?shù)。MMMU由IN.AI Research 等多所機(jī)構(gòu)組成的研究團(tuán)隊(duì)一同推出,可用于評(píng)估AI在大學(xué)水平的多學(xué)科問(wèn)題上的多模態(tài)理解和推理能力。其中包含的問(wèn)題來(lái)自大學(xué)考試、測(cè)驗(yàn)和教科書(shū),涉及六個(gè)常見(jiàn)學(xué)科:藝術(shù)與設(shè)計(jì)、商科、科學(xué)、健康與醫(yī)學(xué)、人文與社會(huì)科學(xué)、技術(shù)與工程。MMMU包含1.15萬(wàn)個(gè)精心選取的多模態(tài)問(wèn)題,涵蓋30個(gè)不同的科目和183個(gè)子領(lǐng)域,因此滿足廣度目標(biāo)。谷歌認(rèn)為,在MMMU中取得這樣的分?jǐn)?shù),證明Gemini在更復(fù)雜推理任務(wù)中還有更大的潛力值得挖掘。

谷歌認(rèn)為,Gemini作為一個(gè)原生的多模態(tài)大模型,和單獨(dú)訓(xùn)練拼接而成的多模態(tài)大模型有很大的不同,帶來(lái)了巨大的性能提升,并通過(guò)多模式級(jí)聯(lián)的數(shù)據(jù)進(jìn)行了調(diào)優(yōu),以進(jìn)一步完善其有效性。這就是為什么,Gemini幾乎在任何領(lǐng)域都是最領(lǐng)先的。

在谷歌發(fā)布的報(bào)告中,該公司基于Gemini進(jìn)行了復(fù)雜推理的顯示,比如Gemini可以非常高效地從數(shù)十萬(wàn)份文件中獲取對(duì)科學(xué)家有用的數(shù)據(jù),并創(chuàng)建數(shù)據(jù)集。你甚至可以讓它幫你給這些有價(jià)值的數(shù)據(jù)做進(jìn)一步的標(biāo)注。

在另一個(gè)案例中,Gemini可以在世界上最受歡迎的編程語(yǔ)言(如Python、Java、C++和Go)中理解、解釋和生成高質(zhì)量的代碼。由于對(duì)全球語(yǔ)言都有很好的支持,Gemini可以跨語(yǔ)言工作并對(duì)復(fù)雜信息進(jìn)行推理,使其成為世界上領(lǐng)先的編碼的基礎(chǔ)模型之一?;贕emini,谷歌創(chuàng)建了一個(gè)更先進(jìn)的代碼生成系統(tǒng)AlphaCode 2,該系統(tǒng)擅長(zhǎng)解決超越編碼的競(jìng)爭(zhēng)性編程問(wèn)題,涉及復(fù)雜的數(shù)學(xué)和理論計(jì)算機(jī)科學(xué)。

憑借GPT大模型,OpenAI這幾年的風(fēng)頭蓋過(guò)了谷歌,現(xiàn)在憑借Gemini,谷歌打了一個(gè)漂亮的翻身仗。不過(guò),桑達(dá)爾?皮查伊在接受采訪時(shí)表示,Gemini只是領(lǐng)先GPT-4一點(diǎn)點(diǎn),“想想看,向人工智能的轉(zhuǎn)變是多么深刻,我們還處于早期階段,前方的世界充滿機(jī)遇。”

谷歌表示,Gemini將通過(guò)谷歌產(chǎn)品推向數(shù)十億用戶。從12月13日開(kāi)始,開(kāi)發(fā)者和企業(yè)客戶可以通過(guò)Google AI Studio或Google Cloud Vertex AI中的Gemini API訪問(wèn)Gemini Pro。2024年初,谷歌還將推出Bard Advanced,這是一種新的頂級(jí)人工智能體驗(yàn),讓用戶從Gemini Ultra開(kāi)始訪問(wèn)谷歌最好的模型和功能。

更強(qiáng)的功能與更大的擔(dān)憂

在Gemini的介紹報(bào)告中,谷歌花費(fèi)很大篇幅來(lái)闡述責(zé)任和安全。在報(bào)告中谷歌提到,“在谷歌,我們致力于在我們所做的一切工作中推進(jìn)大膽和負(fù)責(zé)任的人工智能。基于谷歌的人工智能原則和我們產(chǎn)品的強(qiáng)大安全政策,我們正在添加新的保護(hù)措施來(lái)保證Gemini的多模式聯(lián)運(yùn)能力。在開(kāi)發(fā)的每個(gè)階段,我們都在考慮潛在風(fēng)險(xiǎn),并努力測(cè)試和減輕它們。”

“我們對(duì)迄今為止的任何谷歌人工智能模型進(jìn)行了最全面的安全評(píng)估,包括偏見(jiàn)和數(shù)據(jù)毒性。我們對(duì)網(wǎng)絡(luò)犯罪、說(shuō)服和自主意識(shí)等潛在風(fēng)險(xiǎn)領(lǐng)域進(jìn)行了新的研究,并應(yīng)用了谷歌一流的對(duì)抗性測(cè)試技術(shù),以幫助在Gemini部署之前識(shí)別關(guān)鍵安全問(wèn)題?!?br />
同時(shí),為了減少測(cè)試的盲點(diǎn),谷歌也在與外部專家和合作伙伴一起進(jìn)行壓力測(cè)試。然而,就像桑達(dá)爾?皮查伊提到,很多基準(zhǔn)測(cè)試還在逐步完善一樣,實(shí)際上對(duì)于AI大模型的安全測(cè)試也是如此,很多方面的測(cè)試都還是空白,人們?cè)谑褂靡恍?duì)付傳統(tǒng)人工智能的手段來(lái)對(duì)AI大模型進(jìn)行壓力測(cè)試,但這顯然是不夠的。

目前,行業(yè)將AI大模型的安全風(fēng)險(xiǎn)分為三個(gè)方向,分別是訓(xùn)練數(shù)據(jù)、模型本身和使用場(chǎng)景。在訓(xùn)練數(shù)據(jù)方面,數(shù)據(jù)采集不當(dāng)、存在偏見(jiàn)或標(biāo)簽錯(cuò)誤、數(shù)據(jù)被投毒等都被視為安全風(fēng)險(xiǎn);在模型本身,模型的可靠性、穩(wěn)定性、魯棒性等都是測(cè)試項(xiàng),同時(shí)企業(yè)也在關(guān)注模型被誤導(dǎo)性;然后在使用階段,主要防范欺詐、歧視、政治傾向等風(fēng)險(xiǎn)內(nèi)容,以及用戶數(shù)據(jù)的保護(hù)。

表面上看,好像已經(jīng)能夠覆蓋大模型各方面的風(fēng)險(xiǎn),但是在目前的方案中,企業(yè)發(fā)現(xiàn)由于大模型處于野蠻生長(zhǎng)的階段,很多問(wèn)題都是未知的。于是乎,ChatGPT被發(fā)現(xiàn)存在大量具有攻擊性的行為。行業(yè)想到的辦法是用魔法打敗魔法——以AI對(duì)抗AI。

然而,魔高一尺還是道高一丈,這實(shí)際上也是不可控的。

今年3月份,一封千位大佬的聯(lián)名信呼吁,應(yīng)該立即停止訓(xùn)練比GPT-4更強(qiáng)大的AI系統(tǒng),暫停期至少6個(gè)月。簽名的有圖靈獎(jiǎng)得主Yoshua Bengio、Stability AI首席執(zhí)行官Emad Mostaque、蘋(píng)果聯(lián)合創(chuàng)始人Steve Wozniak、紐約大學(xué)教授馬庫(kù)斯、馬斯克,以及《人類簡(jiǎn)史》作者Yuval Noah Harari等。但此事似乎并沒(méi)有什么結(jié)論。

也就在日前,OpenAI公布了該公司在安全方面的舉措,實(shí)際上和谷歌等公司都是大同小異,且都說(shuō)明對(duì)于AI大模型的防護(hù)也是需要不斷完善,通過(guò)實(shí)踐和研究來(lái)解決安全問(wèn)題。

不難預(yù)見(jiàn),新一輪AI大模型“競(jìng)賽”開(kāi)始了,安全和責(zé)任制措施當(dāng)然也會(huì)升級(jí),但模型和防護(hù)誰(shuí)發(fā)展更快,相信更多人都傾向于相信前者發(fā)展更加野蠻。

結(jié)語(yǔ)

Gemini模型的發(fā)布標(biāo)志著,全球AI大模型發(fā)展正式進(jìn)入原生多模態(tài)時(shí)代,模型的各項(xiàng)性能和數(shù)據(jù)融合能力將顯著增強(qiáng)。在更廣泛的領(lǐng)域,AI大模型將取代人工,且比人工更加出色。不過(guò),安全問(wèn)題似乎并沒(méi)有被妥善解決,新一輪AI大模型競(jìng)賽就直接開(kāi)始了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108114
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    68

    瀏覽量

    7921
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌AI霸主歸來(lái)!多線反擊OpenAI,開(kāi)啟安卓Gemini時(shí)代

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)北京時(shí)間5月21日,谷歌2025 Google I/O開(kāi)發(fā)者大會(huì)正式召開(kāi),從其發(fā)布的新品來(lái)看,這可以說(shuō)是一場(chǎng)AI盛會(huì)。 在AI大模型方面,發(fā)布
    的頭像 發(fā)表于 05-22 09:01 ?5239次閱讀
    <b class='flag-5'>谷歌</b>AI霸主歸來(lái)!多線反擊OpenAI,開(kāi)啟安卓<b class='flag-5'>Gemini</b>時(shí)代

    OpenAI發(fā)布o1大模型,數(shù)理化水平比肩人類博士,國(guó)產(chǎn)云端推理芯片的新藍(lán)海?

    時(shí)間思考后再做出回答,而傳統(tǒng)大模型是直接給出回答,但往往這個(gè)回答并不準(zhǔn)確。 ? OpenAI介紹稱,OpenAI o1模型解決了很多傳統(tǒng)模型,包括目前最強(qiáng)大
    發(fā)表于 09-14 00:04 ?1819次閱讀
    OpenAI<b class='flag-5'>發(fā)布</b>o1大<b class='flag-5'>模型</b>,數(shù)理化<b class='flag-5'>水平</b>比肩<b class='flag-5'>人類</b>博士,國(guó)產(chǎn)云端推理芯片的新藍(lán)海?

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我們發(fā)布了迄今為止最智能的模型 Gemini 2.5 Pro,兩周前,我們提前為您帶來(lái)了 I/O 更新,以便開(kāi)發(fā)者構(gòu)建出色的網(wǎng)絡(luò)應(yīng)用。
    的頭像 發(fā)表于 05-23 14:56 ?537次閱讀

    OpenAI即將發(fā)布GPT-4.5與GPT-5

    ,GPT-4.5將在未來(lái)幾周內(nèi)率先亮相,它將是OpenAI通用GPT-4模型的繼承者。這款新的算法在技術(shù)上進(jìn)行了諸多優(yōu)化和升級(jí),旨在為用戶提供更加精準(zhǔn)、高效的AI服務(wù)。 而在GPT-4
    的頭像 發(fā)表于 02-13 13:43 ?641次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以
    的頭像 發(fā)表于 02-07 15:07 ?713次閱讀

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢(shì)可以帶來(lái)顯著的成果。通過(guò)利用谷歌Gemini 模型來(lái)制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3
    的頭像 發(fā)表于 01-03 10:38 ?890次閱讀
    借助<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>和Imagen<b class='flag-5'>模型</b>生成高質(zhì)量圖像

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語(yǔ)言模型,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)信息的高效檢索與深度挖掘,進(jìn)一步滿足了用戶對(duì)精準(zhǔn)、詳盡信息的
    的頭像 發(fā)表于 12-16 09:35 ?721次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時(shí)代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款A(yù)I模型不僅在性能上實(shí)現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和原生工具應(yīng)用方面展現(xiàn)了前所未有的
    的頭像 發(fā)表于 12-12 14:22 ?817次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報(bào)告撰寫(xiě)輔助。 Gemini 2.0通過(guò)高
    的頭像 發(fā)表于 12-12 10:13 ?641次閱讀

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)?b class='flag-5'>谷歌在人工智能領(lǐng)域一直保持
    的頭像 發(fā)表于 10-29 11:02 ?1137次閱讀

    訊飛星火大模型4.0 Turbo正式發(fā)布

    近日,2024科大訊飛全球1024開(kāi)發(fā)者節(jié)正式開(kāi)幕。在數(shù)千名行業(yè)領(lǐng)袖、專家學(xué)者與開(kāi)發(fā)者的共同見(jiàn)證下,訊飛星火大模型4.0 Turbo正式發(fā)布。七大核心能力全面超過(guò)GPT-4 Turbo
    的頭像 發(fā)表于 10-27 15:47 ?1019次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見(jiàn)證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來(lái)革命性的變化。在這場(chǎng)技術(shù)競(jìng)賽中,Llama 3和GPT-4作為兩個(gè)備受矚目的模型,它們代表了當(dāng)前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?1149次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

    超過(guò)GPT-4 Turbo,數(shù)學(xué)能力和代碼能力更是超過(guò)了Open AI最新一代GPT模型GPT-4o。此外,其效率相對(duì)提升50%。
    的頭像 發(fā)表于 10-24 11:39 ?1065次閱讀

    【每天學(xué)點(diǎn)AI】人工智能大模型評(píng)估標(biāo)準(zhǔn)有哪些?

    OpenAI新模型o1號(hào)稱編程能力8倍殺GPT-4o,MMLU媲美人類專家,MMLU是什么?評(píng)估
    的頭像 發(fā)表于 10-17 16:49 ?1424次閱讀
    【每天學(xué)點(diǎn)AI】人工智能大<b class='flag-5'>模型</b>評(píng)估標(biāo)準(zhǔn)有哪些?

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來(lái)取代GPT-3.5.這是目前市場(chǎng)上最具成本效益的小模型。 ? 該模型
    的頭像 發(fā)表于 07-21 10:20 ?1675次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4</b>o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜