一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-4o深夜炸場!AI實時視頻通話絲滑如人類,Plus功能免費可用

穎脈Imgtec ? 2024-05-15 08:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

轉(zhuǎn)自:量子位 | 公眾號 QbitAI

不開玩笑,電影《她》真的來了。

OpenAI最新旗艦大模型GPT-4o,不僅免費可用,能力更是橫跨聽、看、說,絲滑流暢毫無延遲,就像在打一個視頻電話。

現(xiàn)場直播的效果更是炸裂:

它能感受到你的呼吸節(jié)奏,也能用比以前更豐富的語氣實時回復(fù),甚至可以做到隨時打斷。


GPT-4o里的“o”是Omni的縮寫,也就是“全能”的意思,接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像輸出。

它可以在短至232毫秒、平均320毫秒的時間內(nèi)響應(yīng)音頻輸入,與人類在對話中的反應(yīng)速度一致。


這還是一份給所有人的大禮,GPT4-o與ChatGPT Plus會員版所有的能力,包括視覺、聯(lián)網(wǎng)、記憶、執(zhí)行代碼、GPT Store……

將對所有用戶免費開放!

eb0e1682-1251-11ef-9118-92fbcf53809c.png

(新語音模式幾周內(nèi)先對Plus用戶開放)在直播現(xiàn)場,CTO Murati穆姐說:這是把GPT-4級別的模型開放出去,其實她還謙虛了。

在場外,研究員William Fedus揭秘,GPT-4o就是之前在大模型競技場搞A/B測試的模型之一,im-also-a-good-gpt2-chatbot。

無論從網(wǎng)友上手體驗還是競技場排位來看,都是高于GPT-4-Turbo級別的模型了,ELO分?jǐn)?shù)一騎絕塵。

eb122dc6-1251-11ef-9118-92fbcf53809c.png

而這樣的超強(qiáng)模型也將提供API,價格打5折,速度提高一倍,單位時間調(diào)用次數(shù)足足是原來的5倍!

追直播的網(wǎng)友已經(jīng)在設(shè)想可能的應(yīng)用,可以替代盲人看世界了。以及確實感覺比之前的語音模式體驗上強(qiáng)上不少。

eb5edc84-1251-11ef-9118-92fbcf53809c.png

鑒于之前不少人就已經(jīng)和ChatGPT語音模式“談戀愛”了,有大膽想法的朋友,可以把你們的想法發(fā)在評論區(qū)了。


總裁Brockman在線演示

知道OpenAI發(fā)布會為什么定在谷歌I/O前一天了——打臉,狠狠打臉。

谷歌Gemini發(fā)布會需要靠剪輯視頻和切換提示詞達(dá)成的偽實時對話效果,OpenAI現(xiàn)場全都直播演示了。

比如讓ChatGPT在語言不通的兩個人之間充當(dāng)翻譯機(jī),聽到英語就翻譯成意大利語,聽到意大利語就翻譯成英語。


發(fā)布會直播之外,總裁哥Brockman還發(fā)布了額外的5分鐘詳細(xì)演示。而且是讓兩個ChatGPT互相對話,最后還唱起來了,戲劇感直接拉滿。這兩個ChatGPT,一個是舊版APP,只知道對話,另一個則是新版網(wǎng)頁,具備視覺等新能力。(我們不妨取Old和New的首字母,分別叫TA們小O和小N)eb8f021a-1251-11ef-9118-92fbcf53809c.pngBrockman首先向小O介紹了大致情況,告訴她要和一個擁有視覺能力的AI對話,她表示很酷并欣然接受。接著,Brockman讓她稍作休息,并向小N也介紹情況,還順帶展示了小N的視覺能力。只見打完招呼后,小N準(zhǔn)確地說出了Brockman的衣著打扮和房間環(huán)境。而對于要和小O對話這件事,小N也感到很有趣。
接下來就是小O和小N相互對白的時間了,TA們依然是從Brockman的衣著開始聊起,小O不斷提出新的問題,小N都一一解答。接著,他們又談?wù)摿朔块g的風(fēng)格、布置和光線,甚至小N還意識到了Brockman正站在上帝視角凝視著TA們。


如果你看了這段視頻就會發(fā)現(xiàn),畫面中出現(xiàn)了一個女人在Brockman身后做了些惡搞的手勢。這可不是亂入,是Brockman和女人串通好,專門給小N設(shè)計的一道“考題”。

就在小O和小N聊的正開心的時候,Brockman選擇加入,直接問有沒有看到什么不正常的地方。結(jié)果是小N直接識破了Brockman的小伎倆,直接復(fù)述出了女人在他身后做小動作的場景,小O聽了之后直接感嘆原來在這里享受樂趣的不只有我們兩個。Brockman把這句話當(dāng)成了夸贊,并對小O表示了感謝,還愉快地加入了TA們的對話。之后是最后也是最精彩的部分,在Brockman的指揮下,小O和小N根據(jù)剛才聊天的內(nèi)容,直接開啟了對唱模式。只過了簡單幾輪,銜接地就十分密切,而且旋律悠揚,音色也是和真人毫無二致。
最后視頻以Brockman唱出的一句Thank you結(jié)束,在視頻外的推文中他還透露新的語音對話功能將在數(shù)周內(nèi)向Plus用戶開放。

ebcac93a-1251-11ef-9118-92fbcf53809c.png


端到端訓(xùn)練,一個神經(jīng)網(wǎng)絡(luò)搞定語音文本圖像

正如奧特曼在發(fā)布會前所說,GPT-4o讓人感覺像魔法一樣,那么它是如何做到的呢?非常抱歉,這次非但沒有論文,連技術(shù)報告也不發(fā)了,只在官網(wǎng)Blog里有一段簡短的說明。在GPT-4o之前,ChatGPT語音模式由三個獨立模型組成,語音轉(zhuǎn)文本→GPT3.5/GPT-4→文本轉(zhuǎn)語音。我們也可以讓舊版ChatGPT語音模式自己講一下具體是怎么個流程。ebe410c0-1251-11ef-9118-92fbcf53809c.jpg這樣一來,整個系統(tǒng)的延遲足足有2.8秒(GPT-3.5)和5.4秒(GPT-4),而且丟失了大量的信息,它無法直接感受音調(diào)、多個說話者或背景噪音,也無法輸出笑聲、唱歌聲,或表達(dá)情感。ebfabea6-1251-11ef-9118-92fbcf53809c.jpgGPT-4o則是跨文本、視覺和音頻端到端訓(xùn)練的新模型,這意味著所有輸入和輸出都由同一個神經(jīng)網(wǎng)絡(luò)處理。在語音翻譯任務(wù)上,強(qiáng)于OpenAI專門的語音模型Whisper-V3以及谷歌和Meta的語音模型。ec8d0a68-1251-11ef-9118-92fbcf53809c.png在視覺理解上,也再次反超Gemini 1.0 Ultra與對家Claude Opuseca698d4-1251-11ef-9118-92fbcf53809c.png

雖然技術(shù)方面這次透露的消息就這么多了,不過也有學(xué)者評價。

一個成功的演示相當(dāng)于1000篇論文。

ecaabb4e-1251-11ef-9118-92fbcf53809c.png


One More Thing

除了OpenAI帶來的精彩內(nèi)容之外,也別忘了北京時間5月15日凌晨,谷歌將召開I/O大會。到時量子位將繼續(xù)第一時間帶來最新消息。另外根據(jù)網(wǎng)友推測,GPT-4o這么強(qiáng),全都免費開放了,這是勸大家不續(xù)訂ChatGPT Plus了的意思嗎?那肯定不是啊~ecaef9f2-1251-11ef-9118-92fbcf53809c.png鑒于OpenAI春節(jié)期間在谷歌發(fā)布Gemini 1.5 Pro后半小時左右用Sora狙擊了一把,明天OpenAI還有新活也說不定呢?直播回放

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279112
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48987

    瀏覽量

    249075
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16070
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    GPT-4o怎么搶了Midjourney的飯碗

    這或許才是人類發(fā)明AI的終極目標(biāo)——讓技術(shù)普惠到每一個角落。
    的頭像 發(fā)表于 04-14 16:26 ?2160次閱讀
    <b class='flag-5'>GPT-4o</b>怎么搶了Midjourney的飯碗

    從性能到商業(yè),Grok3、GPT-4o、DeepSeek如何重塑AI版圖?

    2025年2月,AI領(lǐng)域仿佛上演了一激烈的“諸神之戰(zhàn)”,馬斯克旗下xAI發(fā)布的Grok3、OpenAI推出的GPT-4o以及持續(xù)憑借R1模型大放異彩的DeepSeek,三大巨頭強(qiáng)勢登場,讓A
    的頭像 發(fā)表于 02-19 18:14 ?1055次閱讀
    從性能到商業(yè),Grok3、<b class='flag-5'>GPT-4o</b>、DeepSeek如何重塑<b class='flag-5'>AI</b>版圖?

    馬斯克發(fā)布Grok 3大模型,超越GPT-4o

    多項benchmark測試中,Grok 3取得了比DeepSeek-v3、GPT-4o以及Gemini-2 pro更優(yōu)的效果。這一成績無疑彰顯了Grok 3在人工智能領(lǐng)域的卓越實力。 值得一提的是,Grok 3已經(jīng)在xAI內(nèi)部運行了兩周時間,經(jīng)過了初步的測試和驗證。馬斯克在發(fā)布預(yù)告時,曾稱其為“地球上最
    的頭像 發(fā)表于 02-19 13:50 ?413次閱讀

    OpenAI宣布GPT 4o升智計劃

    透露,GPT 4o的智力水平將得到顯著提升,目標(biāo)直指o3 pro的水平。這一升級不僅意味著GPT 4o在理解和生成文本方面的能力將得到質(zhì)的飛
    的頭像 發(fā)表于 02-17 14:24 ?586次閱讀

    OpenAI報告GPT-4o4o-mini模型性能下降,正緊急調(diào)查

    近日,全球領(lǐng)先的AI研究機(jī)構(gòu)OpenAI發(fā)布了一份事故報告,引起了業(yè)界的廣泛關(guān)注。報告中指出,OpenAI目前正面臨GPT-4o4o-mini這兩款重要模型性能下降的問題。 據(jù)OpenAI方面透露
    的頭像 發(fā)表于 01-23 10:22 ?834次閱讀

    OpenAI:GPT-4o4o-mini模型性能下降,正展開調(diào)查

    近期,OpenAI發(fā)布了一份事故報告,指出其GPT-4o4o-mini模型遭遇了性能下降的問題。這一消息引起了業(yè)界的廣泛關(guān)注和討論。 據(jù)OpenAI官方透露,他們目前正在積極調(diào)查這一性能下降的原因
    的頭像 發(fā)表于 01-21 10:34 ?640次閱讀

    商湯科技推出SenseNova-5o,限時免費實時視頻對話服務(wù)

    實時交互、視覺識別、記憶思考、持續(xù)對話和復(fù)雜推理等多項能力。這些功能使得AI人類之間的交流更加自然、流暢,每一次互動都充滿了智能與貼心。 通過SenseNova-5
    的頭像 發(fā)表于 01-20 15:11 ?720次閱讀

    解鎖 GPT-4o!2024 ChatGPT Plus 代升級全攻略(附國內(nèi)支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承諾 Plus 用戶享有更快的響應(yīng)速度、優(yōu)先使用新功能及最新模型,包括強(qiáng)大的 GPT-4o。本文將分享 2024 年 Chat
    的頭像 發(fā)表于 10-29 18:17 ?2453次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

    超過GPT-4 Turbo,數(shù)學(xué)能力和代碼能力更是超過了Open AI最新一代GPT模型GPT-4o。此外,其效率相對提升50%。
    的頭像 發(fā)表于 10-24 11:39 ?1058次閱讀

    OpenAI解鎖GPT-4o定制功能,助力企業(yè)精準(zhǔn)優(yōu)化AI應(yīng)用

    在8月21日的最新動態(tài)中,OpenAI 宣布了一項革命性的新功能,正式向企業(yè)用戶開放其頂尖AI模型GPT-4o的定制能力。這一舉措標(biāo)志著OpenAI在激烈的企業(yè)級AI應(yīng)用市場中邁出了重
    的頭像 發(fā)表于 08-21 16:06 ?749次閱讀

    OpenAI提前解鎖GPT-4o語音模式,引領(lǐng)對話新紀(jì)元

    OpenAI近日宣布了一項令人振奮的消息:即日起,部分ChatGPT Plus用戶將率先體驗到GPT-4o的語音模式,這一創(chuàng)新功能標(biāo)志著自然語言處理與人工智能交互技術(shù)邁出了重要一步。GPT-4
    的頭像 發(fā)表于 08-01 18:24 ?1493次閱讀

    OpenAI向部分用戶推出GPT-4o語音模式產(chǎn)品

    近日,美國著名人工智能研發(fā)機(jī)構(gòu)OpenAI正式宣布,自本周二(2022年7月30日)起,面向部分ChatGPT Plus用戶推出嶄新的GPT-4o語音模式產(chǎn)品。   據(jù)OpenAI詳細(xì)闡述
    的頭像 發(fā)表于 07-31 14:53 ?914次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82%, 在LMSYS排行榜上的聊天偏好測試中表現(xiàn)優(yōu)于
    的頭像 發(fā)表于 07-21 10:20 ?1665次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4o</b> mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜

    OpenAI發(fā)布高性價比小型AI模型GPT-4o mini

    在人工智能領(lǐng)域持續(xù)創(chuàng)新的OpenAI,近日推出了其最新力作——“GPT-4o mini”,一款旨在以親民價格提供強(qiáng)大功能的小型聊天機(jī)器人。這款產(chǎn)品的問世,標(biāo)志著OpenAI在推動人工智能普及與多模態(tài)融合方面邁出了重要一步。
    的頭像 發(fā)表于 07-19 15:27 ?974次閱讀

    OpenAI發(fā)布最新人工智能模型——GPT-4o mini

    據(jù)國際媒體報道,OpenAI 在周四震撼發(fā)布了其最新的人工智能模型——GPT-4o mini,此舉標(biāo)志著這家領(lǐng)先的AI初創(chuàng)公司在拓寬其廣受歡迎的聊天機(jī)器人應(yīng)用領(lǐng)域方面邁出了重要一步。
    的頭像 發(fā)表于 07-19 15:24 ?1539次閱讀