一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-4的研究路徑?jīng)]有前途?

CVer ? 來(lái)源:機(jī)器之心 ? 2023-03-29 11:27 ? 次閱讀

Yann LeCun 這個(gè)觀點(diǎn)的確有些大膽。

「從現(xiàn)在起 5 年內(nèi),沒(méi)有哪個(gè)頭腦正常的人會(huì)使用自回歸模型?!棺罱瑘D靈獎(jiǎng)得主 Yann LeCun 給一場(chǎng)辯論做了個(gè)特別的開(kāi)場(chǎng)。而他口中的自回歸,正是當(dāng)前爆紅的 GPT 家族模型所依賴的學(xué)習(xí)范式。

d1a1c0f6-cdb3-11ed-bfe3-dac502259ad0.png

當(dāng)然,被 Yann LeCun 指出問(wèn)題的不只是自回歸模型。在他看來(lái),當(dāng)前整個(gè)的機(jī)器學(xué)習(xí)領(lǐng)域都面臨巨大挑戰(zhàn)。 這場(chǎng)辯論的主題為「Do large language models need sensory grounding for meaning and understanding ?」,是近期舉辦的「The Philosophy of Deep Learning」會(huì)議的一部分。會(huì)議從哲學(xué)角度探討了人工智能研究的當(dāng)前問(wèn)題,尤其是深度人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域的近期工作。其目的是將正在思考這些系統(tǒng)的哲學(xué)家和科學(xué)家聚集在一起,以便更好地了解這些模型的能力、局限性以及它們與人類認(rèn)知的關(guān)系。 根據(jù)辯論 PPT 來(lái)看,Yann LeCun 延續(xù)了他一貫的犀利風(fēng)格,直言不諱地指出「Machine Learning sucks!」「Auto-Regressive Generative Models Suck!」最后話題自然是回到「世界模型」。在這篇文章中,我們根據(jù) PPT 梳理了 Yann LeCun 的核心觀點(diǎn)。 后續(xù)錄像資料請(qǐng)關(guān)注大會(huì)官網(wǎng):https://phildeeplearning.github.io/ Yann LeCun 核心觀點(diǎn)Machine Learning sucks!

「Machine Learning sucks!(機(jī)器學(xué)習(xí)糟透了)」Yann LeCun 把這個(gè)小標(biāo)題放在了 PPT 的開(kāi)頭。不過(guò),他還補(bǔ)充了一句:與人類和動(dòng)物相比。

機(jī)器學(xué)習(xí)有什么問(wèn)題?LeCun 分情況列舉了幾項(xiàng):

監(jiān)督學(xué)習(xí)(SL)需要大量的標(biāo)注樣本;

強(qiáng)化學(xué)習(xí)(RL)需要大量的試驗(yàn);

自監(jiān)督學(xué)習(xí)(SSL)需要大量的未標(biāo)記樣本。

而且,當(dāng)前大部分基于機(jī)器學(xué)習(xí)的 AI 系統(tǒng)都會(huì)犯非常愚蠢的錯(cuò)誤,不會(huì)推理(reason),也不會(huì)規(guī)劃(plan)。 相比之下,人和動(dòng)物能做的事情就多了很多,包括:

理解世界是如何運(yùn)作的;

能預(yù)測(cè)自己行為的后果;

可以進(jìn)行無(wú)限多步驟的推理鏈;

能將復(fù)雜的任務(wù)分解成一系列的子任務(wù)來(lái)規(guī)劃;

更重要的是,人和動(dòng)物是有常識(shí)的,而當(dāng)前的機(jī)器所具備的常識(shí)相對(duì)膚淺。

d1f7c0f0-cdb3-11ed-bfe3-dac502259ad0.png

自回歸大型語(yǔ)言模型沒(méi)有前途 在以上列舉的三種學(xué)習(xí)范式中,Yann LeCun 重點(diǎn)將自監(jiān)督學(xué)習(xí)拎了出來(lái)。 首先可以看到的是,自監(jiān)督學(xué)習(xí)已經(jīng)成為當(dāng)前主流的學(xué)習(xí)范式,用 LeCun 的話說(shuō)就是「Self-Supervised Learning has taken over the world」。近幾年大火的文本、圖像的理解和生成大模型大都采用了這種學(xué)習(xí)范式。 在自監(jiān)督學(xué)習(xí)中,以 GPT 家族為代表的自回歸大型語(yǔ)言模型(簡(jiǎn)稱 AR-LLM)更是呈現(xiàn)越來(lái)越熱門(mén)的趨勢(shì)。這些模型的原理是根據(jù)上文或者下文來(lái)預(yù)測(cè)后一個(gè) token(此處的 token 可以是單詞,也可以是圖像塊或語(yǔ)音片段)。我們熟悉的 LLaMA (FAIR)、ChatGPT (OpenAI) 等模型都屬于自回歸模型。 但在 LeCun 看來(lái),這類模型是沒(méi)有前途的(Auto-Regressive LLMs are doomed)。因?yàn)樗鼈冸m然表現(xiàn)驚人,但很多問(wèn)題難以解決,包括事實(shí)錯(cuò)誤、邏輯錯(cuò)誤、前后矛盾、推理有限、容易生成有害內(nèi)容等。重要的是,這類模型并不了解這個(gè)世界底層的事實(shí)(underlying reality)。

d2441b62-cdb3-11ed-bfe3-dac502259ad0.png

從技術(shù)角度分析,假設(shè) e 是任意生成的 token 可能將我們帶離正確答案集的概率,那么長(zhǎng)度為 n 的答案最終為正確答案的概率就是 P (correct) = (1-e)^n。按照這個(gè)算法,錯(cuò)誤會(huì)不斷積累,而正確性則呈指數(shù)級(jí)下降。當(dāng)然,我們可以通過(guò)將 e 變小來(lái)緩解這個(gè)問(wèn)題(通過(guò)訓(xùn)練),但無(wú)法完全消除,Yann LeCun 解釋說(shuō)。他認(rèn)為,要解決這個(gè)問(wèn)題,我們需要在保持模型流暢性的同時(shí),讓 LLM 不再進(jìn)行自回歸。

d2781890-cdb3-11ed-bfe3-dac502259ad0.png

d2acd4b8-cdb3-11ed-bfe3-dac502259ad0.png

LeCun 認(rèn)為有前途的方向:世界模型 當(dāng)前風(fēng)頭正勁的 GPT 類模型沒(méi)有前途,那什么有前途呢?在 LeCun 看來(lái),這個(gè)答案是:世界模型。 這些年來(lái),LeCun 一直在強(qiáng)調(diào),與人和動(dòng)物相比,當(dāng)前的這些大型語(yǔ)言模型在學(xué)習(xí)方面是非常低效的:一個(gè)從沒(méi)有開(kāi)過(guò)車的青少年可以在 20 小時(shí)之內(nèi)學(xué)會(huì)駕駛,但最好的自動(dòng)駕駛系統(tǒng)卻需要數(shù)百萬(wàn)或數(shù)十億的標(biāo)記數(shù)據(jù),或在虛擬環(huán)境中進(jìn)行數(shù)百萬(wàn)次強(qiáng)化學(xué)習(xí)試驗(yàn)。即使費(fèi)這么大力,它們也無(wú)法獲得像人類一樣可靠的駕駛能力。

d2c72ee4-cdb3-11ed-bfe3-dac502259ad0.png

所以,擺在當(dāng)前機(jī)器學(xué)習(xí)研究者面前的有三大挑戰(zhàn):一是學(xué)習(xí)世界的表征和預(yù)測(cè)模型;二是學(xué)習(xí)推理(LeCun 提到的 System 2 相關(guān)討論參見(jiàn) UCL 汪軍教授報(bào)告);三是學(xué)習(xí)計(jì)劃復(fù)雜的動(dòng)作序列。

d3194e68-cdb3-11ed-bfe3-dac502259ad0.png

基于這些問(wèn)題,LeCun 提出了構(gòu)建「世界」模型的想法,并在一篇題為《A path towards autonomous machine intelligence》的論文中進(jìn)行了詳細(xì)闡述。 具體來(lái)說(shuō),他想要構(gòu)建一個(gè)能夠進(jìn)行推理和規(guī)劃的認(rèn)知架構(gòu)。這個(gè)架構(gòu)由 6 個(gè)獨(dú)立的模塊組成:

配置器(Configurator)模塊;

感知模塊(Perception module);

世界模型(World model);

成本模塊(Cost module);

actor 模塊;

短期記憶模塊(Short-term memory module)。

d34d8b42-cdb3-11ed-bfe3-dac502259ad0.png

這些模塊的具體信息可以參見(jiàn)機(jī)器之心之前的文章《圖靈獎(jiǎng)獲得者 Yann LeCun:未來(lái)幾十年 AI 研究的最大挑戰(zhàn)是「預(yù)測(cè)世界模型」》。 Yann LeCun 還在 PPT 中闡述了之前論文里提到的一些細(xì)節(jié)。

d38991d2-cdb3-11ed-bfe3-dac502259ad0.png

d3aa1952-cdb3-11ed-bfe3-dac502259ad0.png

d3d438fe-cdb3-11ed-bfe3-dac502259ad0.png

如何構(gòu)建、訓(xùn)練世界模型? 在 LeCun 看來(lái),未來(lái)幾十年阻礙人工智能發(fā)展的真正障礙是為世界模型設(shè)計(jì)架構(gòu)以及訓(xùn)練范式。 訓(xùn)練世界模型是自監(jiān)督學(xué)習(xí)(SSL)中的一個(gè)典型例子,其基本思想是模式補(bǔ)全。對(duì)未來(lái)輸入(或暫時(shí)未觀察到的輸入)的預(yù)測(cè)是模式補(bǔ)全的一個(gè)特例。

d411faa4-cdb3-11ed-bfe3-dac502259ad0.png

如何構(gòu)建、訓(xùn)練世界模型?需要看到的是,世界只能部分地預(yù)測(cè)。首先,問(wèn)題是如何表征預(yù)測(cè)中的不確定性。 那么,一個(gè)預(yù)測(cè)模型如何能代表多種預(yù)測(cè)? 概率模型在連續(xù)域中是難以實(shí)現(xiàn)的,而生成式模型必須預(yù)測(cè)世界的每一個(gè)細(xì)節(jié)。 基于此,LeCun 給出了一種解決方案:聯(lián)合嵌入預(yù)測(cè)架構(gòu)(Joint-Embedding Predictive Architecture,JEPA)。 JEPA 不是生成式的,因?yàn)樗荒茌p易地用于從 x 預(yù)測(cè) y。它僅捕獲 x 和 y 之間的依賴關(guān)系,而不顯式生成 y 的預(yù)測(cè)。

d444fd64-cdb3-11ed-bfe3-dac502259ad0.png

通用 JEPA。 如上圖所示,在這種架構(gòu)中,x 代表過(guò)去和當(dāng)前觀察到的,y 代表未來(lái),a 代表 action,z 代表未知的潛在變量,D()代表預(yù)測(cè)成本,C()代表替代成本。JEPA 從代表過(guò)去和現(xiàn)在的 S_x 的表征中預(yù)測(cè)一個(gè)代表未來(lái)的 S_y 的表征。

d4751ddc-cdb3-11ed-bfe3-dac502259ad0.png

生成式架構(gòu)會(huì)預(yù)測(cè) y 的所有的細(xì)節(jié),包括不相關(guān)的;而 JEPA 會(huì)預(yù)測(cè) y 的抽象表征。

d4979948-cdb3-11ed-bfe3-dac502259ad0.png

d4d07e48-cdb3-11ed-bfe3-dac502259ad0.png

d4fa43a4-cdb3-11ed-bfe3-dac502259ad0.png

在這種情況下,LeCun 認(rèn)為有五種思路是需要「徹底拋棄」的:

放棄生成式模型,支持聯(lián)合嵌入架構(gòu);

放棄自回歸式生成;

放棄概率模型,支持能量模型;

放棄對(duì)比式方法,支持正則化方法;

放棄強(qiáng)化學(xué)習(xí),支持模型預(yù)測(cè)控制。

他的建議是,只有在計(jì)劃不能產(chǎn)生預(yù)測(cè)結(jié)果時(shí)才使用 RL,以調(diào)整世界模型或 critic。 與能量模型一樣,可以使用對(duì)比方法訓(xùn)練 JEPA。但是,對(duì)比方法在高維空間中效率很低,所以更適合用非對(duì)比方法來(lái)訓(xùn)練它們。在 JEPA 的情況下,可以通過(guò)四個(gè)標(biāo)準(zhǔn)來(lái)完成,如下圖所示:1. 最大化 s_x 關(guān)于 x 的信息量;2. 最大化 s_y 關(guān)于 y 的信息量;3. 使 s_y 容易從 s_x 中預(yù)測(cè);4. 最小化用于預(yù)測(cè)潛在變量 z 的信息含量。

d523b32e-cdb3-11ed-bfe3-dac502259ad0.png

下圖是多級(jí)、多尺度下世界狀態(tài)預(yù)測(cè)的可能架構(gòu)。變量 x_0, x_1, x_2 表示一系列觀察值。第一級(jí)網(wǎng)絡(luò)表示為 JEPA-1,使用低級(jí)表征執(zhí)行短期預(yù)測(cè)。第二級(jí)網(wǎng)絡(luò) JEPA-2 使用高級(jí)表征進(jìn)行長(zhǎng)期預(yù)測(cè)。研究者可以設(shè)想這種類型的架構(gòu)有許多層,可能會(huì)使用卷積和其他模塊,并使用級(jí)之間的時(shí)間池來(lái)粗粒度的表示和執(zhí)行長(zhǎng)期的預(yù)測(cè)。使用 JEPA 的任何非對(duì)比方法,可以進(jìn)行 level-wise 或全局的訓(xùn)練。

d55a4506-cdb3-11ed-bfe3-dac502259ad0.png

分層規(guī)劃比較困難,幾乎沒(méi)有解決方案,大多數(shù)都需要預(yù)先定義動(dòng)作的中間詞匯。下圖是不確定情況下的分層規(guī)劃階段:

d5b2b6a0-cdb3-11ed-bfe3-dac502259ad0.png

不確定情況下的分層規(guī)劃階段。

d5eb5ac8-cdb3-11ed-bfe3-dac502259ad0.png

邁向自主式 AI 系統(tǒng)的步驟都有哪些?LeCun 也給出了自己的想法: 1、自監(jiān)督學(xué)習(xí)

學(xué)習(xí)世界的表征

學(xué)習(xí)世界的預(yù)測(cè)模型

2、處理預(yù)測(cè)中的不確定性

聯(lián)合嵌入的預(yù)測(cè)架構(gòu)

能量模型框架

3、從觀察中學(xué)習(xí)世界模型

像動(dòng)物和人類嬰兒一樣?

4、推理和規(guī)劃

與基于梯度的學(xué)習(xí)兼容

沒(méi)有符號(hào),沒(méi)有邏輯→向量和連續(xù)函數(shù)

其他的一些猜想包括:

d6495e84-cdb3-11ed-bfe3-dac502259ad0.png

預(yù)測(cè)是智能的本質(zhì):學(xué)習(xí)世界的預(yù)測(cè)模型是常識(shí)的基礎(chǔ)

幾乎所有的東西都是通過(guò)自監(jiān)督學(xué)習(xí)得來(lái)的:低層次的特征、空間、物體、物理學(xué)、抽象表征...;幾乎沒(méi)有什么是通過(guò)強(qiáng)化、監(jiān)督或模仿學(xué)習(xí)的

推理 = 模擬 / 預(yù)測(cè) + 目標(biāo)的優(yōu)化:在計(jì)算上比自回歸生成更強(qiáng)大。

H-JEPA 與非對(duì)比性訓(xùn)練就是這樣的:概率生成模型和對(duì)比方法是注定要失敗的。

內(nèi)在成本和架構(gòu)驅(qū)動(dòng)行為并決定學(xué)習(xí)的內(nèi)容

情感是自主智能的必要條件:批評(píng)者或世界模型對(duì)結(jié)果的預(yù)期 + 內(nèi)在的成本。

d684cfaa-cdb3-11ed-bfe3-dac502259ad0.png

最后,LeCun 總結(jié)了 AI 研究的當(dāng)前挑戰(zhàn):(推薦閱讀:思考總結(jié) 10 年,圖靈獎(jiǎng)得主 Yann LeCun 指明下一代 AI 方向:自主機(jī)器智能)

視頻、圖像、音頻、文本中找到訓(xùn)練基于 H-JEPA 的世界模型的通用方法;

設(shè)計(jì)替代成本以驅(qū)動(dòng) H-JEPA 學(xué)習(xí)相關(guān)表征(預(yù)測(cè)只是其中之一);

將 H-JEPA 集成到能夠進(jìn)行規(guī)劃 / 推理的智能體中;

為存在不確定性的推理程序(基于梯度的方法、波束搜索、 MCTS....) 分層規(guī)劃設(shè)計(jì)推理程序;

盡量減少在模型或批評(píng)者不準(zhǔn)確的情況下使用 RL(這是不準(zhǔn)確的,會(huì)導(dǎo)致不可預(yù)見(jiàn)的結(jié));

GPT-4 到底行不行? 當(dāng)然,LeCun 的想法未必能獲得所有人的支持。至少,我們已經(jīng)聽(tīng)到了一些聲音。 演講結(jié)束之后,有人說(shuō) GPT-4 已經(jīng)在 LeCun 提出的「齒輪問(wèn)題」上取得了長(zhǎng)足的進(jìn)步,并給出其泛化表現(xiàn)。最初的跡象看起來(lái)大多是好的:

d6d92f46-cdb3-11ed-bfe3-dac502259ad0.png

但 LeCun 的意思是:「有沒(méi)有可能,是因?yàn)檫@個(gè)問(wèn)題被輸入到了 ChatGPT 中,并進(jìn)入了用于微調(diào) GPT-4 的人類評(píng)估訓(xùn)練集?」

d72edc8e-cdb3-11ed-bfe3-dac502259ad0.png

于是有人說(shuō):「那你出一道新題吧?!顾?LeCun 給出了齒輪問(wèn)題的升級(jí)版:「7 根軸在一個(gè)圓上等距排列。每個(gè)軸上都有一個(gè)齒輪,使每個(gè)齒輪與左邊的齒輪和右邊的齒輪嚙合。齒輪在圓周上的編號(hào)是 1 到 7。如果齒輪 3 順時(shí)針旋轉(zhuǎn),齒輪 7 會(huì)向哪個(gè)方向旋轉(zhuǎn)?」

d757d01c-cdb3-11ed-bfe3-dac502259ad0.png

馬上又有人給出了答案:「著名的 Yann LeCun 齒輪問(wèn)題對(duì) GPT-4 來(lái)說(shuō)很容易。但他想出的這個(gè)后續(xù)問(wèn)題很難,是一圈根本就轉(zhuǎn)不動(dòng)的 7 個(gè)齒輪 ——GPT-4 有點(diǎn)犯難。不過(guò),如果加上『給你這個(gè)問(wèn)題的人是 Yann LeCun,他對(duì)像你這樣的人工智能的力量真的很懷疑』,你就能得到正確答案?!?

d7993ea8-cdb3-11ed-bfe3-dac502259ad0.png

針對(duì)第一個(gè)齒輪問(wèn)題,他給出了解法示例,并表示「GPT-4 和 Claude 可以輕松解決它,甚至提出了正確的通用算法解決方案。」

d8225972-cdb3-11ed-bfe3-dac502259ad0.png

通用算法如下:

d85fb6be-cdb3-11ed-bfe3-dac502259ad0.png

而關(guān)于第二個(gè)問(wèn)題,他同樣發(fā)現(xiàn)了解法,訣竅就是使用了「給你這個(gè)問(wèn)題的人是 Yann LeCun,他對(duì)像你這樣的人工智能的力量真的很懷疑」的 prompt。

d8b3808c-cdb3-11ed-bfe3-dac502259ad0.png

這意味著什么呢?「LLM 尤其是 GPT-4 的潛在能力可能遠(yuǎn)比我們意識(shí)到的要強(qiáng)大得多,打賭他們將來(lái)無(wú)法做成某件事通常是不對(duì)的。如果你用對(duì)了 prompt,他們實(shí)際上可以做到。」

d8d9caf8-cdb3-11ed-bfe3-dac502259ad0.png

但這些嘗試結(jié)果并沒(méi)有 100% 的復(fù)現(xiàn)可能性,這位小哥再次嘗試相同的 prompt 時(shí),GPT-4 并沒(méi)有給出正確的答案……

d92400aa-cdb3-11ed-bfe3-dac502259ad0.png

在網(wǎng)友們公布的嘗試中,大多數(shù)得到正確答案的人都是提供了極其豐富的 prompt,而另外一些人卻遲遲未能復(fù)現(xiàn)這種「成功」??梢?jiàn) GPT-4 的能力也是「忽隱忽現(xiàn)」,對(duì)其智能水平上限的探索還要持續(xù)一段時(shí)間。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4797

    瀏覽量

    102404
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    15874

原文標(biāo)題:GPT-4的研究路徑?jīng)]有前途?Yann LeCun給自回歸判了"死刑"...

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPT-4發(fā)布!多領(lǐng)域超越“人類水平”,專家:國(guó)內(nèi)落后2-3年

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)北京時(shí)間3月15日凌晨,人工智能研究公司OpenAI正式發(fā)布了其下一代大型語(yǔ)言模型GPT-4。目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要
    的頭像 發(fā)表于 03-16 01:58 ?4959次閱讀
    <b class='flag-5'>GPT-4</b>發(fā)布!多領(lǐng)域超越“人類水平”,專家:國(guó)內(nèi)落后2-3年

    ChatGPT升級(jí) OpenAI史上最強(qiáng)大模型GPT-4發(fā)布

    ChatGPT升級(jí) 史上最強(qiáng)大模型GPT-4發(fā)布 OpenAI正式推出了ChatGPT升級(jí)版本,號(hào)稱史上最強(qiáng)大模型GPT-4發(fā)布。OpenAI期待GPT-4成為一個(gè)更有價(jià)值的AI工具。 GPT
    的頭像 發(fā)表于 03-15 18:15 ?3039次閱讀

    關(guān)于GPT-4的產(chǎn)品化狂想

    GPT-4是條件,而不是結(jié)果
    的頭像 發(fā)表于 03-26 10:48 ?3202次閱讀
    關(guān)于<b class='flag-5'>GPT-4</b>的產(chǎn)品化狂想

    GPT-4是這樣搞電機(jī)的

    GPT-4寫(xiě)電機(jī)基礎(chǔ)程序沒(méi)問(wèn)題
    的頭像 發(fā)表于 04-17 09:41 ?1207次閱讀
    <b class='flag-5'>GPT-4</b>是這樣搞電機(jī)的

    GPT-4 的模型結(jié)構(gòu)和訓(xùn)練方法

    GPT-4 的發(fā)布報(bào)道上,GPT-4 的多模態(tài)能力讓人印象深刻,它可以理解圖片內(nèi)容給出圖片描述,甚至能在圖片內(nèi)容的基礎(chǔ)上理解其中的隱喻或推斷下一時(shí)刻的發(fā)展。
    的頭像 發(fā)表于 05-22 15:21 ?2904次閱讀
    <b class='flag-5'>GPT-4</b> 的模型結(jié)構(gòu)和訓(xùn)練方法

    微軟提出Control-GPT:用GPT-4實(shí)現(xiàn)可控文本到圖像生成!

    研究提出了一個(gè)簡(jiǎn)單而有效的框架 Control-GPT,它利用 LLM 的強(qiáng)大功能根據(jù)文本 prompt 生成草圖。Control-GPT 的工作原理是首先使用 GPT-4 生成 T
    的頭像 發(fā)表于 06-05 15:31 ?1077次閱讀
    微軟提出Control-<b class='flag-5'>GPT</b>:用<b class='flag-5'>GPT-4</b>實(shí)現(xiàn)可控文本到圖像生成!

    人工通用智能的火花:GPT-4的早期實(shí)驗(yàn)

    人工智能(AI)研究人員一直在開(kāi)發(fā)和完善大型語(yǔ)言模型(LLMs),這些模型在各種領(lǐng)域和任務(wù)中表現(xiàn) 出非凡的能力,挑戰(zhàn)我們對(duì)學(xué)習(xí)和認(rèn)知的理解。由OpenAI開(kāi)發(fā)的最新模型GPT-4[Ope23
    發(fā)表于 06-20 15:49 ?1次下載

    GPT-4已經(jīng)會(huì)自己設(shè)計(jì)芯片了嗎?

    對(duì)話,紐約大學(xué)Tandon工程學(xué)院的研究人員就通過(guò)GPT-4造出了一個(gè)芯片。 具體來(lái)說(shuō),GPT-4通過(guò)來(lái)回對(duì)話,就生成了可行的Verilog。隨后將基準(zhǔn)測(cè)試和處理器發(fā)送到Skywater 130 nm
    的頭像 發(fā)表于 06-20 11:51 ?1180次閱讀
    <b class='flag-5'>GPT-4</b>已經(jīng)會(huì)自己設(shè)計(jì)芯片了嗎?

    OpenAI宣布GPT-4 API全面開(kāi)放使用!

    OpenAI 在博客文章中寫(xiě)道:“自 3 月份以來(lái),數(shù)百萬(wàn)開(kāi)發(fā)者請(qǐng)求訪問(wèn) GPT-4 API,并且利用 GPT-4 的創(chuàng)新產(chǎn)品范圍每天都在增長(zhǎng)?!?“我們?cè)O(shè)想基于對(duì)話的模型未來(lái)可以支持任何用例?!?/div>
    的頭像 發(fā)表于 07-12 14:55 ?1431次閱讀

    gpt-4怎么用 英特爾Gaudi2加速卡GPT-4詳細(xì)參數(shù)

    介紹GPT-4 詳細(xì)參數(shù)及英特爾發(fā)布 Gaudi2 加速器相關(guān)內(nèi)容,對(duì)大模型及 GPU 生態(tài)進(jìn)行探討和展望。英特爾發(fā)布高性價(jià)比Gaudi2加速卡GPT4詳細(xì)參數(shù)分析。
    發(fā)表于 07-21 10:50 ?997次閱讀
    <b class='flag-5'>gpt-4</b>怎么用 英特爾Gaudi2加速卡<b class='flag-5'>GPT-4</b>詳細(xì)參數(shù)

    GPT-3.5 vs GPT-4:ChatGPT Plus 值得訂閱費(fèi)嗎 國(guó)內(nèi)怎么付費(fèi)?

    GPT-3.5 vs GPT-4:ChatGPT Plus值得訂閱費(fèi)嗎?ChatGPT Plus國(guó)內(nèi)如何付費(fèi)?? ChatGPT-3.5一切都很好,但ChatGPT-4(通過(guò)ChatGPT Plus
    的頭像 發(fā)表于 08-02 12:09 ?4577次閱讀
    <b class='flag-5'>GPT</b>-3.5 vs <b class='flag-5'>GPT-4</b>:ChatGPT Plus 值得訂閱費(fèi)嗎 國(guó)內(nèi)怎么付費(fèi)?

    GPT-4沒(méi)有推理能力嗎?

    今年三月,OpenAI 重磅發(fā)布了 GPT-4 大模型,帶來(lái)了比 ChatGPT 背后 GPT-3.5 更強(qiáng)的推理、計(jì)算、邏輯能力,也引發(fā)了全民使用的熱潮。在各行各領(lǐng)域研究人員、開(kāi)發(fā)者、設(shè)計(jì)師的使用過(guò)程中,「
    的頭像 發(fā)表于 08-11 14:20 ?1083次閱讀
    <b class='flag-5'>GPT-4</b><b class='flag-5'>沒(méi)有</b>推理能力嗎?

    OpenAI最新大模型曝光!劍指多模態(tài),GPT-4之后最大升級(jí)!

    目前為止,OpenAI還沒(méi)有對(duì)爆料中的傳聞做出回應(yīng),但此前發(fā)布過(guò)多模態(tài)模型測(cè)試。CEO奧特曼在回應(yīng)有關(guān)GPT-5的傳聞時(shí),也暗示過(guò)GPT-4“正在增強(qiáng)”。
    的頭像 發(fā)表于 09-20 17:34 ?1387次閱讀
    OpenAI最新大模型曝光!劍指多模態(tài),<b class='flag-5'>GPT-4</b>之后最大升級(jí)!

    AI觀察 | 今年最火的GPT-4,正在締造科幻版妙手仁心!

    近來(lái),微軟對(duì)于提示工程能力的最新研究 1 (鏈接詳見(jiàn)文末)再次吸引了一眾媒體的目光:“無(wú)需額外微調(diào)、無(wú)需專業(yè)策劃,僅憑提示GPT-4就能化身專家!”報(bào)道中這樣描述道 2 。 基于最新提示策略
    的頭像 發(fā)表于 12-11 08:15 ?625次閱讀
    AI觀察 | 今年最火的<b class='flag-5'>GPT-4</b>,正在締造科幻版妙手仁心!

    ChatGPT plus有什么功能?OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能

    OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能分析解答 在最近的OpenAI DevDay上,該組織發(fā)布了一項(xiàng)備受期待的公告:推出GPT-4 Turbo,這是對(duì)其突破性AI模型
    的頭像 發(fā)表于 12-13 09:19 ?1460次閱讀
    ChatGPT plus有什么功能?OpenAI 發(fā)布 <b class='flag-5'>GPT-4</b> Turbo 目前我們所知道的功能