一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員提出了一種全新的語(yǔ)言模型推理框架——「思維樹」(ToT)

AI智勝未來 ? 來源:新智元 ? 2023-05-24 11:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】由普林斯頓和谷歌DeepMind聯(lián)合提出的全新「思維樹」框架,讓GPT-4可以自己提案、評(píng)估和決策,推理能力最高可提升1750%。

2022年,前谷歌大腦華人科學(xué)家Jason Wei在一篇思維鏈的開山之作中首次提出,CoT可以增強(qiáng)LLM的推理能力。

但即便有了思維鏈,LLM有時(shí)也會(huì)在非常簡(jiǎn)單的問題上犯錯(cuò)。

最近,來自普林斯頓大學(xué)和Google DeepMind研究人員提出了一種全新的語(yǔ)言模型推理框架——「思維樹」(ToT)。

ToT將當(dāng)前流行的「思維鏈」方法泛化到引導(dǎo)語(yǔ)言模型,并通過探索文本(思維)的連貫單元來解決問題的中間步驟。

e39de16a-f967-11ed-90ce-dac502259ad0.png

論文地址:https://arxiv.org/abs/2305.10601

項(xiàng)目地址:https://github.com/kyegomez/tree-of-thoughts

簡(jiǎn)單來說,「思維樹」可以讓LLM:

· 自己給出多條不同的推理路徑

· 分別進(jìn)行評(píng)估后,決定下一步的行動(dòng)方案

· 在必要時(shí)向前或向后追溯,以便實(shí)現(xiàn)進(jìn)行全局的決策

論文實(shí)驗(yàn)結(jié)果顯示,ToT顯著提高了LLM在三個(gè)新任務(wù)(24點(diǎn)游戲,創(chuàng)意寫作,迷你填字游戲)中的問題解決能力。

比如,在24點(diǎn)游戲中,GPT-4只解決了4%的任務(wù),但ToT方法的成功率達(dá)到了74%。

讓LLM「反復(fù)思考」

用于生成文本的大語(yǔ)言模型GPT、PaLM,現(xiàn)已經(jīng)證明能夠執(zhí)行各種廣泛的任務(wù)。

所有這些模型取得進(jìn)步的基礎(chǔ)仍是最初用于生成文本的「自回歸機(jī)制」,以從左到右的方式一個(gè)接一個(gè)地進(jìn)行token級(jí)的決策。

e3b089e6-f967-11ed-90ce-dac502259ad0.png

那么,這樣一個(gè)簡(jiǎn)單的機(jī)制能否足以建立一個(gè)通向「解決通用問題的語(yǔ)言模型」?如果不是,哪些問題會(huì)挑戰(zhàn)當(dāng)前的范式,真正的替代機(jī)制應(yīng)該是什么?

恰恰關(guān)于「人類認(rèn)知」的文獻(xiàn)為這個(gè)問題提供了一些線索。

「雙重過程」模型的研究表明,人類有兩種決策模式:快速、自動(dòng)、無意識(shí)模式——「系統(tǒng)1」和緩慢、深思熟慮、有意識(shí)模式——「系統(tǒng)2」。

e3b78e62-f967-11ed-90ce-dac502259ad0.png

語(yǔ)言模型簡(jiǎn)單關(guān)聯(lián)token級(jí)選擇可以讓人聯(lián)想到「系統(tǒng)1」,因此這種能力可能會(huì)從「系統(tǒng)2」規(guī)劃過程中增強(qiáng)。

「系統(tǒng)1」可以讓LLM保持和探索當(dāng)前選擇的多種替代方案,而不僅僅是選擇一個(gè),而「系統(tǒng)2」評(píng)估其當(dāng)前狀態(tài),并積極地預(yù)見、回溯以做出更全局的決策。

e3c185f2-f967-11ed-90ce-dac502259ad0.png

為了設(shè)計(jì)這樣一個(gè)規(guī)劃過程,研究者便追溯到人工智能和認(rèn)知科學(xué)的起源,從科學(xué)家Newell、Shaw和Simon在20世紀(jì)50年代開始探索的規(guī)劃過程中汲取靈感。

Newell及其同事將問題解決描述為「通過組合問題空間進(jìn)行搜索」,表示為一棵樹。

一個(gè)真正的問題解決過程包括重復(fù)使用現(xiàn)有信息來探索,反過來,這將發(fā)現(xiàn)更多的信息,直到最終找到解決方法。

e3c85d8c-f967-11ed-90ce-dac502259ad0.png

這個(gè)觀點(diǎn)突出了現(xiàn)有使用LLM解決通用問題方法的2個(gè)主要缺點(diǎn):

1. 局部來看,LLM沒有探索思維過程中的不同延續(xù)——樹的分支。

2. 總的來看,LLM不包含任何類型的計(jì)劃、前瞻或回溯,來幫助評(píng)估這些不同的選擇。

為了解決這些問題,研究者提出了用語(yǔ)言模型解決通用問題的思維樹框架(ToT),讓LLM可以探索多種思維推理路徑。

ToT四步法

當(dāng)前,現(xiàn)有的方法,如IO、CoT、CoT-SC,通過采樣連續(xù)的語(yǔ)言序列進(jìn)行問題解決。

而ToT主動(dòng)維護(hù)了一個(gè)「思維樹」。每個(gè)矩形框代表一個(gè)思維,并且每個(gè)思維都是一個(gè)連貫的語(yǔ)言序列,作為解決問題的中間步驟。

e3df2fee-f967-11ed-90ce-dac502259ad0.png

ToT將任何問題定義為在樹上進(jìn)行搜索,其中每個(gè)節(jié)點(diǎn)都是一個(gè)狀態(tài)

e3e766b4-f967-11ed-90ce-dac502259ad0.png

,表示到目前為止輸入和思維序列的部分解。

ToT執(zhí)行一個(gè)具體任務(wù)時(shí)需要回答4個(gè)問題: 如何將中間過程分解為思維步驟;如何從每個(gè)狀態(tài)生成潛在的想法;如何啟發(fā)性地評(píng)估狀態(tài);使用什么搜索算法。1. 思維分解CoT在沒有明確分解的情況下連貫抽樣思維,而ToT利用問題的屬性來設(shè)計(jì)和分解中間的思維步驟。 根據(jù)不同的問題,一個(gè)想法可以是幾個(gè)單詞(填字游戲) ,一條方程式(24點(diǎn)) ,或者一整段寫作計(jì)劃(創(chuàng)意寫作)。 一般來說,一個(gè)想法應(yīng)該足夠「小」,以便LLM能夠產(chǎn)生有意義、多樣化的樣本。比如,生成一本完整的書通常太「大」而無法連貫 。 但一個(gè)想法也應(yīng)該「大」,足以讓LLM能夠評(píng)估其解決問題的前景。例如,生成一個(gè)token通常太「小」而無法評(píng)估。2.思維生成器e3ebfaee-f967-11ed-90ce-dac502259ad0.png

給定樹狀態(tài)

e3f1bec0-f967-11ed-90ce-dac502259ad0.png

,通過2種策略來為下一個(gè)思維步驟生成k個(gè)候選者。

(a)從一個(gè)CoT提示采樣e3f92962-f967-11ed-90ce-dac502259ad0.png思維:

e3ff652a-f967-11ed-90ce-dac502259ad0.png

e4082c6e-f967-11ed-90ce-dac502259ad0.png

在思維空間豐富(比如每個(gè)想法都是一個(gè)段落),并且e40e1584-f967-11ed-90ce-dac502259ad0.png導(dǎo)致多樣性時(shí),效果更好。

(b)使用「proposal prompt」按順序提出想法:

e412c156-f967-11ed-90ce-dac502259ad0.png

。這在思維空間受限制(比如每個(gè)思維只是一個(gè)詞或一行)時(shí)效果更好,因此在同一上下文中提出不同的想法可以避免重復(fù)。

3.狀態(tài)求值器e4188ee2-f967-11ed-90ce-dac502259ad0.png

給定不同狀態(tài)的前沿,狀態(tài)評(píng)估器評(píng)估它們解決問題的進(jìn)展,作為搜索算法的啟發(fā)式算法,以確定哪些狀態(tài)需要繼續(xù)探索,以及以何種順序探索。 雖然啟發(fā)式算法是解決搜索問題的標(biāo)準(zhǔn)方法,但它們通常是編程的(DeepBlue)或?qū)W習(xí)的(AlphaGo)。這里,研究者提出了第三種選擇,通過LLM有意識(shí)地推理狀態(tài)。 在適用的情況下,這種深思熟慮的啟發(fā)式方法可以比程序規(guī)則更靈活,比學(xué)習(xí)模型更有效率。與思維生成器,研究人員也考慮2種策略來獨(dú)立或一起評(píng)估狀態(tài):對(duì)每個(gè)狀態(tài)獨(dú)立賦值;跨狀態(tài)投票。4.搜索算法最后,在ToT框架中,人們可以根據(jù)樹的結(jié)構(gòu),即插即用不同的搜索算法。 研究人員在此探索了2個(gè)相對(duì)簡(jiǎn)單的搜索算法: 算法1——廣度優(yōu)先搜索(BFS),每一步維護(hù)一組b最有希望的狀態(tài)。 算法2——深度優(yōu)先搜索(DFS),首先探索最有希望的狀態(tài),直到達(dá)到最終的輸出e41eb6e6-f967-11ed-90ce-dac502259ad0.png,或者狀態(tài)評(píng)估器認(rèn)為不可能從當(dāng)前的e4238e3c-f967-11ed-90ce-dac502259ad0.png為閾值e42bfb08-f967-11ed-90ce-dac502259ad0.png解決問題。在這兩種情況下,DFS都會(huì)回溯到s的父狀態(tài)以繼續(xù)探索。

e439ba40-f967-11ed-90ce-dac502259ad0.png

由上,LLM通過自我評(píng)估和有意識(shí)的決策,來實(shí)現(xiàn)啟發(fā)式搜索的方法是新穎的。

實(shí)驗(yàn)

為此,團(tuán)隊(duì)提出了三個(gè)任務(wù)用于測(cè)試——即使是最先進(jìn)的語(yǔ)言模型GPT-4,在標(biāo)準(zhǔn)的IO提示或思維鏈(CoT)提示下,都是非常富有挑戰(zhàn)的。

e44ed74a-f967-11ed-90ce-dac502259ad0.png

24點(diǎn)(Game of 24)

24點(diǎn)是一個(gè)數(shù)學(xué)推理游戲,目標(biāo)是使用4個(gè)數(shù)字和基本算術(shù)運(yùn)算(+-*/)來得到24。

例如,給定輸入「4 9 10 13」,答案的輸出可能是「(10-4)*(13-9)=24」。

e4582b74-f967-11ed-90ce-dac502259ad0.png

ToT設(shè)置

團(tuán)隊(duì)將模型的思維過程分解為3個(gè)步驟,每個(gè)步驟都是一個(gè)中間方程。

如圖2(a)所示,在每個(gè)節(jié)點(diǎn)上,提取「左邊」的數(shù)字并提示LLM生成可能的下一步。(每一步給出的「提議提示」都相同)

其中,團(tuán)隊(duì)在ToT中進(jìn)行寬度優(yōu)先搜索(BFS),并在每一步都保留最好的b=5個(gè)候選項(xiàng)。

如圖2(b)所示,提示LLM評(píng)估每個(gè)思維候選項(xiàng)是「肯定/可能/不可能」達(dá)到24?;凇高^大/過小」的常識(shí)消除不可能的部分解決方案,保留剩下的「可能」項(xiàng)。

e45dedd4-f967-11ed-90ce-dac502259ad0.png

結(jié)果

如表2所示,IO,CoT和CoT-SC提示方法在任務(wù)上的表現(xiàn)不佳,成功率僅為7.3%,4.0%和9.0%。相比之下,ToT在廣度為b=1時(shí)已經(jīng)達(dá)到了45%的成功率,而在b=5時(shí)達(dá)到了74%。

團(tuán)隊(duì)還考慮了IO/CoT的預(yù)測(cè)設(shè)置,通過使用最佳的k個(gè)樣本(1≤k≤100)來計(jì)算成功率,并在圖3(a)中繪出5個(gè)成功率。

不出所料,CoT比IO擴(kuò)展得更好,最佳的100個(gè)CoT樣本達(dá)到了49%的成功率,但仍然比在ToT中探索更多節(jié)點(diǎn)(b>1)要差。

e4626dc8-f967-11ed-90ce-dac502259ad0.png

錯(cuò)誤分析

圖3(b)分析了CoT和ToT樣本在哪一步失敗了任務(wù),即思維(在CoT中)或所有b個(gè)思維(在ToT中)都是無效的或無法達(dá)到24。

值得注意的是,大約60%的CoT樣本在第一步就已經(jīng)失敗了,或者說,是前三個(gè)詞(例如「4+9」)。

創(chuàng)意寫作

接下來,團(tuán)隊(duì)設(shè)計(jì)了一個(gè)創(chuàng)意寫作任務(wù)。

其中,輸入是四個(gè)隨機(jī)句子,輸出應(yīng)該是一個(gè)連貫的段落,每段都以四個(gè)輸入句子分別結(jié)束。這樣的任務(wù)開放且富有探索性,挑戰(zhàn)創(chuàng)造性思維以及高級(jí)規(guī)劃。

值得注意的是,團(tuán)隊(duì)還在每個(gè)任務(wù)的隨機(jī)IO樣本上使用迭代-優(yōu)化(k≤5)方法,其中LLM基于輸入限制和最后生成的段落來判斷段落是否已經(jīng)「完全連貫」,如果不是,就生成一個(gè)優(yōu)化后的。

e4697f3c-f967-11ed-90ce-dac502259ad0.png

ToT設(shè)置

團(tuán)隊(duì)構(gòu)建了一個(gè)深度為2(只有1個(gè)中間思維步驟)的ToT。

LLM首先生成k=5的計(jì)劃并投票選擇最佳的一個(gè)(圖4),然后根據(jù)最佳計(jì)劃生成k=5的段落,然后投票選擇最佳的一個(gè)。

一個(gè)簡(jiǎn)單的zero-shot投票提示(「分析以下選擇,然后得出哪個(gè)最有可能實(shí)現(xiàn)指令」)被用來在兩個(gè)步驟中抽取5票。

e4710932-f967-11ed-90ce-dac502259ad0.png

結(jié)果

圖5(a)顯示了100個(gè)任務(wù)中的GPT-4平均分?jǐn)?shù),其中ToT(7.56)被認(rèn)為比IO(6.19)和CoT(6.93)平均生成更連貫的段落。

雖然這樣的自動(dòng)評(píng)測(cè)可能會(huì)有噪音,但圖5(b)通過顯示人類在100個(gè)段落對(duì)中有41個(gè)更喜歡ToT而只有21個(gè)更喜歡CoT(其他38對(duì)被認(rèn)為「同樣連貫」)來確認(rèn)這一發(fā)現(xiàn)。

最后,迭代優(yōu)化在這個(gè)自然語(yǔ)言任務(wù)上更有效——將IO連貫性分?jǐn)?shù)從6.19提高到7.67,將ToT連貫性分?jǐn)?shù)從7.56提高到7.91。

團(tuán)隊(duì)認(rèn)為它可以被看作是在ToT框架下生成思維的第三種方法,新的思維可以通過優(yōu)化舊的思維而產(chǎn)生,而不是i.i.d.或順序生成。

迷你填字游戲

在24點(diǎn)游戲和創(chuàng)意寫作中,ToT相對(duì)較淺——最多需要3個(gè)思維步驟就能完成輸出。

最后,團(tuán)隊(duì)決定通過5×5的迷你填字游戲,來設(shè)置一個(gè)更難的問題。

同樣,目標(biāo)不僅僅是解決任務(wù),而是研究LLM作為一個(gè)通用問題解決者的極限。通過窺視自己的思維,以有目的性的推理作為啟發(fā),來指導(dǎo)自己的探索。

e47c3fbe-f967-11ed-90ce-dac502259ad0.png

ToT設(shè)置

團(tuán)隊(duì)利用深度優(yōu)先搜索保持探索最有可能成功的后續(xù)單詞線索,直到狀態(tài)不再有希望,然后回溯到父狀態(tài)以探索替代的思維。

為了使搜索可行,后續(xù)的思維被限制不改變?nèi)魏我烟顚懙膯卧~或字母,這樣ToT最多有10個(gè)中間步驟。

對(duì)于思維生成,團(tuán)隊(duì)在每個(gè)狀態(tài)下將所有現(xiàn)有的思維(例如,「h2.motor; h1.tasks」對(duì)于圖6(a)中的狀態(tài))轉(zhuǎn)換為剩余線索的字母限制(例如,「v1.To heap: tm___;...」),從而得到下一個(gè)單詞填寫位置和內(nèi)容的候選。

重要的是,團(tuán)隊(duì)也提示LLM給出不同思維的置信度,并在提案中匯總這些以獲得下一個(gè)要探索的思維的排序列表(圖6(a))。

對(duì)于狀態(tài)評(píng)估,團(tuán)隊(duì)類似地將每個(gè)狀態(tài)轉(zhuǎn)換為剩余線索的字母限制,然后評(píng)估每個(gè)線索是否可能在給定限制下填寫。

如果任何剩余的線索被認(rèn)為是「不可能」的(例如,「v1. To heap: tm_s_」),那么該狀態(tài)的子樹的探索就被剪枝,并且DFS回溯到其父節(jié)點(diǎn)來探索下一個(gè)可能的候選。

e485b1a2-f967-11ed-90ce-dac502259ad0.png

結(jié)果

如表3所示,IO和CoT的提示方法在單詞級(jí)成功率上表現(xiàn)不佳,低于16%,而ToT顯著改善了所有指標(biāo),實(shí)現(xiàn)了60%的單詞級(jí)成功率,并解決了20個(gè)游戲中的4個(gè)。

鑒于IO和CoT缺乏嘗試不同線索、改變決策或回溯的機(jī)制,這種改善并不令人驚訝。

局限性與結(jié)論

ToT是一個(gè)讓LLM可以更自主、更智能地做決策和解決問題的框架。

它提高了模型決策的可解釋性以及與人類對(duì)齊的機(jī)會(huì),因?yàn)門oT所生成的表征表形式是可讀的、高級(jí)的語(yǔ)言推理,而不是隱式的、低級(jí)的token值。

對(duì)于那些GPT-4已經(jīng)十分擅長(zhǎng)的任務(wù)來說,ToT可能并是不必要的。

此外,像ToT這樣的搜索方法需要更多的資源(如GPT-4 API成本)來提高任務(wù)性能,但ToT的模塊化靈活性讓用戶可以自定義這種性能-成本平衡。

不過,隨著LLM被用于更多真實(shí)世界的決策應(yīng)用(如編程、數(shù)據(jù)分析、機(jī)器人技術(shù)等),ToT可以為研究那些即將出現(xiàn)的更為復(fù)雜的任務(wù),提供新的機(jī)會(huì)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10795
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16097
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    11584

原文標(biāo)題:GPT-4推理提升1750%!普林斯頓清華姚班校友提出全新「思維樹ToT」框架,讓LLM反復(fù)思考

文章出處:【微信號(hào):AI智勝未來,微信公眾號(hào):AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    無刷直流電機(jī)雙閉環(huán)串級(jí)控制系統(tǒng)仿真研究

    Madlab進(jìn)行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人員提出采用節(jié)點(diǎn)電流法對(duì)電機(jī)控制系統(tǒng)進(jìn)行分析,通過列寫m函數(shù),建立BLDC控制系統(tǒng)真模型,這種方法實(shí)質(zhì)
    發(fā)表于 07-07 18:36

    模型推理顯存和計(jì)算量估計(jì)方法研究

    (如全連接層、卷積層等)確定所需的顯存大??; (3)將各層顯存大小相加,得到模型總的顯存需求。 基于神經(jīng)網(wǎng)絡(luò)剪枝的顯存估計(jì) 神經(jīng)網(wǎng)絡(luò)剪枝是一種減少模型參數(shù)數(shù)量的技術(shù),可以降低顯存需求。通過剪枝,可以
    發(fā)表于 07-03 19:43

    研究人員開發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測(cè)瘧疾

    瘧疾曾度在委內(nèi)瑞拉銷聲匿跡,但如今正卷土重來。研究人員已經(jīng)訓(xùn)練出個(gè)模型來幫助檢測(cè)這種傳染病。
    的頭像 發(fā)表于 04-25 09:58 ?405次閱讀

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進(jìn)展,特別是自DeepSeekR1發(fā)布后興起的推理時(shí)間計(jì)算擴(kuò)展相關(guān)內(nèi)容。在LLM中實(shí)施和改進(jìn)推理簡(jiǎn)單來說,基于LLM的推理模型一種
    的頭像 發(fā)表于 04-03 12:09 ?509次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    中國(guó)電提出模型推理加速新范式Falcon

    的 Falcon 方法是一種 增強(qiáng)半自回歸投機(jī)解碼框架 ,旨在增強(qiáng) draft model 的并行性和輸出質(zhì)量,以有效提升大模型推理速度。Falcon 可以實(shí)現(xiàn)約 2.91-3.51
    的頭像 發(fā)表于 01-15 13:49 ?965次閱讀
    中國(guó)電<b class='flag-5'>提出</b>大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>加速新范式Falcon

    NaVILA:加州大學(xué)與英偉達(dá)聯(lián)合發(fā)布新型視覺語(yǔ)言模型

    日前,加州大學(xué)的研究人員攜手英偉達(dá),共同推出了款創(chuàng)新的視覺語(yǔ)言模型——NaVILA。該模型在機(jī)
    的頭像 發(fā)表于 12-13 10:51 ?686次閱讀

    復(fù)旦提出模型推理新思路:Two-Player架構(gòu)打破自我反思瓶頸

    在 AI 領(lǐng)域,近期的新聞焦點(diǎn)無疑是關(guān)于「Scaling Law 是否撞墻?」的辯論。這曾經(jīng)被視作大模型發(fā)展的第性原理,如今卻遭遇了挑戰(zhàn)。 ? 在這樣的背景下,研究人員開始意識(shí)到,
    的頭像 發(fā)表于 12-06 11:24 ?753次閱讀
    復(fù)旦<b class='flag-5'>提出</b>大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>新思路:Two-Player架構(gòu)打破自我反思瓶頸

    語(yǔ)言模型開發(fā)框架是什么

    語(yǔ)言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語(yǔ)言模型的軟件工具和庫(kù)。下面,AI部落小編為您介紹
    的頭像 發(fā)表于 12-06 10:28 ?528次閱讀

    基于視覺語(yǔ)言模型的導(dǎo)航框架VLMnav

    本文提出了一種將視覺語(yǔ)言模型(VLM)轉(zhuǎn)換為端到端導(dǎo)航策略的具體框架。不依賴于感知、規(guī)劃和控制之間的分離,而是使用VLM在
    的頭像 發(fā)表于 11-22 09:42 ?799次閱讀

    一種信息引導(dǎo)的量化后LLM微調(diào)新算法IR-QLoRA

    進(jìn)行量化+LoRA的路線為例,有研究表明,現(xiàn)有方法會(huì)導(dǎo)致量化的LLM嚴(yán)重退化,甚至無法從LoRA微調(diào)中受益。 為了解決這問題,來自蘇黎世聯(lián)邦理工學(xué)院、北京航空航天大學(xué)和字節(jié)跳動(dòng)的研究人員,最新
    的頭像 發(fā)表于 11-19 17:16 ?829次閱讀
    <b class='flag-5'>一種</b>信息引導(dǎo)的量化后LLM微調(diào)新算法IR-QLoRA

    使用vLLM+OpenVINO加速大語(yǔ)言模型推理

    隨著大語(yǔ)言模型的廣泛應(yīng)用,模型的計(jì)算需求大幅提升,帶來推理時(shí)延高、資源消耗大等挑戰(zhàn)。
    的頭像 發(fā)表于 11-15 14:20 ?1431次閱讀
    使用vLLM+OpenVINO加速大<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b><b class='flag-5'>推理</b>

    澎峰科技高性能大模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應(yīng)用的高性能推理框架也不斷推出,大有百家爭(zhēng)鳴之勢(shì)。在這種情況下,澎峰科技作為全球領(lǐng)先的智能計(jì)算服務(wù)提供商,在2023年11月25日發(fā)
    的頭像 發(fā)表于 09-29 10:14 ?1479次閱讀
    澎峰科技高性能大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>引擎PerfXLM解析

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    的表達(dá)方式和生成能力。通過預(yù)測(cè)文本中缺失的部分或下個(gè)詞,模型逐漸掌握語(yǔ)言的規(guī)律和特征。 常用的模型結(jié)構(gòu) Transformer架構(gòu):大語(yǔ)言
    發(fā)表于 08-02 11:03

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

    學(xué)習(xí)方法。其中文本向量化中的三編碼方式:獨(dú)熱編碼、靜態(tài)編碼和動(dòng)態(tài)編碼,這些概念描述是需要時(shí)間仔細(xì)研究理解的。 1.5章節(jié)終于開始講解大語(yǔ)言模型了,這也是基礎(chǔ)篇的最后
    發(fā)表于 07-25 14:33

    LLM大模型推理加速的關(guān)鍵技術(shù)

    LLM(大型語(yǔ)言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的個(gè)研究熱點(diǎn),旨在提高
    的頭像 發(fā)表于 07-24 11:38 ?1826次閱讀