近期,谷歌公布新版ASPIRE訓(xùn)練架構(gòu),該架構(gòu)主要用于改進(jìn)大型語言模型的選擇性預(yù)測情況。谷歌表示,盡管大語言模型在自然語言理解與生成領(lǐng)域發(fā)展迅速,應(yīng)用廣泛,然而在涉及到高風(fēng)險(xiǎn)決策時(shí),其預(yù)測能力仍待加強(qiáng)。為此,谷歌推出ASPIRE訓(xùn)練框架,通過向模型引入“可信度”機(jī)制,提升預(yù)測準(zhǔn)確率。
該框架分為三步驟:“特定任務(wù)調(diào)整”、“答案采樣”以及“自我評估學(xué)習(xí)”。首先,“特定任務(wù)調(diào)整”階段針對基本訓(xùn)練的大型語言模型進(jìn)一步深化訓(xùn)練,重點(diǎn)提高預(yù)測能力。其次,“答案采樣”階段模型會根據(jù)調(diào)整的參數(shù),生成多個(gè)答案,同時(shí)建立自我評估學(xué)習(xí)數(shù)據(jù)集,產(chǎn)生較高信度的選項(xiàng)。最后,“自我評估學(xué)習(xí)”階段則設(shè)定參數(shù)以提升機(jī)模自我評估能力,使之能檢測答案準(zhǔn)確性,以便在回答問題時(shí)附加可信度評分。
據(jù)悉該架構(gòu)取得顯著成效。在CoQA、TriviaQA和SQuAD三個(gè)問答數(shù)據(jù)集測試中,經(jīng)由ASPIRE調(diào)整的OPT-2.7B小模型表現(xiàn)全面優(yōu)于更大規(guī)模的OPT-30B模型。此成果證實(shí),經(jīng)適配調(diào)整,小型語言模型亦有潛力超越大型語言模型。
研究人員總結(jié)指出,ASPIRE訓(xùn)練框架有效改善了大型語言模型的輸出精度,使小型模型經(jīng)微調(diào)后可以實(shí)現(xiàn)“恰當(dāng)且自信”的預(yù)測。
-
谷歌
+關(guān)注
關(guān)注
27文章
6231瀏覽量
108115 -
AI
+關(guān)注
關(guān)注
88文章
35109瀏覽量
279603 -
語言模型
+關(guān)注
關(guān)注
0文章
561瀏覽量
10787
發(fā)布評論請先 登錄
任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來呢?
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
什么是高選擇性蝕刻
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......
《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得2——客服機(jī)器人、AutoGen框架 、生成式代理
谷歌AI智能體執(zhí)行復(fù)雜任務(wù)能力大幅提升
選擇性沉積技術(shù)介紹

訓(xùn)練AI大模型需要什么樣的gpu
過電流保護(hù)的選擇性是靠什么來實(shí)現(xiàn)的
選擇性喚醒如何實(shí)現(xiàn)局部聯(lián)網(wǎng)

評論