一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

預(yù)先訓(xùn)練的語言模型能像人類一樣聰明地解釋明喻嗎?

深度學(xué)習(xí)自然語言處理 ? 來源:知識工場 ? 作者:知識工場 ? 2022-09-23 15:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

明喻是人們?nèi)粘I钪幸活惓R姷谋硎鲂问?,解釋明喻可以幫助機(jī)器更好地理解自然語言。因此,明喻解釋(SimileInterpretation)是自然語言處理領(lǐng)域中一個重要的研究問題。如今,大規(guī)模預(yù)訓(xùn)練語言模型(Pre-trainedLanguage Models , PLMs)在各類自然語言處理任務(wù)上得到突出的表現(xiàn)效果。那預(yù)訓(xùn)練語言模型是否能像人一樣解釋明喻呢?

本文介紹了復(fù)旦大學(xué)知識工場實(shí)驗(yàn)室的最新工作《Can Pre-trained Language Models Interpret Similes as Smart as Human?》,該工作已經(jīng)被ACL 2022錄用。此工作創(chuàng)新性地提出了明喻屬性探測任務(wù)(Simile Property Probing),也即讓預(yù)訓(xùn)練語言模型推斷明喻中的共同屬性。此工作從通用語料文本、人工構(gòu)造題目兩個數(shù)據(jù)源構(gòu)建明喻屬性探測數(shù)據(jù)集,規(guī)模為1,633個題目,涵蓋七個主要類別。基于構(gòu)建的數(shù)據(jù)集,實(shí)驗(yàn)證明預(yù)訓(xùn)練語言模型具有一定推斷明喻屬性的能力,但是仍然不及人類的表現(xiàn)。為了進(jìn)一步增強(qiáng)預(yù)訓(xùn)練語言模型的明喻解釋能力,此工作借鑒知識表示方法設(shè)計(jì)優(yōu)化目標(biāo),將明喻知識注入模型。實(shí)驗(yàn)證明,該優(yōu)化目標(biāo)在探測任務(wù)帶來8.58%的提升、在情感分析下游任務(wù)上帶來1.37%的提升。

24bc8ff2-3aff-11ed-9e49-dac502259ad0.png

paper: https://arxiv.org/abs/2203.08452

Datasets and Code:https://github.com/Abbey4799/PLMs-Interpret-Simile

研究背景

通過捕捉概念之間的共同屬性,明喻將看似無關(guān)的兩個概念聯(lián)系起來,形成一段生動的表述。例如圖1中雖然“老婦人”與“蝸?!笨此坪翢o關(guān)系,前者是人類,后者是動物。但是,由于二者的共同屬性——“行走速度較慢”,明喻便在二者之間建立了聯(lián)系,拓展了語言的表達(dá)能力,豐富了讀者的想象力。

24fb994a-3aff-11ed-9e49-dac502259ad0.png

圖1:明喻通過共同屬性將兩個概念聯(lián)系起來的示例。

明喻主要分為兩類:封閉式明喻(ClosedSimile),以及開放式明喻(OpenSimile)。如圖2所示,二者區(qū)別在于是否顯式地指明本體、喻體的共同屬性,例如上例中的“速度慢”。

若屬性顯式出現(xiàn)(例如,The old lady walks as slow as a snail.),則是封閉式明喻;

若沒有顯式指出屬性(例如,The old lady walks like a snail.),則是開放式明喻。

252b9320-3aff-11ed-9e49-dac502259ad0.png

圖2:兩類明喻的示例。二者區(qū)別在于是否顯式地指明共同屬性。

明喻解釋是自然語言處理領(lǐng)域中的一個重要研究問題,可以幫助許多下游任務(wù),例如:理解更復(fù)雜的修辭手法、情感分析任務(wù)等。以明喻“這個律師像一條鯊魚”為例,此句雖然用詞中性,但當(dāng)機(jī)器推斷出“律師”和“鯊魚”共同具有的“氣勢洶洶”這一屬性后,便可判斷這一句所表達(dá)的是消極情緒。

近年來,大規(guī)模預(yù)訓(xùn)練語言模型,例如BERT、RoBERTa,成為解決自然語言處理任務(wù)的新趨勢。許多研究證明,大規(guī)模預(yù)訓(xùn)練語言模型在預(yù)訓(xùn)練過程中存儲了一定知識在模型豐富的參數(shù)、精巧的結(jié)構(gòu)中。然而,預(yù)訓(xùn)練語言模型解釋明喻的能力卻并未被關(guān)注。

因此,我們創(chuàng)新性地提出了明喻屬性探測任務(wù)(SimileProperty Probing)。通過讓預(yù)訓(xùn)練語言模型推斷明喻中的共同屬性,從而研究了預(yù)訓(xùn)練語言模型解釋明喻的能力。

明喻屬性探測任務(wù)

01

問題建模

為了研究預(yù)訓(xùn)練語言模型解釋明喻的能力,我們遮蓋(Mask)了封閉式明喻(ClosedSimile)中的屬性,讓語言模型根據(jù)上下文信息推斷屬性。由于本體和喻體可能同時擁有多個屬性,因此,我們將任務(wù)設(shè)計(jì)為選擇題(只有一個正確答案)而非填空題。

給定一個單詞序列S={w1w2,,...,wi-1,[MASK],wi+1,...,wn},將本體和喻體共有屬性wi遮蓋為[MASK]符號。PLMs需要從四個選項(xiàng)中選擇正確屬性,剩余三個選項(xiàng)為錯誤干擾選項(xiàng)。

02

數(shù)據(jù)集構(gòu)建

針對明喻屬性探測任務(wù),我們構(gòu)建了評估數(shù)據(jù)集。我們首先從兩個數(shù)據(jù)來源搜集封閉式明喻,并基于明喻組件設(shè)計(jì)干擾選項(xiàng)候選集合,接著我們利用余弦相似度篩選最具有挑戰(zhàn)性的干擾選項(xiàng)得到最終選項(xiàng),最后我們通過人工標(biāo)注確保數(shù)據(jù)集的質(zhì)量。整體數(shù)據(jù)集構(gòu)建流程展示如圖3。

25529164-3aff-11ed-9e49-dac502259ad0.png

圖3:構(gòu)建明喻屬性探測數(shù)據(jù)集流程圖。

數(shù)據(jù)來源

我們選擇兩個數(shù)據(jù)來源以構(gòu)建數(shù)據(jù)集:通用語料文本、人工構(gòu)造題目。由于開放式明喻的屬性沒有被顯式指出,若要用以構(gòu)建明喻屬性探測數(shù)據(jù)集,需要人工根據(jù)上下文標(biāo)注正確屬性。為了減少標(biāo)注的成本,在構(gòu)建數(shù)據(jù)集的過程中,我們選擇顯式指出屬性的封閉式明喻作為數(shù)據(jù)來源。

通用語料文本。首先選取兩個通用語料庫:BNC以及iWeb,隨后利用模版as ADJ as (a, an, the) NOUN匹配句子。

人工構(gòu)造題目。老師為檢驗(yàn)學(xué)生是否掌握明喻知識所制定的題目是合適的數(shù)據(jù)來源。因此,我們將在線測驗(yàn)的趣味學(xué)習(xí)平臺Quizizz作為數(shù)據(jù)來源。選取一系列標(biāo)題與明喻相關(guān)的測驗(yàn),并基于測驗(yàn)中的問題和答案解析出封閉式明喻。

為了保證數(shù)據(jù)集的質(zhì)量,三個標(biāo)注者對句子是否為明喻進(jìn)行判斷,并標(biāo)注每個句子的明喻組件。數(shù)據(jù)集中所有屬性均為單符號的(single-token),原句中的多符號(multi-token)屬性均被替換為它們在知識庫WordNet和ConceptNet中的單符號同義詞。

干擾選項(xiàng)構(gòu)建

為了保證題目的質(zhì)量,我們以兩個原則設(shè)計(jì)了剩余的三個干擾選項(xiàng):錯誤(true-negative)、具有挑戰(zhàn)性(challenging)。也即,高質(zhì)量的干擾選項(xiàng)應(yīng)該違背上下文的邏輯(true-negative ),同時與正確答案語義相關(guān)(challenging)。

生成干擾選項(xiàng)。為了實(shí)現(xiàn)“具有挑戰(zhàn)性(challenging)”的要求,我們基于明喻中四個語義相關(guān)的組件(本體topic、喻體vehicle、謂詞event、屬性property)設(shè)計(jì)干擾選項(xiàng)候選集合。

給定原有屬性,我們首先從知識庫WordNet和ConceptNet中獲取反義詞;

對于剩下的三個組件,我們首先利用ConceptNet的HasProperty和COMET分別獲得每個組件相關(guān)屬性。接著,通過統(tǒng)計(jì)頻次,獲得每個組件在Wikipedia和BookCorpus中共現(xiàn)次數(shù)最多的副詞/形容詞,選取共現(xiàn)頻次排名前十的修飾詞(并且頻次大于1)作為候選選項(xiàng)。

通過以上策略,得到干擾選項(xiàng)候選集。

篩選干擾選項(xiàng)。我們利用句子的相似度,進(jìn)一步從干擾選項(xiàng)候選集中獲得最具有挑戰(zhàn)性的干擾選項(xiàng)。整體流程如圖4。給定原句以及將正確屬性替換為的干擾選項(xiàng)的新句子,我們利用RoBERTaLARGE提取兩類特征,從而衡量二者的相似度。

一個是上下文特征(Context Embedding),由[CLS]的嵌入向量表示;

一個是單詞特征(Word Embedding),由正確選項(xiàng)或干擾選項(xiàng)的嵌入向量表示。

最后,拼接兩個特征,利用余弦相似度(consinesimilarity)衡量正確答案和干擾選項(xiàng)之間在給定上下文中的關(guān)聯(lián)性。最終,選取關(guān)聯(lián)性最高的三個干擾選項(xiàng)與正確答案組成最終選項(xiàng)。

人工確認(rèn)選項(xiàng)。為了確保干擾選項(xiàng)為“錯誤(true-negative)”的,由三個標(biāo)注者對干擾選項(xiàng)進(jìn)行清洗。

25a0d748-3aff-11ed-9e49-dac502259ad0.png

圖4:篩選最具有挑戰(zhàn)性的干擾選項(xiàng)的示意圖。

數(shù)據(jù)集統(tǒng)計(jì)指標(biāo)

最終,我們從通用語料文本、人工構(gòu)造題目兩個數(shù)據(jù)源構(gòu)建明喻屬性探測數(shù)據(jù)集,規(guī)模為1,633個題目,涵蓋七個類別。題目示例如表1。

表1:明喻屬性探測數(shù)據(jù)集中各類題目的示例和占比。其中,“__”標(biāo)示的選項(xiàng)是正確答案。每句中的斜體詞分別代表本體、遮蓋后的屬性和喻體。

25b4a8d6-3aff-11ed-9e49-dac502259ad0.png

數(shù)據(jù)集統(tǒng)計(jì)指標(biāo)如表2。整體而言,Quizzes數(shù)據(jù)集中的明喻更常見,GeneralCorpus數(shù)據(jù)集中的明喻上下文更豐富。

表2:明喻屬性探測數(shù)據(jù)集統(tǒng)計(jì)指標(biāo)。

25ec1a5a-3aff-11ed-9e49-dac502259ad0.png

03

有監(jiān)督微調(diào)

除了評估預(yù)訓(xùn)練語言模型在零樣本場景下直接表現(xiàn)的預(yù)測明喻屬性能力,我們利用遮蓋屬性后的Masked Language Modeling (MLM)訓(xùn)練目標(biāo)微調(diào)模型,探索微調(diào)是否能提升模型理解明喻的能力。我們利用來自StandardizedProject Gutenberg Corpus(SPGC)語料庫4510條(Noun... as ADJ as ... NOUN)的句子作為微調(diào)數(shù)據(jù)。

主要實(shí)驗(yàn)結(jié)果

我們對比了模型在零樣本、微調(diào)后的結(jié)果,并與前人工作、人類表現(xiàn)進(jìn)行對比。實(shí)驗(yàn)結(jié)果如表3。

表3:各模型在明喻屬性探測任務(wù)中的準(zhǔn)確率。

26086660-3aff-11ed-9e49-dac502259ad0.png

我們觀察到:

模型在預(yù)訓(xùn)練階段存儲的知識可以幫助推斷明喻屬性;

利用MLM目標(biāo)微調(diào)可以進(jìn)一步提升模型預(yù)測明喻屬性的能力;

微調(diào)后的模型仍然不及人類的表現(xiàn)。

總體而言,模型在Quizzes數(shù)據(jù)集上的表現(xiàn)好于在GeneralCorpus數(shù)據(jù)集上的表現(xiàn)效果,更豐富的上下文會增加推斷明喻屬性的難度。同時,RoBERTa的表現(xiàn)持續(xù)好于BERT,證明更大規(guī)模的預(yù)訓(xùn)練語料可以讓模型建模更多的明喻文本。

我們還對明喻各個組件對解釋明喻的貢獻(xiàn)程度進(jìn)行探究,從而進(jìn)一步揭示模型解釋明喻的機(jī)制。我們分別將明喻組件(本體、喻體、比較詞)替換為[UNK]符號,將謂詞替換為be動詞從而在抹除語義的同時不影響語法。我們同時隨機(jī)替換任一符號為[UNK]作為對照。實(shí)驗(yàn)結(jié)果如表4。

表4:未經(jīng)微調(diào)的預(yù)訓(xùn)練語言模型在分別遮蓋各組件的情況下預(yù)測明喻屬性的結(jié)果。

26214194-3aff-11ed-9e49-dac502259ad0.png

我們觀察到:

喻體、本體和比較詞較上下文能提供更關(guān)鍵的信息;

喻體能提供最豐富的語義信息,本體次之。

因此,我們認(rèn)為有效利用喻體和本體的信息可以進(jìn)一步提高模型的表現(xiàn)效果。

增強(qiáng)PLMs中的明喻知識

01

設(shè)計(jì)目標(biāo)函數(shù)進(jìn)行知識增強(qiáng)

根據(jù)實(shí)驗(yàn)分析,我們已知本體和喻體是推測明喻屬性最重要的兩個組件。因此,由知識表示相關(guān)方法(Knowledge Embedding, KE)啟發(fā),我們認(rèn)為屬性(property)可以看作本體(topic)和喻體(vehicle)的關(guān)系。受事實(shí)三元組的啟發(fā),我們將明喻看作三元組(本體topic,屬性property,喻體vehicle)。如圖5所示,在表示空間中,將屬性看作從本體到喻體的平移向量。用知識表示方法的打分函數(shù)對屬性予以評估和約束。

264b0092-3aff-11ed-9e49-dac502259ad0.png

圖5:我們設(shè)計(jì)的目標(biāo)函數(shù)示意圖

受經(jīng)典的知識表示方法TransE啟發(fā),我們利用均方誤差(MeanSquare Error, MSE)損失函數(shù)作為我們的知識表示損失函數(shù)(KE Loss)。

LKE= MSE(Et+ Ep, Ev)

其中,Et,Ep, Ev為本體、屬性、喻體由語言模型編碼的表示向量。我們也嘗試了改進(jìn)后的知識表示方法(例如TransH,TransD),我們將結(jié)果展示在附錄中。

最終,我們的損失函數(shù)由MLMLoss和KE Loss共同組成:

LOurs =αLKE + LMLM

其中,α是平衡兩個目標(biāo)函數(shù)的超參數(shù)。

02

實(shí)驗(yàn)結(jié)果

我們分別基于MLM目標(biāo)函數(shù)以及我們設(shè)計(jì)的目標(biāo)函數(shù)進(jìn)行微調(diào),對比模型在明喻屬性探測任務(wù)上的表現(xiàn)效果。實(shí)驗(yàn)結(jié)果如表5。

表5:利用MLM以及我們設(shè)計(jì)的目標(biāo)函數(shù)在明喻屬性探測任務(wù)上的準(zhǔn)確率。

266aefc4-3aff-11ed-9e49-dac502259ad0.png

我們觀察到我們設(shè)計(jì)的目標(biāo)函數(shù)可以提高模型推測共同屬性的能力,在明喻屬性探測任務(wù)上驗(yàn)證了我們設(shè)計(jì)的目標(biāo)函數(shù)的有效性。

研究表明,明喻往往帶有情感極性。為了進(jìn)一步揭示改進(jìn)后目標(biāo)函數(shù)的應(yīng)用潛力,我們在情感分析下游任務(wù)上進(jìn)行實(shí)驗(yàn)。我們選取Amazon評論情感分析數(shù)據(jù)集進(jìn)行二分類任務(wù),訓(xùn)練過程中僅更新MLP層的參數(shù),預(yù)訓(xùn)練語言模型的參數(shù)保持不變。預(yù)訓(xùn)練語言模型的參數(shù)來自于明喻屬性探測任務(wù)中的三個場景:零樣本(Original)、基于MLM目標(biāo)函數(shù)微調(diào)后(LMLM)、基于知識增強(qiáng)后的模板函數(shù)微調(diào)后(LOurs)。實(shí)驗(yàn)結(jié)果如表6。

表6:三個場景下的預(yù)訓(xùn)練語言模型在情感分析下游任務(wù)上的準(zhǔn)確率。

2683d53e-3aff-11ed-9e49-dac502259ad0.png

我們觀察到,增強(qiáng)預(yù)訓(xùn)練語言模型推斷明喻屬性的能力可以提升模型分析文本情感極性的能力。同時在下游任務(wù)上也驗(yàn)證了我們設(shè)計(jì)的目標(biāo)函數(shù)的有效性。并且,我們在論文中也通過實(shí)驗(yàn)分析了目標(biāo)函數(shù)帶來表現(xiàn)提升的原因。

總結(jié)

我們是第一篇通過設(shè)計(jì)明喻屬性探測任務(wù)研究預(yù)訓(xùn)練語言模型解釋明喻能力的文章?;趦蓚€數(shù)據(jù)來源構(gòu)建了兩個明喻屬性探測數(shù)據(jù)集,并進(jìn)行了一系列實(shí)驗(yàn)。我們證明了預(yù)訓(xùn)練語言模型在預(yù)訓(xùn)練階段已經(jīng)掌握一定推斷明喻屬性的能力,同時該能力可以進(jìn)一步在精調(diào)階段提升,但是仍然與人的表現(xiàn)有所差距。特別地,我們提出的目標(biāo)函數(shù)將明喻知識注入模型,進(jìn)一步縮短了這一差距。我們的目標(biāo)函數(shù)在明喻屬性探測任務(wù)以及情感分析下游任務(wù)上都表現(xiàn)出有效性。在未來,我們將考慮探索如何讓機(jī)器解釋更復(fù)雜的修辭手法,例如隱喻和類比。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3517

    瀏覽量

    50405
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10787
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25442

原文標(biāo)題:ACL'22丨預(yù)訓(xùn)練語言模型能否像人一樣解釋明喻

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    運(yùn)行kmodel模型驗(yàn)證直報(bào)錯怎么解決?

    我這運(yùn)行kmodel模型驗(yàn)證直報(bào)錯,所以沒法做kmodel模型好壞驗(yàn)證,不知道怎么解決這個問題,重新訓(xùn)練個kmodel
    發(fā)表于 06-10 08:02

    CoT 數(shù)據(jù)集如何讓大模型學(xué)會步思考?

    目前,大模型的回答路徑基本遵循 input-output 的方式,在面對復(fù)雜任務(wù)時表現(xiàn)不佳。反之,人類會遵循套有條理的思維流程,逐步推理得出正確答案。這種差異促使人們深入思考:如何才能讓大
    的頭像 發(fā)表于 04-24 16:51 ?577次閱讀
    CoT 數(shù)據(jù)集如何讓大<b class='flag-5'>模型</b>學(xué)會<b class='flag-5'>一</b>步<b class='flag-5'>一</b>步思考?

    基于MindSpeed MM玩轉(zhuǎn)Qwen2.5VL多模態(tài)理解模型

    多模態(tài)理解模型是讓AI人類一樣,通過整合多維度信息(如視覺、語言、聽覺等),理解數(shù)據(jù)背后的語義、情感、邏輯或場景,從而完成推理、決策等任務(wù)
    的頭像 發(fā)表于 04-18 09:30 ?1442次閱讀
    基于MindSpeed MM玩轉(zhuǎn)Qwen2.5VL多模態(tài)理解<b class='flag-5'>模型</b>

    Stm32CubeIDEKeil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?

    Stm32CubeIDEKeil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?比如部分代碼存放到內(nèi)部FLASH,另部分存放到外部QSPI的FLASH中
    發(fā)表于 03-07 08:09

    小白學(xué)大模型訓(xùn)練語言模型的深度指南

    在當(dāng)今人工智能飛速發(fā)展的時代,大型語言模型(LLMs)正以其強(qiáng)大的語言理解和生成能力,改變著我們的生活和工作方式。在最近的項(xiàng)研究中,科學(xué)家們?yōu)榱松钊肓私馊绾胃咝У?/div>
    的頭像 發(fā)表于 03-03 11:51 ?717次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:<b class='flag-5'>訓(xùn)練</b>大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的深度指南

    模型領(lǐng)域常用名詞解釋(近100個)

    本文總結(jié)了大模型領(lǐng)域常用的近100個名詞解釋,并按照模型架構(gòu)與基礎(chǔ)概念,訓(xùn)練方法與技術(shù),模型優(yōu)化與壓縮,推理與應(yīng)用,計(jì)算與性能優(yōu)化,數(shù)據(jù)與標(biāo)
    的頭像 發(fā)表于 02-19 11:49 ?783次閱讀
    大<b class='flag-5'>模型</b>領(lǐng)域常用名詞<b class='flag-5'>解釋</b>(近100個)

    騰訊公布大語言模型訓(xùn)練新專利

    近日,騰訊科技(深圳)有限公司公布了項(xiàng)名為“大語言模型訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)”的新專利。該專利的公布,標(biāo)志著騰訊在大語言
    的頭像 發(fā)表于 02-10 09:37 ?404次閱讀

    語言模型開發(fā)框架是什么

    語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言
    的頭像 發(fā)表于 12-06 10:28 ?523次閱讀

    什么是大模型、大模型是怎么訓(xùn)練出來的及大模型作用

    ,基礎(chǔ)模型。 ? 大模型個簡稱,完整的叫法,應(yīng)該是“人工智能預(yù)訓(xùn)練模型”。預(yù)訓(xùn)練,是
    的頭像 發(fā)表于 11-25 09:29 ?1.3w次閱讀
    什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么<b class='flag-5'>訓(xùn)練</b>出來的及大<b class='flag-5'>模型</b>作用

    智能體已經(jīng)一樣刷視頻了?國內(nèi)聯(lián)匯科技OmAgent智能體試用!

    智能體已經(jīng)一樣刷視頻了?國內(nèi)知名大模型獨(dú)角獸級別公司,資深A(yù)I玩家聯(lián)匯科技退出了OmAgent智能體,已經(jīng)開啟試用。 ? 當(dāng)你正在觀看
    的頭像 發(fā)表于 11-22 18:59 ?509次閱讀
    智能體已經(jīng)<b class='flag-5'>能</b><b class='flag-5'>像</b>人<b class='flag-5'>一樣</b>刷視頻了?國內(nèi)聯(lián)匯科技OmAgent智能體試用!

    從零開始訓(xùn)練個大語言模型需要投資多少錢?

    ,前言 ? 在AI領(lǐng)域,訓(xùn)練個大型語言模型(LLM)是個耗時且復(fù)雜的過程。幾乎每個做大型
    的頭像 發(fā)表于 11-08 14:15 ?786次閱讀
    從零開始<b class='flag-5'>訓(xùn)練</b><b class='flag-5'>一</b>個大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>需要投資多少錢?

    語言模型如何開發(fā)

    語言模型的開發(fā)是個復(fù)雜且細(xì)致的過程,涵蓋了數(shù)據(jù)準(zhǔn)備、模型架構(gòu)設(shè)計(jì)、訓(xùn)練、微調(diào)和部署等多個階段。以下是對大
    的頭像 發(fā)表于 11-04 10:14 ?602次閱讀

    封裝一樣的磁棒電感通用嗎

    電子發(fā)燒友網(wǎng)站提供《封裝一樣的磁棒電感通用嗎.docx》資料免費(fèi)下載
    發(fā)表于 10-28 11:15 ?0次下載

    請問全差分運(yùn)算放大器般運(yùn)算放大器一樣設(shè)計(jì)加法器嗎?

    全差分運(yùn)算放大器般運(yùn)算放大器一樣設(shè)計(jì)加法器嗎?
    發(fā)表于 08-09 06:26

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯嗎?

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯
    發(fā)表于 07-23 06:22