探究編輯多模態(tài)大語(yǔ)言模型的可行性

本文作者：程思源（浙江大學(xué)）、田博中（浙江大學(xué)）、劉慶斌（騰訊）、陳曦（騰訊）、王永恒（之江實(shí)驗(yàn)室）、陳華鈞（浙江大學(xué)）、張寧豫（浙江大學(xué)）

在博士畢業(yè)就有10篇ACL一作的師兄指導(dǎo)下是種什么體驗(yàn)

引言

世界不但是文字的世界，我們生活的世界本質(zhì)上是多模態(tài)的。我們需要不斷處理和整合來(lái)自不同模態(tài)的信息，如視覺(jué)信息、聽(tīng)覺(jué)信息等，利用這些信息我們可以更好地與周圍環(huán)境互動(dòng)，提升認(rèn)知世界的能力。隨著OpenAI開(kāi)放了ChatGPT的多模態(tài)功能，多模態(tài)大語(yǔ)言模型再一次成為了焦點(diǎn)?，F(xiàn)有的主流多模態(tài)大語(yǔ)言模型框架是利用訓(xùn)練好的大語(yǔ)言模型和圖像編碼器，用一個(gè)圖文特征對(duì)齊模塊進(jìn)行連接，從而讓語(yǔ)言模型能夠理解圖像特征并進(jìn)行更深層的問(wèn)答推理。代表作有VisualGLM、BLIP 2和MiniGPT-4等。

但是目前復(fù)雜的多模態(tài)大語(yǔ)言模型都面臨一個(gè)重大的挑戰(zhàn)：對(duì)象幻覺(jué)（Object Hallucination）。就算是高質(zhì)量的多模態(tài)語(yǔ)言模型，比如InstructBLIP，也存在高幻覺(jué)的文本率。多模態(tài)模型幻覺(jué)的主要原因可能有兩點(diǎn)：1、多模態(tài)指令微調(diào)過(guò)程導(dǎo)致LVLMs 更容易在多模態(tài)指令數(shù)據(jù)集中頻繁出現(xiàn)/共現(xiàn)的物體上產(chǎn)生幻覺(jué)；2、一些幻覺(jué)繼承于原先的LLMs，由于使用的LLMs本來(lái)就存在一些錯(cuò)誤/謬誤知識(shí)，導(dǎo)致多模態(tài)語(yǔ)言模型也繼承了這些錯(cuò)誤知識(shí)，從而出現(xiàn)幻覺(jué)。

最近隨著一種可以精確修改模型中特定知識(shí)的范式出現(xiàn)，對(duì)解決模型幻覺(jué)問(wèn)題提供了一個(gè)新的可行性思路，這種方法被稱作模型編輯。模型編輯可以在不重新訓(xùn)練模型的基礎(chǔ)上，去修改模型的參數(shù)知識(shí)，這可以節(jié)約大量的資源。但是現(xiàn)有的模型編輯技術(shù)大部分都是針對(duì)單模態(tài)的，那多模態(tài)的模型是否是可編輯的呢？本文就是去探究編輯多模態(tài)大語(yǔ)言模型的可行性，作者構(gòu)建了多模態(tài)語(yǔ)言模型知識(shí)編輯場(chǎng)景的benckmark，即設(shè)計(jì)了多模態(tài)模型編輯的指標(biāo)和構(gòu)建了相關(guān)數(shù)據(jù)集。并類比人類視覺(jué)問(wèn)答場(chǎng)景，提出了編輯多模態(tài)語(yǔ)言模型的兩種方式。其中多模態(tài)模型編輯的展示如下圖所示：

MMEdit

指標(biāo)

不同于單模態(tài)模型編輯，多模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點(diǎn)依然從單模態(tài)模型編輯入手，將單模態(tài)模型編輯拓展到多模態(tài)模型編輯，主要從以下三個(gè)方面：可靠性（Reliability），穩(wěn)定性（Locality）和泛化性（Generality）。

可靠性：模型編輯需要能夠保證正確修改模型的知識(shí)，可靠性就是衡量編輯后模型的準(zhǔn)確率。多模態(tài)模型編輯亦是如此，作者定義如下：

穩(wěn)定性：穩(wěn)定性是判別模型編輯影響模型其余知識(shí)的程度。模型編輯希望在編輯完相關(guān)知識(shí)過(guò)后，不影響模型中其余的一些知識(shí)。多模態(tài)模型編輯與單模態(tài)不同，由于我們需要編輯多個(gè)模型區(qū)域，所以我們需要判斷多模態(tài)模型進(jìn)行編輯之后到底是對(duì)哪部分產(chǎn)生的影響多，哪部分少。所以作者提出了兩種穩(wěn)定性測(cè)試：T-Locality和M-Locality，一個(gè)測(cè)試純語(yǔ)言模型的穩(wěn)定性，一個(gè)測(cè)試多模態(tài)整體模型的穩(wěn)定性，其定義如下：

泛化性：編輯需要對(duì)一定編輯范圍內(nèi)的數(shù)據(jù)都要具有編輯效應(yīng)，單模態(tài)模型編輯泛化性只考慮一種數(shù)據(jù)形式，即同義語(yǔ)義集合。多模態(tài)模型需要考慮更多模態(tài)數(shù)據(jù)，VLMs多增加了一個(gè)圖片模態(tài)數(shù)據(jù)，所以作者提出兩種泛化性指標(biāo)：

數(shù)據(jù)集

對(duì)于上述所有評(píng)估指標(biāo)，本文作者都構(gòu)造了對(duì)應(yīng)的數(shù)據(jù)集來(lái)進(jìn)行測(cè)試，其中針對(duì)可靠性數(shù)據(jù)集，作者收集了現(xiàn)有多模態(tài)大語(yǔ)言模型表現(xiàn)不佳的任務(wù)數(shù)據(jù)來(lái)作為編輯對(duì)象數(shù)據(jù)集，本文采用兩個(gè)不同的多模態(tài)任務(wù)分別是VQA和Image Caption。并設(shè)計(jì)兩種任務(wù)編輯數(shù)據(jù)集E-VQA和E-IC。

對(duì)于泛化性數(shù)據(jù)，多模態(tài)模型由于本身的數(shù)據(jù)也是多模態(tài)的，所以需要考慮更多模態(tài)的泛化數(shù)據(jù)情況。其中多模態(tài)泛化性數(shù)據(jù)例子如下：

對(duì)文本數(shù)據(jù)，本文作者利用不同的方法構(gòu)造相關(guān)泛化數(shù)據(jù)集。首先對(duì)于VQA數(shù)據(jù)，文章作者使用ChatGLM去生成文本類的泛化數(shù)據(jù)集，通過(guò)構(gòu)造相關(guān)的prompt，讓對(duì)話模型吐出相似句子。Image Caption任務(wù)由于其本身的數(shù)據(jù)比較簡(jiǎn)單，生成效果并不佳，所以作者人工構(gòu)建了幾十條相似文本數(shù)據(jù)，然后通過(guò)隨機(jī)替換的方式作為Image Caption任務(wù)的泛化數(shù)據(jù)集。

然后對(duì)于圖片數(shù)據(jù)，作者利用COCO數(shù)據(jù)集中提供的圖片描述。通過(guò)現(xiàn)有效果非常不錯(cuò)的圖片生成模型Stable Diffusion 2.1來(lái)生成與圖片描述相似的圖片。具體構(gòu)造流程如下圖所示：

對(duì)于穩(wěn)定性數(shù)據(jù)集，作者為了考量編輯不同區(qū)域?qū)δＰ偷挠绊?，所以將穩(wěn)定性數(shù)據(jù)分為了Text Stability測(cè)試數(shù)據(jù)和Vision Stability測(cè)試數(shù)據(jù)。這部分?jǐn)?shù)據(jù)不用構(gòu)造，作者直接使用了之前的已有數(shù)據(jù)集。對(duì)于文本，沿用MEND中的NQ數(shù)據(jù)集，對(duì)于多模態(tài)數(shù)據(jù)，文章使用了多模態(tài)中比較簡(jiǎn)單的問(wèn)答數(shù)據(jù)集OK-VQA作為測(cè)試數(shù)據(jù)集。

最后數(shù)據(jù)集統(tǒng)計(jì)如下：

多模態(tài)模型編輯

對(duì)于如何去編輯多模態(tài)語(yǔ)言模型，文章類比人類視覺(jué)問(wèn)答場(chǎng)景出錯(cuò)場(chǎng)景，來(lái)設(shè)計(jì)多模態(tài)模型編輯實(shí)驗(yàn)。以VQA任務(wù)為例子，人類在做VQA題目時(shí)有兩種出錯(cuò)的可能：

視覺(jué)出錯(cuò)：人類可能在圖片識(shí)別這個(gè)階段就出錯(cuò)，可能是看錯(cuò)，也有可能是視覺(jué)細(xì)胞本身就存在問(wèn)題。例如人類色盲患者沒(méi)有辦法正確識(shí)別圖片的顏色特征，就會(huì)在顏色識(shí)別的任務(wù)上出錯(cuò)。針對(duì)這個(gè)，文章作者提出了Vision Edit，針對(duì)VLMs的視覺(jué)模塊進(jìn)行編輯。

知識(shí)出錯(cuò)：人類可能正確識(shí)別了圖片中的關(guān)鍵特征，但是本身的知識(shí)庫(kù)里卻沒(méi)有相關(guān)特征的知識(shí)，這就導(dǎo)致人犯“指鹿為馬”的失誤。針對(duì)這個(gè)問(wèn)題，作者提出了Language Edit，由于多模態(tài)語(yǔ)言模型的知識(shí)庫(kù)都來(lái)自于LLMs，所以這部分編輯也就是針對(duì)語(yǔ)言模型。

多模態(tài)模型編輯的主要流程圖作如下圖所示：

實(shí)驗(yàn)

文章實(shí)驗(yàn)展示了現(xiàn)有主流的編輯方法在多模態(tài)大語(yǔ)言模型上的編輯效果，并對(duì)比了一些傳統(tǒng)的基于微調(diào)的處理方法。結(jié)果展示如下：

可以看到微調(diào)的效果都比較一般，而且會(huì)對(duì)于模型中的其他知識(shí)造成災(zāi)難性遺忘。模型編輯在可靠性上表現(xiàn)的都還不錯(cuò)，并且對(duì)于模型的穩(wěn)定性也維持的比較好，不會(huì)造成模型的過(guò)擬合和災(zāi)難性遺忘。

此外作者還展示了編輯不同模塊區(qū)域的效果展示：

可以看到編輯編輯不同區(qū)域效果差異非常大，編輯視覺(jué)模塊是比較困難的事情。作者覺(jué)得這可能和模型的架構(gòu)有關(guān)，編輯語(yǔ)言模型部分可以直接影響模型的輸出，而編輯視覺(jué)部分只能影響模型輸入。而且大部分的知識(shí)都是保存在LLMs中的，所以編輯視覺(jué)模塊的效果不佳。最后展示幾組編輯case：

總結(jié)

多模態(tài)模型是非常重要的領(lǐng)域，如何解決目前面臨的幻覺(jué)問(wèn)題是非常關(guān)鍵的問(wèn)題。模型編輯技術(shù)為解決模型幻覺(jué)提供了一個(gè)不錯(cuò)的思路，但是在多模態(tài)模型上依然有許多不足的地方，比如如何能夠更有效地進(jìn)行不同模態(tài)之間的協(xié)同編輯？如何解決編輯OOD數(shù)據(jù)？如何做到多模態(tài)的連續(xù)編輯？這些都是未來(lái)值得探討的方向。

編輯：黃飛

閱讀全文

編碼器(131226) 編碼器(131226)
語(yǔ)言模型(9992) 語(yǔ)言模型(9992)
OpenAI(5839) OpenAI(5839)
ChatGPT(3870) ChatGPT(3870)

評(píng)論

相關(guān)推薦

如何利用Transformers了解視覺(jué)語(yǔ)言模型

將模型稱為 “視覺(jué)語(yǔ)言” 模型是什么意思？一個(gè)結(jié)合了視覺(jué)和語(yǔ)言模態(tài)的模型？但這到底是什么意思呢？

2023-03-03 09:49:37

665

七段式SVPWM優(yōu)化電機(jī)電磁噪聲的量產(chǎn)可行性驗(yàn)證

七段式SVPWM優(yōu)化電機(jī)電磁噪聲的量產(chǎn)可行性驗(yàn)證

2024-03-21 17:28:52

408

探究Linux電源管理模型

Linux電源管理/#more探究Linux電源管理模型，并為T(mén)iny4412的LCD驅(qū)動(dòng)添加電源管理。這是2018的第一篇博客，選了一個(gè)幾乎沒(méi)有接觸過(guò)的角度作為開(kāi)篇，希望2018年學(xué)習(xí)更多，記錄更多。1.電源管理...

2021-10-29 06:04:48

LTE網(wǎng)絡(luò)測(cè)試系統(tǒng)的基礎(chǔ)技術(shù)研究有哪些可行性？

根據(jù)移動(dòng)通信技術(shù)和市場(chǎng)的發(fā)展趨勢(shì),為提升公司在LTE 技術(shù)、產(chǎn)品、人才等方面的積累,保持公司在技術(shù)、產(chǎn)品和市場(chǎng)方面的競(jìng)爭(zhēng)優(yōu)勢(shì),進(jìn)一步夯實(shí)公司未來(lái)發(fā)展的基礎(chǔ),公司擬使用超募資金1043.1萬(wàn)元投資實(shí)施《LTE 網(wǎng)絡(luò)測(cè)試系統(tǒng)的基礎(chǔ)技術(shù)研究》項(xiàng)目。那LTE網(wǎng)絡(luò)測(cè)試系統(tǒng)的基礎(chǔ)技術(shù)研究究竟有哪些可行性呢？

2019-08-07 08:09:38

PCB完整性分析的簡(jiǎn)單步驟

　　簡(jiǎn)單的說(shuō)步驟是這樣的：　　1、前仿真，屬于原理性的仿真，主要驗(yàn)證設(shè)計(jì)的可行性及如何進(jìn)行最優(yōu)的設(shè)計(jì)，即求解空間．　　2、后仿真，PCB Layout完成后，進(jìn)行再次仿真驗(yàn)證。　　3、測(cè)試驗(yàn)證，原型機(jī)出來(lái)后，進(jìn)行測(cè)試，驗(yàn)證仿真的準(zhǔn)確度，可信性，還包括仿真模型、仿真方法的驗(yàn)證。

2018-09-04 16:20:19

TD-LTE/GSM共站建設(shè)方案可行性論證和分析

，TD-SCDMA站點(diǎn)資源不足的問(wèn)題，顯得尤為突出。本文介紹了愛(ài)立信近期提出的TD-LTE/GSM共站建設(shè)方案，并對(duì)其可行性進(jìn)行了論證和分析。主要通過(guò)系統(tǒng)仿真分析了系統(tǒng)覆蓋和容量，并對(duì)共享雙頻天線方案提出了建議

2019-07-15 06:30:47

“階段2.7設(shè)計(jì)可行性檢查”占用了95％的構(gòu)建時(shí)間從哪里開(kāi)始尋找改進(jìn)？

我的設(shè)計(jì)需要1天20小時(shí)才能執(zhí)行“2.7階段設(shè)計(jì)可行性檢查”。其他一切 - 從xst到bitgen- 需要2個(gè)小時(shí)?，F(xiàn)在，我知道工具應(yīng)該花費(fèi)很長(zhǎng)時(shí)間才能運(yùn)行，但顯然這里有些奇怪。有什么建議，特別是

2018-10-10 11:02:39

【HarmonyOS IPC 試用連載】視頻多光譜相機(jī)

項(xiàng)目名稱：視頻多光譜相機(jī)試用計(jì)劃：申請(qǐng)理由：用于調(diào)研多光譜相機(jī)研發(fā)可行性調(diào)研項(xiàng)目名稱：視頻多光譜相機(jī)項(xiàng)目計(jì)劃：該項(xiàng)目屬于長(zhǎng)光光機(jī)所，我們想基于國(guó)產(chǎn)平臺(tái)開(kāi)發(fā)一款視頻多光譜相機(jī)，用于光譜探測(cè)，海思平臺(tái)

2020-09-24 16:59:55

【無(wú)線充電模塊試用體驗(yàn)】WIFI Music Receiver+無(wú)線充電模塊可行性驗(yàn)證

首先我在這里要感謝ElecFans福利妹和深圳市安浩芯科技有限公司，感謝他們給我了這么一個(gè)寶貴的試用機(jī)會(huì)，讓我有機(jī)會(huì)去驗(yàn)證WIFI Music Receiver+無(wú)線充電模塊的可行性。根據(jù)這幾

2016-01-15 16:16:27

關(guān)于PWM波+MOS管+H橋驅(qū)動(dòng)增大輸入電壓范圍的可行性？

7.2V（實(shí)際有偏差），所以淘寶上驅(qū)動(dòng)板大部分輸入電壓范圍為6V-10V左右。有沒(méi)有在此基礎(chǔ)上改良電路增加輸入電壓范圍的可能？就從網(wǎng)上參考了一些H橋驅(qū)動(dòng)電路，設(shè)計(jì)了下面這個(gè)電路，各位大佬看看有沒(méi)有可行性?

2019-07-05 11:20:05

動(dòng)態(tài)Flash的可行性

【3-5分鐘閱讀】【動(dòng)態(tài)Flash的可行性】新加坡公司Unisantis上月發(fā)表了一篇論文，描述了對(duì)"動(dòng)態(tài)閃存（DFM）"的研究，這是一種混合設(shè)備，結(jié)合了動(dòng)態(tài)RAM和Flash

2021-07-26 07:16:48

原創(chuàng)：汽車充電寶的可行性----文寶玉西恩迪

配合充電寶的插頭。2. 汽車的BMS要能夠與充電寶溝通。希望通過(guò)這篇文章拋磚引玉，大家討論汽車充電寶的可行性。本文作者為文寶玉，電源村電池群群主，上海西恩迪蓄電池有限公司北亞區(qū)總監(jiān)

2016-03-11 14:09:04

可否用labview搭建電池模型？

想用labview模擬光伏儲(chǔ)能系統(tǒng) 查閱文獻(xiàn)也沒(méi)有找到相關(guān)模型更多的是用simulink仿真想問(wèn)下用labview軟件搭建儲(chǔ)能電池模型的可行性 如果可以思路是什么？謝謝各位

2015-05-07 13:07:23

在FPGA中實(shí)現(xiàn)HDMI，DVI和DisplayPort輸入的可行性

我研究了在設(shè)計(jì)中實(shí)現(xiàn)HDMI，DVI和Displayport的可行性。在這種設(shè)計(jì)中，F(xiàn)PGA將具有用于HDMI，DVI和DisplayPort的接收器，以接收來(lái)自外部源的信號(hào)。現(xiàn)在我不確定以下

2019-02-19 10:09:29

在商業(yè)可行性上取得突破的能量收集

能量收集：在商業(yè)可行性上取得突破

2019-05-29 11:59:24

基于ZigBee網(wǎng)絡(luò)的語(yǔ)音應(yīng)急通信可行性研究

 基于ZigBee網(wǎng)絡(luò)的語(yǔ)音應(yīng)急通信可行性研究簡(jiǎn)要介紹ZigBee無(wú)線網(wǎng)絡(luò)技術(shù)以及電信行業(yè)通話質(zhì)量的評(píng)估標(biāo)準(zhǔn)。通過(guò)仿真模擬，對(duì)ZigBee無(wú)線信道上的VoIP和PTT兩種語(yǔ)音通信

2009-09-19 09:25:14

大型平行光管像質(zhì)實(shí)時(shí)監(jiān)測(cè)的可行性論證

針對(duì)目前大型平行光管成像質(zhì)量監(jiān)測(cè)的現(xiàn)狀,本文提出了一種對(duì)平行光管進(jìn)行實(shí)時(shí)監(jiān)測(cè)的新方法,驗(yàn)證了這種監(jiān)測(cè)方法的可行性。該方法根據(jù)光管自準(zhǔn)檢測(cè)原理,采用小平面鏡對(duì)光管像質(zhì)進(jìn)行實(shí)時(shí)監(jiān)測(cè),計(jì)算了在一個(gè)焦深

2010-05-13 09:04:36

如何去測(cè)試微波電磁環(huán)境測(cè)試系統(tǒng)的可行性？

微波電磁環(huán)境測(cè)試系統(tǒng)是由哪些部分組成的？如何去測(cè)試微波電磁環(huán)境測(cè)試系統(tǒng)的可行性？

2021-05-25 06:11:15

定速空調(diào)改為變頻空調(diào)的可行性。

定速空調(diào)改為變頻空調(diào)的可行性。有網(wǎng)友能提供技術(shù)方案，供相互探討？

2009-05-21 18:39:02

小女子求大家指教~怎樣驗(yàn)證電弧模型的伏安特性呢？

想問(wèn)下大家：我建了一個(gè)電弧模型(直流空氣電弧，伏安特性應(yīng)該是下降的），現(xiàn)在就想簡(jiǎn)單的驗(yàn)證模型的可行性，怎樣可以簡(jiǎn)單驗(yàn)證一下它輸出的伏安特性曲線呢？是用脈沖高壓接電??？還是用直流維弧電路接電弧負(fù)載呢？

2013-01-02 16:02:25

怎么實(shí)現(xiàn)自制虛擬儀器的可行性、經(jīng)濟(jì)性、快速性和便攜性？

本文詳細(xì)介紹了自行設(shè)計(jì)適合自身需要的虛擬儀器的全過(guò)程。實(shí)現(xiàn)了自制虛擬儀器的可行性、經(jīng)濟(jì)性、快速性和便攜性。

2021-04-15 06:16:12

怎樣去解決ESP8266通過(guò)AT接口實(shí)現(xiàn)modbus TCP slaver可行性的問(wèn)題

的可行性：方法一：1 針對(duì)esp32的源碼工程添加ModbusTCP工程，4種寄存器的起始地址和數(shù)量通過(guò)AT指令參數(shù)實(shí)現(xiàn)。2 設(shè)計(jì)對(duì)應(yīng)的自定義AT接口，包括配置的IP地址端口，超時(shí)時(shí)間，4種寄存器定義

2022-08-16 11:23:45

想抄一塊開(kāi)關(guān)電源，不知道操作上有沒(méi)有可行性?

設(shè)備上有塊開(kāi)關(guān)電源板，是特制的想直接讓抄板公司抄出來(lái)，變壓器，電感也抄，不知道操作上有沒(méi)有可行性?

2015-06-04 12:45:44

探討貼片功率電感封裝尺寸升級(jí)的可行性gujing

探討貼片功率電感封裝尺寸升級(jí)的可行性gujing編輯：谷景電子貼片功率電感是市場(chǎng)需求增長(zhǎng)非?？斓囊环N電感類型，市場(chǎng)對(duì)貼片功率電感的需求我們大致可以將其分為兩種類型：一是對(duì)常規(guī)類型的貼片功率電感

2023-02-22 16:45:27

有源頻率表面用于電磁兼容的可行性結(jié)論探討

能量每年增長(zhǎng)7% ~ 14% ，也就是說(shuō)25 年電磁能量密度最高可增加26 倍，50 年可增加700 倍，21 世紀(jì)電磁環(huán)境日益惡化。在這種復(fù)雜的電磁環(huán)境中，如何減少相互間的電磁干擾，使各種設(shè)備正常運(yùn)轉(zhuǎn)，即電磁兼容，是一個(gè)亟待解決的問(wèn)題。本論文將通過(guò)有源頻率表面用于電磁兼容的可行性，并給出相關(guān)結(jié)論。　

2019-07-25 06:13:22

松靈新品丨全球首款多模態(tài)?ROS開(kāi)發(fā)平臺(tái)LIMO來(lái)了，將聯(lián)合古月居打造精品課程精選資料分享

多地形通過(guò)性和多場(chǎng)景的適應(yīng)性一直是無(wú)人駕駛、機(jī)器人等場(chǎng)景化所需要突破的難題。通過(guò)多模態(tài)運(yùn)動(dòng)融合，提高跨維度運(yùn)動(dòng)的柔性適應(yīng)能力是一種理想的解決方式，這決定了機(jī)器人和移動(dòng)平臺(tái)未來(lái)應(yīng)用場(chǎng)景開(kāi)拓的深度和廣度

2021-08-30 08:39:33

檢測(cè)大功率LED燈電流求可行性的方案

樓主一個(gè)朋友做大功率LED，最近想做一個(gè)檢測(cè)LED的電流的小東西，采集電能等參數(shù)，通過(guò)433或GPRS無(wú)線發(fā)送出去,以此判斷燈的好壞，要求小型化。求可行性的方案，關(guān)鍵是盡量小型化，穩(wěn)定可靠。

2019-03-21 03:06:13

淺析EDA技術(shù)應(yīng)用于電子設(shè)計(jì)競(jìng)賽的可行性精選資料推薦

電子設(shè)計(jì)競(jìng)賽的可行性2.1 學(xué)生具備了一定的計(jì)算機(jī)操作基礎(chǔ)。現(xiàn)在的學(xué)生從小學(xué)、初中開(kāi)始就學(xué)習(xí)電腦知識(shí)，他們擁有...

2021-07-19 08:04:19

用電容替代傳統(tǒng)蓄電池的可行性

各位大神小弟初來(lái)乍到，有一個(gè)問(wèn)題一直困惑不解，作為電容這樣的儲(chǔ)能元件，在某種意義上說(shuō)是可以充當(dāng)電池使用的，在一些電路中也有這樣的應(yīng)用（小型時(shí)鐘電路），小弟有這樣一個(gè)設(shè)想不知可否用電容替代一些小型便攜設(shè)備的電源，比如mp3、手機(jī)之類的，是否具有可行性。求各位大神指點(diǎn)

2013-08-11 18:21:10

簡(jiǎn)單的模型進(jìn)行流固耦合的模態(tài)分析

　　本次分享，對(duì)一個(gè)簡(jiǎn)單的模型進(jìn)行流固耦合的模態(tài)分析，有限元科技小編主要給大家演示如何使用Hypermesh與Nastran對(duì)流固耦合的結(jié)構(gòu)進(jìn)行模態(tài)分析，以及了解聲腔對(duì)結(jié)構(gòu)模態(tài)的影響?！　∩钲谑?/div>

2020-07-07 17:15:39

航空電子設(shè)備PCB組件的實(shí)驗(yàn)模態(tài)分析

、識(shí)別結(jié)果驗(yàn)證4 個(gè)步驟得到系統(tǒng)的模態(tài)參數(shù)：固有頻率、振型、模態(tài)阻尼等。實(shí)驗(yàn)模態(tài)分析的結(jié)果經(jīng)常被用來(lái)檢驗(yàn)有限元分析模型的有效性和正確性。為了檢驗(yàn)本文所建立的對(duì)象PCB 組件的有限元分析模型的有效性

2018-09-13 16:40:12

請(qǐng)教使用 Hyperlink 操作遠(yuǎn)端 QM 隊(duì)列的可行性

使用QMSS 的pdsp 產(chǎn)生的中斷來(lái)操作，在本端dsp直接將描述符寫(xiě)入遠(yuǎn)端的 RXQ，然后pdsp就會(huì)觸發(fā)中斷了。只要描述符寫(xiě)到了rxq應(yīng)該就不用擔(dān)心丟失的問(wèn)題了。? 這個(gè)方案應(yīng)該可行但我不確定

2018-06-21 00:03:52

路面檢測(cè)方案比較及可行性分析

路面檢測(cè)方案比較及可行性分析　　環(huán)境圖像采集部分可以采用陣列紅外探頭和CCD或CMOS圖像傳感器來(lái)實(shí)現(xiàn)，前者的特點(diǎn)是價(jià)格低廉、電路簡(jiǎn)單、應(yīng)用方便，缺點(diǎn)是性能有限，對(duì)復(fù)雜環(huán)境的適應(yīng)能力較弱，效果較差

2011-07-12 15:26:33

轉(zhuǎn)：KBOOT實(shí)現(xiàn)加載加密可行性文件

inetis系列MCU都具有secure功能，可防止代碼被外部調(diào)試器被惡意讀取或者破解，而在本文中將介紹如何在secure狀態(tài)下，利用實(shí)現(xiàn)加載加密可行性文件的過(guò)程，這也是KBOOT v2.0新功能，BB到這吧，上文檔。

2016-08-22 15:19:29

運(yùn)放并聯(lián)的可行性并聯(lián)運(yùn)放可以獲得雙倍輸出電流嗎？

運(yùn)放并聯(lián)的可行性并聯(lián)運(yùn)放以獲取雙倍輸出電流是可行的嗎？

2021-04-06 07:11:50

運(yùn)放并聯(lián)的可行性看了就知道

簡(jiǎn)析運(yùn)放并聯(lián)的可行性

2021-03-18 08:06:57

通過(guò)Virtex5 FPGA上的SATA連接將數(shù)據(jù)流式傳輸?shù)紿DD或SSD的可行性

全部：我目前正在探索通過(guò)Virtex 5 FPGA上的SATA連接將數(shù)據(jù)流式傳輸?shù)紿DD或SSD的可行性。我很難找到如何做到這一點(diǎn)的示例，或者它是否可行。到目前為止，我已經(jīng)找到

2020-06-02 06:28:15

三北區(qū)域電廠供熱改造可行性研究

三北區(qū)域電廠供熱改造可行性研究

2009-02-16 22:54:24

VxWorks在導(dǎo)彈武器測(cè)試發(fā)射控制領(lǐng)域的可行性應(yīng)用研究

嵌入式操作系統(tǒng)VxWorks在導(dǎo)彈武器測(cè)試發(fā)射控制領(lǐng)域的可行性應(yīng)用研究

2009-03-29 12:26:55

嵌人式飛行參數(shù)傳感系統(tǒng)的設(shè)計(jì)與可行性驗(yàn)證

嵌人式飛行參數(shù)傳感系統(tǒng)的設(shè)計(jì)與可行性驗(yàn)證摘要: 簡(jiǎn)要介紹了嵌入式飛行參數(shù)傳感系統(tǒng)( F A D S ) 的空氣動(dòng)力學(xué)模型，并以美國(guó)的X - 3 3飛行器為例，詳細(xì)描述了該系統(tǒng)的算

2009-05-07 10:40:57

6L2K壓縮機(jī)機(jī)身裂紋修復(fù)的可行性分析

6L2K壓縮機(jī)機(jī)身裂紋修復(fù)的可行性分析

2009-05-20 14:39:55

投資項(xiàng)目可行性研究視頻教程

投資項(xiàng)目可行性研究視頻教程

2009-07-15 08:12:28

基于貪心算法的AGVS路徑規(guī)劃可行性判斷的研究

針對(duì)AGVS（自動(dòng)導(dǎo)引小車系統(tǒng)）柔性問(wèn)題的研究現(xiàn)狀，為了解決AGVS柔性可行性的判斷問(wèn)題，提出了一種處理因生產(chǎn)任務(wù)臨時(shí)調(diào)整而引起的AGV

2009-09-14 08:56:27

生產(chǎn)450mm(18英寸)硅晶圓的經(jīng)濟(jì)可行性

生產(chǎn)450 mm（18 英寸）硅晶圓的經(jīng)濟(jì)可行性——來(lái)自硅晶圓材料供應(yīng)廠商的呼聲鐘信1．前言根據(jù)歷史數(shù)據(jù)分析，晶圓尺寸的倍增轉(zhuǎn)換周期大約為11 年。第一條 200 mm 生產(chǎn)線投

2009-12-15 15:07:09

基于可行性區(qū)間數(shù)的模糊綜合決策模型

針對(duì)屬性權(quán)重難以用有效手段確定的多屬性決策問(wèn)題，本文在充分分析了概率區(qū)間和可行性區(qū)間的性質(zhì)之后，給出了一種決策模型。該模型先由概率區(qū)間得到初步的權(quán)重區(qū)間數(shù)，

2009-12-31 16:38:07

可行性研究在項(xiàng)目建設(shè)中的作用

可行性研究是建設(shè)前期工作的重要步驟，是編制建設(shè)項(xiàng)目設(shè)計(jì)任務(wù)書(shū)的依據(jù)。對(duì)建設(shè)項(xiàng)目進(jìn)行可行性研究是基本建設(shè)管理中的一項(xiàng)重要基礎(chǔ)工作，是保證建設(shè)項(xiàng)目以最小的投資換取

2010-01-12 15:09:31

AGVS路徑規(guī)劃可行性判斷的研究

針對(duì)AGVS(自動(dòng)導(dǎo)引小車系統(tǒng))柔性問(wèn)題的研究現(xiàn)狀，為了解決AGVS柔性可行性的判斷問(wèn)題，提出了一種處理因生產(chǎn)任務(wù)臨時(shí)調(diào)整而引起的AGVS路線調(diào)整的可行性判斷方法，并給出了該

2010-02-22 14:40:22

多載波3G收發(fā)機(jī)的可行性

　　本應(yīng)用筆記旨在闡明實(shí)現(xiàn)多載波3G收發(fā)機(jī)的可行性以及子系統(tǒng)的主要性能要求。　　一般框圖　　圖1給出了本文使用的一般框圖。雖然實(shí)際應(yīng)用有很多設(shè)計(jì)變化

2010-12-07 11:05:01

933

多載波WCDMA的可行性研究及性能要求

摘要本應(yīng)用筆記旨在闡明實(shí)現(xiàn)多載波3G收發(fā)機(jī)的可行性以及子系統(tǒng)的主要性能要求。一般框圖圖1給出了本文使用的一般框圖。雖然實(shí)際應(yīng)用有很多設(shè) 計(jì)變化，但是該架構(gòu)基本體現(xiàn)了

2011-03-28 16:15:06

農(nóng)村電網(wǎng)配電模式改造的可行性論證

本文分析了我國(guó) 農(nóng)村電網(wǎng) 結(jié)構(gòu)現(xiàn)狀，建立農(nóng)村電網(wǎng)費(fèi)用數(shù)學(xué)模型。結(jié)合抵償年限法，建立農(nóng)網(wǎng)電壓制式改造數(shù)學(xué)模型，進(jìn)行農(nóng)村電網(wǎng)配電模式改造的可行性分析。

2011-06-30 18:00:29

船載USB系統(tǒng)跟蹤數(shù)傳信號(hào)可行性研究

討論了一種船載USB系統(tǒng)跟蹤數(shù)傳信號(hào)可行性的方案，為實(shí)現(xiàn)船載USB系統(tǒng)對(duì)飛船目標(biāo)跟蹤功能的備份提供了一個(gè)新的思路，該方案通過(guò)切換船載USB系統(tǒng)中跟蹤接收機(jī)軟件狀態(tài)的方式來(lái)實(shí)現(xiàn)

2012-04-12 14:35:38

LED路燈取代傳統(tǒng)照明的可行性評(píng)估與測(cè)量結(jié)果

隨著LED的發(fā)光效率與壽命提升，加上具備省電、節(jié)能以及環(huán)保的優(yōu)勢(shì)，LED在路燈的應(yīng)用上取代傳統(tǒng)燈飾照明的可行性大為提升。在LED技術(shù)快速成長(zhǎng)、產(chǎn)品特性不斷改良下，LED路燈的示范

2012-05-28 11:08:03

1119

[5.1.7]--5.7內(nèi)存計(jì)算的可行性

大數(shù)據(jù)

jf_75936199發(fā)布于 2023-03-07 01:24:49

局部放電檢測(cè)用D_dot探頭的可行性研究

局部放電檢測(cè)用D_dot探頭的可行性研究_秦冰陽(yáng)

2016-12-28 14:24:14

智能車模雙電機(jī)差速控制的可行性研究

智能車模雙電機(jī)差速控制的可行性研究

2017-12-11 16:21:22

幾款小巧好用的C語(yǔ)言編輯器

近期有一些新關(guān)注的伙伴在后臺(tái)經(jīng)常留言剛?cè)腴T(mén)C語(yǔ)言我該選擇什么C語(yǔ)言編輯器好呢？都說(shuō)欲善其事必先利其器，網(wǎng)絡(luò)上也有很多不同類型的編輯器，讓人很難進(jìn)行抉擇！C語(yǔ)言編輯器選擇哪個(gè)好？

2018-08-21 15:06:11

39957

探析5G網(wǎng)絡(luò)共享的可行性和難點(diǎn)

在由FuTURE推進(jìn)委員會(huì)主辦的"2018未來(lái)信息通信技術(shù)國(guó)際研討會(huì)"上，中國(guó)電信技術(shù)部副總經(jīng)理沈少艾在會(huì)上講述了網(wǎng)絡(luò)共享的可行性和難點(diǎn)。

2018-11-30 10:10:09

4155

模型編輯器中的PCB SI IOCell編輯器有什么用

Allegro PCB SI環(huán)境中目前有多種模型編輯選項(xiàng)。這些包括PCB SI和SigXplorer環(huán)境中的傳統(tǒng)對(duì)話框。雖然這些對(duì)話框提供圖形編輯，但它們通過(guò)多個(gè)級(jí)別級(jí)聯(lián)，默認(rèn)為某些模型類型的文本編輯。目標(biāo)是為所有應(yīng)用程序提供模型編輯和驗(yàn)證的單一環(huán)境，并替換模型完整性和舊對(duì)話框。

2019-09-01 09:53:06

3554

衛(wèi)星無(wú)線電頻率使用可行性論證辦法詳細(xì)解讀

工業(yè)和信息化部近日印發(fā)《衛(wèi)星無(wú)線電頻率使用可行性論證辦法（試行）》，為加強(qiáng)和規(guī)范衛(wèi)星無(wú)線電頻率資源使用的可行性論證工作，科學(xué)有效利用衛(wèi)星無(wú)線電頻率資源而制定。

2020-01-14 09:35:10

747

AN-807: 多載波WCDMA的可行性

AN-807: 多載波WCDMA的可行性

2021-03-21 02:13:27

簡(jiǎn)析運(yùn)放并聯(lián)的可行性資料下載

電子發(fā)燒友網(wǎng)為你提供簡(jiǎn)析運(yùn)放并聯(lián)的可行性資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。

2021-04-09 08:51:20

多載波cdma2000可行性研究

2021-04-19 13:46:50

總線分析儀市場(chǎng)發(fā)展前景及投資可行性分析報(bào)告

總線分析儀市場(chǎng)發(fā)展前景及投資可行性分析報(bào)告說(shuō)明。

2021-04-20 14:31:46

面向ADHD患者的手部運(yùn)動(dòng)數(shù)據(jù)可行性研究

面向ADHD患者的手部運(yùn)動(dòng)數(shù)據(jù)可行性研究

2021-06-25 16:17:54

基于預(yù)訓(xùn)練視覺(jué)-語(yǔ)言模型的跨模態(tài)Prompt-Tuning

、新加坡國(guó)立大學(xué) 鏈接：https://arxiv.org/pdf/2109.11797.pdf 提取摘要預(yù)訓(xùn)練的視覺(jué)語(yǔ)言模型（VL-PTMs）在將自然語(yǔ)言融入圖像數(shù)據(jù)中顯示出有前景的能力，促進(jìn)

2021-10-09 15:10:42

2926

ACL2021的跨視覺(jué)語(yǔ)言模態(tài)論文之跨視覺(jué)語(yǔ)言模態(tài)任務(wù)與方法

來(lái)自：復(fù)旦DISC 引言本次分享我們將介紹三篇來(lái)自ACL2021的跨視覺(jué)語(yǔ)言模態(tài)的論文。這三篇文章分別介紹了如何在圖像描述任務(wù)中生成契合用戶意圖的圖像描述、端對(duì)端的視覺(jué)語(yǔ)言預(yù)訓(xùn)練模型和如何生成包含

2021-10-13 10:48:27

2230

Linux總線、設(shè)備、驅(qū)動(dòng)模型的探究

2022-02-14 12:01:22

NüWA多模態(tài)模型支持八大視覺(jué)生成與編輯任務(wù)

小編說(shuō)：“自然語(yǔ)言”正在越來(lái)越經(jīng)常地出現(xiàn)在我們的日常生活中。你有沒(méi)有想象過(guò)，我們有一天可以使用自然語(yǔ)言對(duì)視覺(jué)內(nèi)容進(jìn)行編輯?微軟亞洲研究院最新推出的多模態(tài)模型 NüWA，不僅讓視覺(jué)內(nèi)容創(chuàng)造多了一條路

2022-03-11 09:23:26

1235

多模態(tài)圖像合成與編輯方法

本篇綜述通過(guò)對(duì)現(xiàn)有的多模態(tài)圖像合成與編輯方法的歸納總結(jié)，對(duì)該領(lǐng)域目前的挑戰(zhàn)和未來(lái)方向進(jìn)行了探討和分析。

2022-08-23 09:12:19

978

多點(diǎn)支撐威邁斯新項(xiàng)目建設(shè)可行性十足

未來(lái)中國(guó)新能源車市場(chǎng)仍具有廣闊的市場(chǎng)空間。下游市場(chǎng)的廣闊發(fā)展前景，將為威邁斯項(xiàng)目新增產(chǎn)能的消化提供市場(chǎng)可行性。

2022-08-26 14:12:02

506

一個(gè)真實(shí)閑聊多模態(tài)數(shù)據(jù)集TikTalk

隨著大量預(yù)訓(xùn)練語(yǔ)言模型在文本對(duì)話任務(wù)中的出色表現(xiàn)，以及多模態(tài)的發(fā)展，在對(duì)話中引入多模態(tài)信息已經(jīng)引起了大量學(xué)者的關(guān)注。

2023-02-09 09:31:26

1166

利用大語(yǔ)言模型做多模態(tài)任務(wù)

大型語(yǔ)言模型LLM（Large Language Model）具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。

2023-05-10 16:53:15

701

邱錫鵬團(tuán)隊(duì)提出SpeechGPT：具有內(nèi)生跨模態(tài)能力的大語(yǔ)言模型

雖然現(xiàn)有的級(jí)聯(lián)方法或口語(yǔ)語(yǔ)言模型能夠感知和生成語(yǔ)音，但仍存在一些限制。首先，在級(jí)聯(lián)模型中，LLM 僅充當(dāng)內(nèi)容生成器。由于語(yǔ)音和文本的表示沒(méi)有對(duì)齊，LLM 的知識(shí)無(wú)法遷移到語(yǔ)音模態(tài)中。

2023-05-22 10:19:29

382

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

大型語(yǔ)言模型（LLM）在各種自然語(yǔ)言處理任務(wù)上表現(xiàn)出驚人的能力。與此同時(shí)，多模態(tài)大型語(yǔ)言模型，如 GPT-4、PALM-E 和 LLaVA，已經(jīng)探索了 LLM 理解多模態(tài)信息的能力。然而，當(dāng)前

2023-05-22 14:38:06

417

基于預(yù)訓(xùn)練模型和語(yǔ)言增強(qiáng)的零樣本視覺(jué)學(xué)習(xí)

在一些非自然圖像中要比傳統(tǒng)模型表現(xiàn)更好 CoOp 增加一些 prompt 會(huì)讓模型能力進(jìn)一步提升怎么讓能力更好？可以引入其他知識(shí)，即其他的預(yù)訓(xùn)練模型，包括大語(yǔ)言模型、多模態(tài)模型也包括

2023-06-15 16:36:11

277

單張消費(fèi)級(jí)顯卡微調(diào)多模態(tài)大模型

把大模型的訓(xùn)練門(mén)檻打下來(lái)！我們?cè)趩螐埾M(fèi)級(jí)顯卡上實(shí)現(xiàn)了多模態(tài)大模型（LaVIN-7B, LaVIN-13B）的適配和訓(xùn)練

2023-06-30 10:43:28

1173

AI大模型的的三個(gè)發(fā)展階段

AI大模型可分為自然語(yǔ)言處理大模型，CV大模型、科學(xué)計(jì)算大模型等。AI大模型支持的模態(tài)更加多樣，從支持文本、圖片、圖像、語(yǔ)音單一模態(tài)下的單一任務(wù)，逐漸發(fā)展為支持多種模態(tài)下的多種任務(wù)。

2023-07-06 12:31:56

1386

VisCPM：邁向多語(yǔ)言多模態(tài)大模型時(shí)代

隨著 GPT-4 和 Stable Diffusion 等模型多模態(tài)能力的突飛猛進(jìn)，多模態(tài)大模型已經(jīng)成為大模型邁向通用人工智能（AGI）目標(biāo)的下一個(gè)前沿焦點(diǎn)?？傮w而言，面向圖像和文本的多模態(tài)生成能力

2023-07-10 10:05:01

409

更強(qiáng)更通用：智源「悟道3.0」Emu多模態(tài)大模型開(kāi)源，在多模態(tài)序列中「補(bǔ)全一切」

當(dāng)前學(xué)界和工業(yè)界都對(duì)多模態(tài)大模型研究熱情高漲。去年，谷歌的 Deepmind 發(fā)布了多模態(tài)視覺(jué)語(yǔ)言模型 Flamingo ，它使用單一視覺(jué)語(yǔ)言模型處理多項(xiàng)任務(wù)，在多模態(tài)大模型領(lǐng)域保持較高

2023-07-16 20:45:02

379

船載USB系統(tǒng)跟蹤數(shù)傳信號(hào)可行性研究

電子發(fā)燒友網(wǎng)站提供《船載USB系統(tǒng)跟蹤數(shù)傳信號(hào)可行性研究.pdf》資料免費(fèi)下載

2023-10-24 10:51:15

車用LED照明的可行性和先進(jìn)性

電子發(fā)燒友網(wǎng)站提供《車用LED照明的可行性和先進(jìn)性.doc》資料免費(fèi)下載

2023-11-15 10:59:11

大模型+多模態(tài)的3種實(shí)現(xiàn)方法

我們知道，預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就，然而其明顯的劣勢(shì)是不支持其他模態(tài)（包括圖像、語(yǔ)音、視頻模態(tài)）的輸入和輸出，那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息，讓其變得更強(qiáng)大、更通用呢？本節(jié)將介紹“大模型+多模態(tài)”的3種實(shí)現(xiàn)方法。

2023-12-13 13:55:04

530

從Google多模態(tài)大模型看后續(xù)大模型應(yīng)該具備哪些能力

前段時(shí)間Google推出Gemini多模態(tài)大模型，展示了不凡的對(duì)話能力和多模態(tài)能力，其表現(xiàn)究竟如何呢？

2023-12-28 11:19:52

361

自動(dòng)駕駛和多模態(tài)大語(yǔ)言模型的發(fā)展歷程

多模態(tài)大語(yǔ)言模型(MLLM) 最近引起了廣泛的關(guān)注，其將 LLM 的推理能力與圖像、視頻和音頻數(shù)據(jù)相結(jié)合，通過(guò)多模態(tài)對(duì)齊使它們能夠更高效地執(zhí)行各種任務(wù)，包括圖像分類、將文本與相應(yīng)的視頻對(duì)齊以及語(yǔ)音檢測(cè)。

2023-12-28 11:45:21

151

機(jī)器人基于開(kāi)源的多模態(tài)語(yǔ)言視覺(jué)大模型

ByteDance Research 基于開(kāi)源的多模態(tài)語(yǔ)言視覺(jué)大模型 OpenFlamingo 開(kāi)發(fā)了開(kāi)源、易用的 RoboFlamingo 機(jī)器人操作模型，只用單機(jī)就可以訓(xùn)練。

2024-01-19 11:43:08

106

韓國(guó)Kakao宣布開(kāi)發(fā)多模態(tài)大語(yǔ)言模型“蜜蜂”

韓國(guó)互聯(lián)網(wǎng)巨頭Kakao最近宣布開(kāi)發(fā)了一種名為“蜜蜂”(Honeybee)的多模態(tài)大型語(yǔ)言模型。這種創(chuàng)新模型能夠同時(shí)理解和處理圖像和文本數(shù)據(jù)，為更豐富的交互和查詢響應(yīng)提供了可能性。

2024-01-19 16:11:20

221

Sora爆紅，多模態(tài)大模型是下一發(fā)展階段

“大語(yǔ)言模型為 AI 產(chǎn)業(yè)帶來(lái)新的生機(jī)，然而語(yǔ)言模型的應(yīng)用場(chǎng)景有限。要全面打開(kāi)生成式 AI 的想象力，還是要依托多模態(tài)大模型。”IDC 中國(guó)研究總監(jiān)盧言霞近日表示。Sora在文生視頻領(lǐng)域真正邁出

2024-02-20 16:13:26

159

已全部加載完成

搜索歷史

探究編輯多模態(tài)大語(yǔ)言模型的可行性

評(píng)論