Llama2的技術(shù)細(xì)節(jié)探討分析

寫在前面

大家好，我是劉聰NLP。

昨天MetaAI開源了Llama2模型，我只想說一句：“「MetaAI改名叫OpenAI吧！」”

Llama2不僅開源了預(yù)訓(xùn)練模型，而且還開源了利用對話數(shù)據(jù)SFT后的Llama2-Chat模型，并對Llama2-Chat模型的微調(diào)進(jìn)行了詳細(xì)的介紹。

開源模型目前有7B、13B、70B三種尺寸，預(yù)訓(xùn)練階段使用了2萬億Token，SFT階段使用了超過10w數(shù)據(jù)，人類偏好數(shù)據(jù)超過100w。

非常自信的MetaAI。啥也不說，上來先show一副評估對比圖，我就問OpenAI你服不服，skr。

等等黨不用著急，雖然中文占比只有0.13%，但后續(xù)會有一大推中文擴(kuò)充詞表預(yù)訓(xùn)練&領(lǐng)域數(shù)據(jù)微調(diào)的模型被國人放出。

這不Github一搜，已經(jīng)有很多人占坑了，這是“有卡者的勝利”。

下面簡要記錄Llama2的技術(shù)細(xì)節(jié)。

預(yù)訓(xùn)練階段

模型結(jié)構(gòu)為Transformer結(jié)構(gòu)，與Llama相同的是采用RMSNorm歸一化、SwiGLU激活函數(shù)、RoPE位置嵌入、詞表的構(gòu)建與大小，與Llama不同的是增加GQA（分組查詢注意力），擴(kuò)增了模型輸入最大長度，語料庫增加了40%。

訓(xùn)練超參數(shù)如下：AdamW優(yōu)化器的β1、β2和eps分別為0.9、0.95和10e-5，采用cosin學(xué)習(xí)率，預(yù)熱2000步后進(jìn)行學(xué)習(xí)率衰減，最終降至峰值的10%，權(quán)重衰減系數(shù)為0.1，梯度裁剪值為1.0。

但請注意：7b和13b模型并沒有增加GQA?。?！

預(yù)訓(xùn)練階段的損失如下圖所示，可以看出，模型其實(shí)還沒有完全收斂。

預(yù)訓(xùn)練模型效果一句話總結(jié)：「開源第一，閉源一個(gè)沒打過?！?/strong>

?

微調(diào)階段

上面預(yù)訓(xùn)練模型沒打過你OpenAI沒關(guān)系，你先等我全流程走完。

SFT

「Data Quality Is All You Need?！?/strong> MetaAI進(jìn)行實(shí)驗(yàn)時(shí)發(fā)現(xiàn)，少量高質(zhì)量數(shù)據(jù)集訓(xùn)練模型的效果，要好于大量低質(zhì)量數(shù)據(jù)集的訓(xùn)練效果。因此以后SFT時(shí)候，不要一味地追求量，質(zhì)更重要。

微調(diào)時(shí)初始學(xué)習(xí)率為2e?5，并采用余弦學(xué)習(xí)率下降，權(quán)重衰減為0.1，訓(xùn)練批次大小為64，最大長度為4096。為了提高模型訓(xùn)練效率，將多組數(shù)據(jù)進(jìn)行拼接，盡量填滿4096，每條數(shù)據(jù)直接用停止符隔開，計(jì)算loss時(shí)僅計(jì)算每條樣本target內(nèi)容的loss。

RM

對于人類偏好數(shù)據(jù)的收集，重點(diǎn)關(guān)注模型回復(fù)的有用性和安全性，通過選擇對比兩個(gè)模型結(jié)果獲??；不過除了選擇一個(gè)更好的結(jié)果之外，還需要對選擇的答案標(biāo)記偏好程度，例如：明顯更好，更好，稍微更好、可以忽略地更好或者不確定。在安全性上，對兩個(gè)結(jié)果會標(biāo)記都符合安全性、只有一個(gè)復(fù)合安全性、都不符合安全性，以此收集安全性數(shù)據(jù)。

在模型迭代過程中，獎勵模型所需的偏好數(shù)據(jù)，需要迭代收集，具體如下。

獎勵模型是對提示生成的回復(fù)生成一個(gè)標(biāo)量分值，評價(jià)模型生成質(zhì)量，但發(fā)現(xiàn)有用性和安全性很難在同一個(gè)獎勵模型表現(xiàn)都很好，因此，獨(dú)立訓(xùn)練了兩個(gè)獎勵模型，一個(gè)針對有用性（helpfulness）進(jìn)行了優(yōu)化，另一個(gè)針對安全性（safety）進(jìn)行了優(yōu)化。

獎勵模型的初始化來自于pretrained chat model檢查點(diǎn)，將下一個(gè)Token預(yù)測分類器替換成標(biāo)量獎勵值回歸器。訓(xùn)練時(shí)，采用帶有邊際約束的二元排序損失，如下：

邊際約束開源提高獎勵模型的準(zhǔn)確性。并且為了獎勵模型可以用有更好的泛化，防止出現(xiàn)獎勵黑客現(xiàn)象（例如Llama2-Chat利用了獎勵模型的弱點(diǎn)，在表現(xiàn)不佳的情況下夸大獎勵分?jǐn)?shù)），在獎勵模型訓(xùn)練過程中，還加入了部分開源人類偏好數(shù)據(jù)。

訓(xùn)練參數(shù)設(shè)置：70B模型的最大學(xué)習(xí)率為5e?6，其余模型的最大學(xué)習(xí)率為1e?5，采用余弦學(xué)習(xí)率下降，最低到最大學(xué)習(xí)率的10%，并采用總步數(shù)的3%進(jìn)行預(yù)熱（最少5步），訓(xùn)練批次大小為1024。

不同獎勵模型在不同數(shù)據(jù)上的效果如下表所示。

發(fā)現(xiàn)獎勵模型對明顯更好的數(shù)據(jù)效果更突出，對可以忽略地更好或者不確定的數(shù)據(jù)表現(xiàn)較差。

并且研究了獎勵模型在數(shù)據(jù)和模型大小方面的縮放趨勢，在數(shù)據(jù)逐步增大的同時(shí)，效果也在逐步提高。

Iterative Fine-Tuning

隨著收到更多批次的人類偏好數(shù)據(jù)，能夠訓(xùn)練更好的獎勵模型并收集更多提示。因此，訓(xùn)練了五個(gè)連續(xù)版本的RLHF模型（RLHF-v1到RLHF-v5）。

主要訓(xùn)練策略包括：

最近策略優(yōu)化（PPO）:標(biāo)準(zhǔn)強(qiáng)化學(xué)習(xí)算法

拒絕采樣微調(diào)：模型輸出時(shí)采樣K個(gè)結(jié)果，選擇獎勵值最高的一個(gè)，在強(qiáng)化學(xué)習(xí)階段進(jìn)行梯度更新。

在RLHF-v4之前，只使用拒絕采樣微調(diào)，之后將兩者順序結(jié)合起來。但主要只有70B模型進(jìn)行了拒絕采樣微調(diào)，而其他小模型的微調(diào)數(shù)據(jù)來自于大模型拒絕采樣數(shù)據(jù)，相當(dāng)于用大模型蒸餾小模型。

在模型進(jìn)行強(qiáng)化學(xué)習(xí)的獎勵值由有用性獎勵值和安全性獎勵值組合產(chǎn)生，具體計(jì)算如下：

訓(xùn)練參數(shù)設(shè)置：對于所有模型，采樣AdamW優(yōu)化器，其中β1、β2和eps分別為0.9、0.95和1e?5，權(quán)重衰減為0.1，梯度裁剪為1.0，學(xué)習(xí)率為恒定為1e?6。PPO訓(xùn)練時(shí)大批次為512，小批次為64，PPO裁剪閾值為0.2。對于7B和13B模型，設(shè)置KL懲罰系數(shù)為0.01，對于34B和70B模型，設(shè)置KL懲罰系數(shù)為0.005。所有模型進(jìn)行200到400次迭代訓(xùn)練。

多輪對話一致性

最初的RLHF模型在幾輪對話后忘記最初的指令，下圖(左)所示。為了解決這些限制，提出Ghost Attention方法（Gatt，其實(shí)是一個(gè)訓(xùn)練trick）來增強(qiáng)模型對指令的遵從。

假設(shè)多輪對話數(shù)據(jù)為 [u1,a1,...,un,an]，定義一條指令（inst），使得整個(gè)對話過程中都遵守該指令，然后將該指令綜合連接到對話的所有用戶消息，構(gòu)造為 [inst+u1,a1,...,inst+un,an]。為了避免語句不匹配的問題，在訓(xùn)練過程中，保留第一輪的提示，并將中間輪數(shù)的損失置為0。

總結(jié)

Llama2模型7b，13b，34b，70b都有，完全夠用，最期待的34b會暫緩放出。

國內(nèi)開源底座模型還是在6b、7b、13b等層次，33-34b才是剛需呀。

隨著開源可商用的模型越來越多，大模型社區(qū)會越來越繁華，是中小廠的福音。開源都是真英雄。

我愿從此跟隨MetaAI走Open開源AI路線。

編輯：黃飛

?

閱讀全文

函數(shù)(61194) 函數(shù)(61194)

OpenAI(5838) OpenAI(5838)

點(diǎn)贊收藏

掃一掃，分享給好友

復(fù)制鏈接分享

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

評論

查看更多

相關(guān)推薦

ARM公司公開下一代ARM架構(gòu)技術(shù)細(xì)節(jié)
ARM公司近日公開了新的ARMv8架構(gòu)的技術(shù)細(xì)節(jié)，這是首款包含64位指令集的ARM架構(gòu)。 ARMv8拓展了現(xiàn)有的32位ARMv7架構(gòu)，引入了64位處理技術(shù)，并擴(kuò)展了虛擬尋址。目前市場領(lǐng)先的內(nèi)核如Corte
2011-11-03 09:40:441543
全面揭秘藍(lán)牙4.0技術(shù)細(xì)節(jié)
雖然藍(lán)牙（Bluetooth）3.0都還尚未完全普及，Bluetooth SIG（藍(lán)牙技術(shù)聯(lián)盟，Bluetooth Special InterestGroup，后文簡稱BluetoothSIG）卻又
2014-12-03 13:39:2426052
分析師預(yù)言英特爾10納米技術(shù)細(xì)節(jié)
最近有位半導(dǎo)體產(chǎn)業(yè)分析師針對英特爾（Intel）將在下兩個(gè)制程世代使用的技術(shù)，提出了大膽且詳細(xì)的預(yù)測；如果他的預(yù)言成真，意味著芯片龍頭英特爾又將大幅超前其他半導(dǎo)體同業(yè)。
2015-04-24 11:33:51906
高通QC3.0的技術(shù)細(xì)節(jié)詳解
快充技術(shù)自推出以來一直好評連連，在現(xiàn)在這個(gè)大屏幕的手機(jī)時(shí)代，電池容量也隨之增加，手機(jī)充電的速度不能如同往日了，所以廠商紛紛研發(fā)新的充電技術(shù)，來提高消費(fèi)者的體驗(yàn)水平。
2016-04-21 13:41:0117414
一文解析UCIe技術(shù)細(xì)節(jié)
UCIe[4]是一種開放的行業(yè)標(biāo)準(zhǔn)互連，為異構(gòu)芯片間提供了高帶寬、低延遲、高電源效率和高性價(jià)比的封裝內(nèi)連接，以滿足整個(gè)計(jì)算系統(tǒng)的需求。
2022-10-10 09:33:492180
RISC-V 跑大模型（二）：LLaMA零基礎(chǔ)移植教程
這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環(huán)境里。
2023-07-17 16:16:20916
RISC-V 跑大模型（三）：LLaMA中文擴(kuò)展
這是RISC-V跑大模型系列的第三篇文章，前面我們?yōu)榇蠹医榻B了如何在RISC-V下運(yùn)行LLaMA，本篇我們將會介紹如何為LLaMA提供中文支持。
2023-07-17 17:15:47495
基于Llama2和OpenVIN打造聊天機(jī)器人
Llama 2是 Meta 發(fā)布了其最新的大型語言模型，Llama2 是基于 Transformer 的人工神經(jīng)網(wǎng)絡(luò)，以一系列單詞作為輸入，遞歸地預(yù)測下一個(gè)單詞來生成文本。
2023-08-06 11:06:30522
llama.cpp代碼結(jié)構(gòu)&調(diào)用流程分析
llama.cpp 的代碼結(jié)構(gòu)比較直觀，如下所示，為整體代碼結(jié)構(gòu)中的比較核心的部分的代碼結(jié)構(gòu)
2023-11-07 09:23:27753
大模型筆記之gem5運(yùn)行模型框架LLama介紹
LLama.cpp 支持x86，arm，gpu的編譯。
2024-01-22 09:10:16315
藍(lán)牙4.0技術(shù)細(xì)節(jié)揭秘
藍(lán)牙技術(shù)聯(lián)盟(SIG)宣布正式采用以低功耗技術(shù)為代表優(yōu)勢的藍(lán)牙核心規(guī)格4.0版本。
2011-01-13 10:22:342277
24伏直流電變壓為120V頻率為1000Hz的電路圖
我需要一個(gè)電路圖，直流24伏變壓為120v, 頻率達(dá)到1000Hz,電壓可調(diào)，頻率可調(diào)，具體的技術(shù)細(xì)節(jié)私聊電路有效的話，高額獎勵
2020-06-26 18:11:06
探討互聯(lián)網(wǎng)IPv6技術(shù)的發(fā)展與演進(jìn)
探討互聯(lián)網(wǎng)IPv6技術(shù)的發(fā)展與演進(jìn)
2021-05-25 06:56:02
探討和分析電容觸摸屏的電磁干擾問題
與大家探討和分析一下電容觸摸屏的電磁干擾問題
2021-05-11 07:14:37
探討工業(yè)以太網(wǎng)技術(shù)~（二）
。隨著技術(shù)的發(fā)展，工業(yè)以太網(wǎng)的關(guān)鍵技術(shù)正逐個(gè)被攻破，使工業(yè)以太網(wǎng)性能得到了較大的改善。在這我們從工業(yè)以太網(wǎng)的實(shí)時(shí)性和確定性，可靠性和穩(wěn)定性，安全性問題的解決方案和主要的通信協(xié)議來探討工業(yè)以太網(wǎng)技術(shù)
2014-12-15 14:29:50
探討智能視頻分析技術(shù)的應(yīng)用現(xiàn)狀與發(fā)展趨勢
智能視頻分析技術(shù)的應(yīng)用現(xiàn)狀如何？“”未來智能視頻分析技術(shù)的發(fā)展趨勢怎樣？
2021-06-03 06:44:16
H3C EPON技術(shù)白皮書
關(guān)鍵詞： FTTH FTTB FTTx EPON 技術(shù) 白皮書摘要：本文獻(xiàn)是關(guān)于EPON技術(shù)的介紹說明型文檔，目的在于說明EPON是一個(gè)什么技術(shù)、解決了什么問題。對EPON中的技術(shù)細(xì)節(jié)進(jìn)行簡單描述，可以幫助你了解EPON這種接入技術(shù)的特點(diǎn)。
2013-07-13 23:08:50
I2C通訊協(xié)議的相關(guān)資料推薦
廢話I2C其實(shí)肝的我挺難受的，通訊協(xié)議這種規(guī)范往往可以摳出很多的細(xì)節(jié)，看了波叔的文章《萬變不離其宗之I2C總線要點(diǎn)總結(jié)》，很詳細(xì)。我打賭我還不會I2C，因?yàn)樯婕暗胶芏?b class="flag-6" style="color: red">技術(shù)細(xì)節(jié)，在實(shí)際項(xiàng)目中...
2022-02-15 07:46:30
LED燈具對低壓驅(qū)動芯片的要求是什么
技術(shù)細(xì)節(jié)決定LED照明設(shè)計(jì)的內(nèi)容包括：LED光源的技術(shù)日趨成熟LED光源工作特點(diǎn) LED燈具對低壓驅(qū)動芯片的要求
2021-04-06 09:15:51
MCU的破解技術(shù)分析
MCU破解技術(shù)分析
2021-02-03 07:17:57
PeakVue振動分析技術(shù)是什么
PeakVue振動分析技術(shù)是什么
2021-12-20 07:27:44
【算能RADXA微服務(wù)器試用體驗(yàn)】Radxa Fogwise 1684X Mini 規(guī)格
ChatGLM2-6B、AIGC、Llama2、SAM、Whisper等超大參數(shù)模型還有一份詳細(xì)的英文的規(guī)格表：另外，算能RADXA微服務(wù)器服務(wù)器，還是大學(xué)生集成電路創(chuàng)新創(chuàng)業(yè)大賽之# 第八屆集創(chuàng)賽杯賽題目
2024-02-28 11:21:57
【飛騰派4G版免費(fèi)試用】仙女姐姐的嵌入式實(shí)驗(yàn)室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B
和語法規(guī)則，將這些詞匯串聯(lián)起來，形成一個(gè)完整的回答關(guān)于LLaMA及LLaMA.cpp LLaMA全稱是Large Language Model Meta AI，是由Meta AI研究人員發(fā)布的一個(gè)
2023-12-22 10:18:11
低功耗藍(lán)牙的技術(shù)細(xì)節(jié)
，而從屬設(shè)備只能根據(jù)主設(shè)備的要求進(jìn)行通信。相比傳統(tǒng)藍(lán)牙技術(shù)，低功耗藍(lán)牙技術(shù)所增加的一項(xiàng)新功能就是“廣播”功能。通過這項(xiàng)功能，從設(shè)備可以告知其需要向主設(shè)備發(fā)送數(shù)據(jù)。廣播消息還包括活動或測量值。技術(shù)細(xì)節(jié)
2018-12-22 10:58:05
使用nodemcu v2控制4個(gè)獨(dú)立LED燈條的方法
置于電路下方，以便于連接。如果需要，您可以使用 Nodemcu 旁邊的引腳。技術(shù)細(xì)節(jié)/組件1x Nodemcu V2 (cp2102) 4x IRLB8721 N 溝道 Mosfet5x 連接器2x 排針PCB
2022-09-13 07:26:17
關(guān)于無線流媒體技術(shù)探討，不看肯定后悔
關(guān)于無線流媒體技術(shù)探討，不看肯定后悔
2021-05-31 07:00:49
關(guān)于視頻字符疊加系統(tǒng)的探討與分析
關(guān)于視頻字符疊加系統(tǒng)的探討與分析
2021-06-04 06:52:57
如何在視頻工程中使用轉(zhuǎn)碼技術(shù)？
本文簡單介紹了視頻轉(zhuǎn)碼技術(shù)的定義、分類及實(shí)現(xiàn)手段，重點(diǎn)分析了如何在視頻工程中使用轉(zhuǎn)碼技術(shù)，包括轉(zhuǎn)碼技術(shù)的使用方式及其優(yōu)勢所在。分析了在流方式和文件方式下如何使用轉(zhuǎn)碼技術(shù)。通過對移動非線性編輯系統(tǒng)遠(yuǎn)程傳輸視頻數(shù)據(jù)和節(jié)目制作網(wǎng)絡(luò)素材集中上載兩個(gè)工程實(shí)例的分析，探討了轉(zhuǎn)碼系統(tǒng)工作的靈活性和通用性。
2021-06-02 07:06:20
容錯技術(shù)在電視臺播控系統(tǒng)中應(yīng)用的探討
容錯技術(shù)在電視臺播控系統(tǒng)中應(yīng)用的探討
2009-10-06 09:33:58
嵌入式系統(tǒng)設(shè)計(jì)時(shí)需要注意的技術(shù)要點(diǎn)和實(shí)現(xiàn)細(xì)節(jié)有哪些？
為什么需要safe mode？嵌入式系統(tǒng)設(shè)計(jì)時(shí)需要注意的技術(shù)要點(diǎn)和實(shí)現(xiàn)細(xì)節(jié)有哪些？
2021-04-25 08:49:22
應(yīng)用Bluetooth Smart技術(shù)的全套智能騎行設(shè)備的技術(shù)細(xì)節(jié)和應(yīng)用場景，不看肯定后悔
應(yīng)用Bluetooth Smart技術(shù)的全套智能騎行設(shè)備的技術(shù)細(xì)節(jié)和應(yīng)用場景，不看肯定后悔
2021-05-21 06:47:43
怎么在Xilinx FPGA上獲得JTAG詳細(xì)文檔的最佳位置
我想知道是否有人能指出一份文件，該文件為Xilinx FPGA中的JTAG操作提供了深入的技術(shù)細(xì)節(jié)。我正在考慮將自己的TAP控制器構(gòu)建到JTAG程序/更新FPGA。我還想了解Xilinx特定JTAG
2019-01-24 09:36:40
怎么實(shí)現(xiàn)精確電流測量？
要想實(shí)現(xiàn)精確的電流測量，需要了解電流檢測的原理及其技術(shù)細(xì)節(jié)。本文是電阻測試系列文章的第一部分，介紹了電流檢測的概念，并著重討論了電流檢測電阻的一般設(shè)置、選擇和實(shí)現(xiàn)。同時(shí)還特別分析了高精度電流檢測——四端子（開爾文）電流檢測的方法和四端子電流檢測電阻的選型。
2019-08-01 07:44:28
活性焊接工藝概述
如何建立一個(gè)超聲波烙鐵的技術(shù)細(xì)節(jié)。這種技術(shù)可以粘合難以焊接的金屬，如鈦以及玻璃和陶瓷。
2023-09-22 06:16:54
液晶顯示器鮮為人知的技術(shù)細(xì)節(jié)(全方面認(rèn)識LCD)
液晶顯示器鮮為人知的技術(shù)細(xì)節(jié)(全方面認(rèn)識LCD)液晶顯示器的專業(yè)技術(shù)知識彩色迷魂陣： 16.7/16.2百萬色的差異無可否認(rèn)，目前LCD顯示器成為CRT的繼任者已經(jīng)是大勢所趨，雖然目前CRT
2008-10-29 22:49:43
直流分析的簡單探討
直流分析的簡單探討1.目的.dc要求執(zhí)行電路的直流仿真（Hspice允許所有參數(shù)化的掃描分析如蜂巢狀掃描）.tf在直流操作點(diǎn)（.op）分析的基礎(chǔ)上，在直流偏壓點(diǎn)將電路線性化，以計(jì)算出電路的直流小信號轉(zhuǎn)移函數(shù)值，并存放于執(zhí)行輸出文件中.lis...
2021-11-17 07:05:30
簡單線性回歸代碼實(shí)現(xiàn)細(xì)節(jié)分析
機(jī)器學(xué)習(xí)100天-簡單線性回歸 [代碼實(shí)現(xiàn)細(xì)節(jié)分析]
2020-05-22 10:16:34
計(jì)算機(jī)維修與維護(hù)技術(shù)探討
故障。以下是學(xué)習(xí)啦小編為大家精心準(zhǔn)備的：計(jì)算機(jī)維修與維護(hù)技術(shù)探討相關(guān)論文。內(nèi)容僅供參考，歡迎閱讀!計(jì)算機(jī)維修與維護(hù)技術(shù)探討全文如下：摘要：隨著計(jì)算機(jī)應(yīng)用的普及和網(wǎng)絡(luò)的發(fā)展，給人們的工作和生活帶來很多方...
2021-09-08 07:10:19
軟體機(jī)器人學(xué)習(xí)問題探討
以軟體機(jī)器人為背景和主題，深入講解：(1) 軟體機(jī)器人的關(guān)節(jié)設(shè)計(jì)方法；(2) 有限元分析技巧；(3) 力學(xué)模型的建立方法； (4) 基于MATLAB與視覺識別技術(shù)的軟體手柔性抓取控制與實(shí)驗(yàn)等內(nèi)容
2019-08-12 15:09:17
緊急停車系統(tǒng)組態(tài)探討
緊急停車系統(tǒng)ESD( Emergency Shutdown Device)是90 年代發(fā)展起來的一種專用的安全保護(hù)設(shè)備。結(jié)合茂名石化緊急停車系統(tǒng)的應(yīng)用實(shí)際，著重介紹了緊急停車系統(tǒng)組態(tài)的主要內(nèi)容、技術(shù)細(xì)節(jié)及
2009-08-14 11:54:0011
緊急停車系統(tǒng)組態(tài)探討
緊急停車系統(tǒng)ESD( Emergency Shutdown Device)是90年代發(fā)展起來的一種專用的安全保護(hù)設(shè)備。結(jié)合茂名石化緊急停車系統(tǒng)的應(yīng)用實(shí)際，著重介紹了緊急停車系統(tǒng)組態(tài)的主要內(nèi)容、技術(shù)細(xì)節(jié)及
2010-07-21 10:10:047
硅整流裝置均流的分析與探討
本文從理論上通過分析晶閘管的物理機(jī)理，再通過采用脈沖工作方式進(jìn)行試驗(yàn)分析，對額定通態(tài)電流狀態(tài)下的均流系數(shù)進(jìn)行冷、熱態(tài)的對比分析與探討。最后針對電力機(jī)車硅整流裝
2010-08-03 15:43:430
分析探討白光LED光衰的原因
分析探討白光LED光衰的原因
2010-12-21 16:14:1642
數(shù)字蜂窩移動通信系統(tǒng)安全技術(shù)的探討與分析
數(shù)字蜂窩移動通信系統(tǒng)安全技術(shù)的探討與分析由于空中接口的開放性，移動通信尤其是數(shù)字
2009-08-20 00:06:141086
熱分析探討
熱分析探討首先提一下熱分析的概念哈，我們可以用各種手段完成，包括仿真軟件，手算，實(shí)際測試等等，器件發(fā)熱會導(dǎo)致很多問題：1.半導(dǎo)體
2009-11-21 14:07:54737
英特爾Sandy Bridge處理器技術(shù)細(xì)節(jié)
特爾(Intel)在稍早前的國際固態(tài)電路會議(ISSCC)中，透露了32納米Sandy Bridge處理器的技術(shù)細(xì)節(jié)，包括進(jìn)一步說明其模塊化環(huán)互連、如何將快取的操作電壓降至最低，以及導(dǎo)入用于監(jiān)控互連流量的除錯總線。
2011-03-01 09:56:121113
分布式嵌入系統(tǒng)的交互一致理論
非常概述地提及了控制方案，并未談及技術(shù)細(xì)節(jié)以及采用的協(xié)議。本文將根據(jù)交互一致性的理論，對實(shí)施這類應(yīng)用中可能遇到的問題進(jìn)行分析。
2011-03-22 17:30:31837
網(wǎng)絡(luò)地址翻譯技術(shù)淺析
針對網(wǎng)絡(luò)地址翻譯（Net Address Translation，NAT）技術(shù)在操作中存在的細(xì)節(jié)問題，通過相應(yīng)應(yīng)用示例，闡述NAT 技術(shù)的使用方法以及在操作中需要注意的技術(shù)細(xì)節(jié)，主要包括：地址映射、加載
2011-05-12 16:35:1815
英特爾揭露Ivy Bridge技術(shù)細(xì)節(jié)，將包含至少四個(gè)版本
英特爾稍早前公開展示了采用22nm三柵極（tri-gate）技術(shù)的首款處理器Ivy Bridge技術(shù)細(xì)節(jié)。依照英特爾的預(yù)估，新芯片至少有四種不同版本，其中最大的一款將在160mm2芯片尺寸中整合14億個(gè)
2012-02-23 09:38:19858
示波器原理的分析及維修方法的探討
示波器原理的分析及維修方法的探討。
2016-05-05 10:10:2822
關(guān)于5G移動通信的技術(shù)細(xì)節(jié)
信息和通信技術(shù)（ICT）產(chǎn)業(yè)已經(jīng)進(jìn)入第四個(gè)升級周期，而其中的每一輪技術(shù)升級都獲得了成功；2G 與 3G 的成功以及當(dāng)下 4G 的前景正在促成人們對新的 5G 移動通信系統(tǒng) 達(dá)成共識。這些移動通信
2017-09-24 11:10:351
Passport SDK的設(shè)計(jì)與技術(shù)細(xì)節(jié)實(shí)例分析
58 趕集集團(tuán)旗下?lián)碛卸鄠€(gè) App，且全部使用同一套賬號體系，通過 Passport 部門提供的接口進(jìn)行通信。經(jīng)過多年迭代，各個(gè) App 中關(guān)于 Passport 的功能均出現(xiàn)了一些流程和接口上的差異。為了提高賬號安全，統(tǒng)一服務(wù)接口和流程，提高用戶體驗(yàn)，由此決定開發(fā)了一個(gè) Passport SDK，以集成 Passport 的相關(guān)功能，并提供給集團(tuán)內(nèi)各業(yè)務(wù) App 使用。在項(xiàng)目開始之初，我們在公司內(nèi)經(jīng)過調(diào)研發(fā)現(xiàn)在使用 SDK 時(shí)，大家最關(guān)心的問題就是 SDK 使用起來是否簡單，即接口是否簡
2017-09-28 19:18:390
英特爾與GlobalFoundries分別介紹介電質(zhì)材料不同的新一代制程技術(shù)細(xì)節(jié)
在2017年度IEEE國際電子組件會議(IEDM)上，Intel與GlobalFoundries分別介紹了讓人眼前一亮的新一代制程技術(shù)細(xì)節(jié)。
2018-01-04 10:43:524732
深度剖析比特幣背后的技術(shù)細(xì)節(jié)
搞明白，同時(shí)也為了讓比特幣背后的技術(shù)細(xì)節(jié)顯得直觀, 我們將從你會如何發(fā)明自的比特幣的過程中一步一步地闡明.
2018-02-03 10:47:407098
操作 iPhone 控制小轎車
技術(shù)細(xì)節(jié)介紹
2018-06-25 00:02:002946
MIT公布“盲動”機(jī)器人技術(shù)細(xì)節(jié)
7月7日美國麻省理工學(xué)院近日發(fā)布公報(bào)稱，該校研究人員最新公布了一種“盲動”機(jī)器人的技術(shù)細(xì)節(jié)。這種機(jī)器人不需要借助視覺系統(tǒng)，可在崎嶇地形中穿行跳躍，有望在危險(xiǎn)工作環(huán)境中得到廣泛應(yīng)用。
2018-07-11 15:49:122873
結(jié)束了！新CEO徐子陽赴美談判，中美和解細(xì)節(jié)曝光
中興新任首席執(zhí)行官（CEO）徐子陽率領(lǐng)ZTE新任高級管理人員，7月9日與美國商務(wù)部工業(yè)與安全局官員在華盛頓舉行了會談，雙方討論了托管賬戶的技術(shù)細(xì)節(jié)。
2018-07-14 11:11:244184
意法半導(dǎo)體公布ST54J系統(tǒng)芯片（SoC）的技術(shù)細(xì)節(jié)
意法半導(dǎo)體日前公布了其集成NFC（近場通信）控制器、安全單元和eSIM的高集成度移動安全解決方案ST54J系統(tǒng)芯片（SoC）的技術(shù)細(xì)節(jié)。
2018-10-10 11:01:036180
伯克利可擴(kuò)展軟件交換機(jī)的細(xì)節(jié)介紹
在這里，我們介紹了BESS的一些技術(shù)細(xì)節(jié)，然后演示了如何在30分鐘內(nèi)實(shí)現(xiàn)自定義虛擬交換機(jī)。
2018-10-30 06:05:002923
ST發(fā)布寬帶機(jī)頂盒系統(tǒng)級芯片技術(shù)細(xì)節(jié)
的領(lǐng)先優(yōu)勢，發(fā)布即將推出的為用戶帶來非凡家庭娛樂體驗(yàn)的高性能寬帶機(jī)頂盒系統(tǒng)級芯片的技術(shù)細(xì)節(jié)。該芯片屬于意法半導(dǎo)體新一代家庭娛樂平臺，擁有市場領(lǐng)先的能效、極高的性能以及業(yè)界最好的安全功能，并支持各種開源操作系統(tǒng)環(huán)境。新產(chǎn)品的處理性能高于市場上現(xiàn)有的機(jī)頂盒芯
2019-01-01 16:26:02219
要想電流測得準(zhǔn)，一定不能忽視的技術(shù)細(xì)節(jié)（第二講）
要想電流測得準(zhǔn)，一定不能忽視的技術(shù)細(xì)節(jié)（第二講）
2019-07-02 11:40:482480
小米手表e-SIM技術(shù)細(xì)節(jié)揭露，明天發(fā)布
11月4日消息，小米生態(tài)鏈總經(jīng)理屈恒揭秘了小米手表e-SIM技術(shù)細(xì)節(jié)。
2019-11-04 15:31:474422
IBM新一代主機(jī)IBM z15更多技術(shù)細(xì)節(jié)公布 14nm工藝爐火純青
近日，IBM披露了其新一代主機(jī)IBM z15的諸多技術(shù)細(xì)節(jié)，再次彰顯了藍(lán)色巨人的雄厚實(shí)力，尤其是緩存容量和密度驚人。
2020-03-09 14:52:544456
CISA發(fā)布惡意軟件分析報(bào)告，包含19個(gè)惡意文件的詳細(xì)細(xì)節(jié)
當(dāng)?shù)貢r(shí)間9月15日，美國網(wǎng)絡(luò)安全和基礎(chǔ)設(shè)施安全局（CISA）發(fā)布了一份惡意軟件分析報(bào)告（MAR），該報(bào)告詳細(xì)介紹了19個(gè)惡意文件的細(xì)節(jié)，其中包含有關(guān)伊朗黑客使用的Web Shell的技術(shù)細(xì)節(jié)。
2020-09-18 16:00:411669
高通全新旗艦芯片驍龍888技術(shù)細(xì)節(jié)揭曉
高通正式揭曉全新芯片Snapdragon 888（S888）技術(shù)細(xì)節(jié)，預(yù)計(jì)替Android旗艦手機(jī)帶來哪些改變呢？外媒整理五大重點(diǎn)，不僅是性能、手游表現(xiàn)提升，就連拍照都能藉由S888有更好的效果。
2020-12-03 12:01:461688
臺積電5nm SRAM技術(shù)細(xì)節(jié)
此處描述的詳細(xì)電路設(shè)計(jì)技術(shù)使產(chǎn)品開發(fā)人員能夠從這項(xiàng)領(lǐng)先技術(shù)中獲得最大的優(yōu)勢。這也體現(xiàn)了產(chǎn)品／電路設(shè)計(jì)人員與負(fù)責(zé)產(chǎn)品良率和可靠性的工藝開發(fā)人員之間進(jìn)行設(shè)計(jì)工藝協(xié)同優(yōu)化（DTCO）的重要性。
2020-12-24 15:56:33415
光液技術(shù)細(xì)節(jié)之五—路在何方
Lightyear結(jié)構(gòu)的汽車，卡車和高鐵、輪船可以利用光液跟柴油、重油的混合燃燒。如甲醇跟航母的重油燃燒。
2020-12-26 15:52:48238
揭秘賽靈思計(jì)算平臺ACAP技術(shù)細(xì)節(jié)
? 在日前召開的FPGA領(lǐng)域的學(xué)術(shù)頂會--2019年“FPGA國際研討會”上，賽靈思發(fā)表了兩篇長論文，詳細(xì)介紹了賽靈思“自適應(yīng)計(jì)算加速平臺”ACAP的系統(tǒng)架構(gòu)和技術(shù)細(xì)節(jié)。本文將對ACAP的主要架構(gòu)
2021-01-04 09:53:242928
上汽榮威ER6純電三電系統(tǒng)的技術(shù)細(xì)節(jié)
? 最近上汽榮威R汽車ER6不僅銷量不錯，而且憑借著新一代新能源三電系統(tǒng)拿獎拿到手軟。針對這套純電動三電系統(tǒng)的技術(shù)細(xì)節(jié)，隨著小星來了解一下吧。我們先來看看上汽榮威ER6的性能參數(shù)。搭載新一代
2021-01-07 15:22:185893
ETCD集群的工作原理和高可用技術(shù)細(xì)節(jié)介紹
【導(dǎo)讀】新年快樂！本文介紹了etcd集群的工作原理和高可用技術(shù)細(xì)節(jié)。 etcd 簡介 coreos 開發(fā)的分布式服務(wù)系統(tǒng)，內(nèi)部采用 raft 協(xié)議作為一致性算法。作為服務(wù)發(fā)現(xiàn)系統(tǒng)，有以下的特點(diǎn)
2021-02-23 10:54:598704
NVIDIA公開顯存智取技術(shù)細(xì)節(jié)
AMD RX 6000系列顯卡發(fā)布之后，提出了一項(xiàng)名為“顯存智取”（Smart Access Memory）的技術(shù)，搭配銳龍5000系列處理器、400/500系列主板，可以讓處理器訪問顯卡的全部顯存，從而提升最多10％以上的游戲性能。
2021-02-26 09:42:523632
一文解析鴻蒙系統(tǒng)誕生背景、技術(shù)細(xì)節(jié)生態(tài)圈
從鴻蒙系統(tǒng)的產(chǎn)生背景、開源技術(shù)細(xì)節(jié)和產(chǎn)業(yè)鏈生態(tài)圈全面解析鴻蒙系統(tǒng)。華為6月2日正式發(fā)布的鴻蒙系統(tǒng)無疑占據(jù)了最近熱點(diǎn)話題的C位，雖然不全是贊美的聲音，但這種努力打破美國壟斷，挑戰(zhàn)谷歌、蘋果在移動
2021-06-11 16:14:435389
迅速了解目標(biāo)檢測的基本方法并嘗試?yán)斫饷總€(gè)模型的技術(shù)細(xì)節(jié)
本文將討論目標(biāo)檢測的基本方法（窮盡搜索、R-CNN、Fast R-CNN和Faster R-CNN），并嘗試?yán)斫饷總€(gè)模型的技術(shù)細(xì)節(jié)。為了讓經(jīng)驗(yàn)水平各不相同的讀者都能夠理解，文章不會使用任何公式來進(jìn)行
2021-08-26 15:08:522798
DJI goggles技術(shù)細(xì)節(jié)詳解
模擬圖傳具有較好的低延遲性能，且技術(shù)成熟度高，購買成本相對較低；模擬制式的FPV接收眼鏡，也有多種較為廉價(jià)的眼罩式產(chǎn)品可選；在許多大型競速比賽中指定使用模擬圖傳。
2022-04-14 09:44:478906
蒸汽流量計(jì)選型時(shí)，這幾個(gè)技術(shù)細(xì)節(jié)值得關(guān)注
蒸汽流量計(jì)選型時(shí)不僅要關(guān)注蒸汽流量計(jì)的測量原理、測量精度等參數(shù)，在如下幾個(gè)技術(shù)細(xì)節(jié)上也值得特別關(guān)注。? （1）對于標(biāo)準(zhǔn)孔板蒸汽流量計(jì)在滿足測量精度的同時(shí)，盡可能降低蒸汽流量計(jì)處壓力損失。在設(shè)計(jì)時(shí)
2022-07-26 07:45:45885
講一講ChatGPT的技術(shù)細(xì)節(jié)
通過人工標(biāo)注等方式，使用監(jiān)督學(xué)習(xí)的模式對GPT3模型（對這個(gè)是chatGPT模型的base）進(jìn)行初步訓(xùn)練（有監(jiān)督微調(diào)，SFT），從而得到一個(gè)初步能夠理解語言的模型，尤其是prompt的模式。
2023-01-03 17:38:581909
深入了解目標(biāo)檢測深度學(xué)習(xí)算法的技術(shù)細(xì)節(jié)
本文將討論目標(biāo)檢測的基本方法(窮盡搜索、R-CNN、Fast R-CNN和Faster R-CNN)，并嘗試?yán)斫饷總€(gè)模型的技術(shù)細(xì)節(jié)。為了讓經(jīng)驗(yàn)水平各不相同的讀者都能夠理解，文章不會使用任何公式來進(jìn)行講解。
2023-01-05 16:27:20230
保時(shí)捷兩檔箱技術(shù)細(xì)節(jié)
在開發(fā)這款兩檔變速器的過程中，保時(shí)捷在前期考慮過不同的設(shè)計(jì)方案。下圖展示了其中的六種方案。包括行星齒輪組形式（例如方案③、④、⑥）、圓柱齒輪形式（例如方案①），以及兩者的混合形式（例如方案②、⑤）。
2023-02-11 10:41:531652
ChatGPT數(shù)據(jù)泄露，技術(shù)細(xì)節(jié)公布
事件發(fā)生后，OpenAI 臨時(shí)關(guān)閉了 ChatGPT 服務(wù)以調(diào)查問題，后續(xù) Open AI 的首席執(zhí)行官 Sam Altman 也親自發(fā)了推文，承認(rèn)他們確實(shí)遭遇了重大問題，不過當(dāng)時(shí)并沒有公布問題的細(xì)節(jié)，只表示是一個(gè)開源庫的錯誤導(dǎo)致的。
2023-03-28 11:29:021123
基于LLAMA的魔改部署
去訓(xùn)練），并且和Vision結(jié)合的大模型也逐漸多了起來。所以怎么部署大模型是一個(gè) 超級重要的工程問題，很多公司也在緊鑼密鼓的搞著。目前效果最好討論最多的開源實(shí)現(xiàn)就是LLAMA，所以我這里討論的也是基于 LLAMA的魔改部署。基于LLAMA的finetune模型
2023-05-23 15:08:474396
LLaMA生態(tài)中的各個(gè)模型梳理
既然已經(jīng)有了成功ChatGPT這一成功的案例，大家都想基于LLaMA把這條路再走一遍，以期望做出自己的ChatGPT。
2023-07-04 15:07:253280
RISC-V跑大模型（二）：LLaMA零基礎(chǔ)移植教程
這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環(huán)境里。
2023-07-10 10:10:38706
Llama 2性能如何
在幾乎所有基準(zhǔn)上，Llama 2 70B 的結(jié)果均與谷歌 PaLM (540B) 持平或表現(xiàn)更好，不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。
2023-07-23 13:00:131115
爆火Llama 2一周請求下載超15萬，有人開源了Rust實(shí)現(xiàn)版本
隨著 Llama 2 的逐漸走紅，大家對它的二次開發(fā)開始流行起來。前幾天，OpenAI 科學(xué)家 Karpathy 利用周末時(shí)間開發(fā)了一個(gè)明星項(xiàng)目 llama2.c，借助 GPT-4，該項(xiàng)目僅用
2023-08-02 16:25:28470
深入理解Llama模型的源碼案例
目前大部分開源LLM模型都是基于transformers庫來做的，它們的結(jié)構(gòu)大部分都和Llama大同小異。
2023-08-23 11:44:071456
關(guān)于Llama 2的一切資源，我們都幫你整理好了
Meta 發(fā)布的 Llama 2，是新的 SOTA 開源大型語言模型（LLM）。Llama 2 代表著 LLaMA 的下一代版本，可商用。Llama 2 有 3 種不同的大小 —— 7B、13B 和 70B 個(gè)可訓(xùn)練參數(shù)。
2023-08-23 15:40:09674
8G顯存一鍵訓(xùn)練，解鎖Llama2隱藏能力！XTuner帶你玩轉(zhuǎn)大模型
針對 GPU 計(jì)算特點(diǎn)，在顯存允許的情況下，XTuner 支持將多條短數(shù)據(jù)拼接至模型最大輸入長度，以此最大化 GPU 計(jì)算核心的利用率，可以顯著提升訓(xùn)練速度。例如，在使用 oasst1 數(shù)據(jù)集微調(diào) Llama2-7B 時(shí)，數(shù)據(jù)拼接后的訓(xùn)練時(shí)長僅為普通訓(xùn)練的 50% 。
2023-09-04 16:12:261236
怎樣使用QLoRA對Llama 2進(jìn)行微調(diào)呢？
使用QLoRA對Llama 2進(jìn)行微調(diào)是我們常用的一個(gè)方法，但是在微調(diào)時(shí)會遇到各種各樣的問題
2023-09-22 14:27:21939
在線研討會 | 基于 LLM 構(gòu)建中文場景檢索式對話機(jī)器人：Llama2 + NeMo
4,096，并對算法細(xì)節(jié)進(jìn)行了優(yōu)化，加速了推理速度，讓 Llama2 的性能有了很大的提升，能夠和 ChatGPT 相媲美。 Llama2 大模型旨在處理廣泛的語言任務(wù)，包括文本生成、機(jī)器翻譯、問題回答、代碼生成等等。該模型經(jīng)過大規(guī)模的訓(xùn)練，能夠理解并生成文本，為各種應(yīng)用提供強(qiáng)大的自然語言處理能力。它的多
2023-10-13 20:35:02563
聊天機(jī)器人助力構(gòu)建更好芯片
英偉達(dá)的工程師訂制了由元宇宙平臺公司開發(fā)的llama2模型，并利用芯片設(shè)計(jì)和驗(yàn)證過程中獲得的專業(yè)數(shù)據(jù)對該模型進(jìn)行訓(xùn)練。經(jīng)過專業(yè)訓(xùn)練的大型語言模型被命名為chipnemo。
2023-11-24 15:27:59309
Meta發(fā)布開源大模型Code Llama 70B
近日，Meta宣布推出了一款新的開源大模型Code Llama 70B，這是其“Code Llama家族中體量最大、性能最好的模型版本”。這款新模型提供三種版本，并免費(fèi)供學(xué)術(shù)界和商業(yè)界使用。
2024-01-31 09:24:18310
LLaMA 2是什么？LLaMA 2背后的研究工作
Meta 發(fā)布的 LLaMA 2，是新的 sota 開源大型語言模型 (LLM)。LLaMA 2 代表著 LLaMA 的下一代版本，并且具有商業(yè)許可證。
2024-02-21 16:00:21243

已全部加載完成

搜索歷史

Llama2的技術(shù)細(xì)節(jié)探討分析

評論