一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RISC-V 跑大模型(三):LLaMA中文擴(kuò)展

澎峰科技PerfXLab ? 來(lái)源:澎峰科技PerfXLab ? 作者:澎峰科技PerfXLab ? 2023-07-17 17:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是RISC-V跑大模型系列的第三篇文章,前面我們?yōu)榇蠹医榻B了如何在RISC-V下運(yùn)行LLaMA,本篇我們將會(huì)介紹如何為L(zhǎng)LaMA提供中文支持。

1.模型擴(kuò)充

以下步驟在X86下進(jìn)行:

1.1準(zhǔn)備工作

安裝最新版本的python和以下依賴庫(kù)。

pip install protobuf==3.20.0 結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)格式
pip install transformers 把原版模型轉(zhuǎn)換為HF格式
pip install sentencepiece 無(wú)監(jiān)督的文本標(biāo)記器和去標(biāo)記器
pip install peft 使用LoRA的工具

1.2模型下載

下載LLaMA原版模型和中文擴(kuò)充

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

中文擴(kuò)充:

https://huggingface.co/ziqingyang/chinese-alpaca-lora-7b

下載后的目錄如下:

wKgaomS1AoiAbJSYAACUfmvct_s083.pngwKgZomS1Ao6ACv0GAABF7DbXaIQ678.png

1.3合并模型

(1) 將LLaMA原版模型轉(zhuǎn)換為Huggingface格式。這一步需要借助transformers提供的腳本convert_llama_weights_to_hf.py。

下載鏈接:https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py

請(qǐng)執(zhí)行以下命令:

python convert_llama_weights_to_hf.py --input_dir path_to_original_llama_root_dir --model_size 7B --output_dir path_to_original_llama_hf_dir

命令解釋:將原版LLaMA的tokenizer.model放在--input_dir指定的目錄,其余文件放在${input_dir}/${model_size}下。執(zhí)行以下命令后,--output_dir中將存放轉(zhuǎn)換好的Huggingface版權(quán)重。

(2) 合并LoRA權(quán)重,生成Huggingface全量模型,這一步需要借助:merge_llama_with_chinese_lora.py。

下載鏈接:

https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/merge_llama_with_chinese_lora.py

執(zhí)行命令:

python merge_llama_with_chinese_lora.py --base_model path_to_original_llama_hf_dir --lora_model chinese-alpaca-lora-7b --output_dir path_to_output_dir

命令解釋:這一步的參數(shù)可以參照上一步。

2.移植模型

在完成前面的步驟后會(huì)得到一個(gè)path_to_output_dir的目錄,目錄內(nèi)容如下:

wKgZomS1BGiAcPf6AAC6mGVvrpk862.png

將目錄下的consolidate.00.path和params.json上傳到RISC-V中的llama.cpp/models目錄下,這一步可以借助scp來(lái)實(shí)現(xiàn):scp “源文件路徑” 賬戶@地址:目的路徑。之后的步驟可以參考本系列的第二篇文章。鏈接如下:RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程

最后的運(yùn)行效果:

wKgZomS1BNiAJHVQAAIxHb8elDk082.png

3.結(jié)語(yǔ)

我們也為大家準(zhǔn)備好已經(jīng)擴(kuò)展了中文的LLaMA供大家使用,只要掃描下面的二維碼,進(jìn)群即可獲得下載地址。之后我們還會(huì)對(duì)LLaMA進(jìn)行優(yōu)化加速,敬請(qǐng)期待。

另外,RISC -V跑大模型系列文章計(jì)劃分為四期:

1.RISC -V跑大模型(一)

2.RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程

3.RISC-V跑大模型(三):LLaMA中文擴(kuò)充(本篇)

4.更多性能優(yōu)化策略。(計(jì)劃)

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19882

    瀏覽量

    234975
  • RISC-V
    +關(guān)注

    關(guān)注

    46

    文章

    2549

    瀏覽量

    48742
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3132

    瀏覽量

    4050
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    325

    瀏覽量

    831
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)

    的核心優(yōu)勢(shì)在于其開(kāi)源性、模塊化、低功耗、高性能以及可擴(kuò)展性。這些特性使得RISC-V芯片在物聯(lián)網(wǎng)(IoT)、嵌入式系統(tǒng)、邊緣計(jì)算以及高性能計(jì)算等領(lǐng)域具有獨(dú)特競(jìng)爭(zhēng)力。 在物聯(lián)網(wǎng)領(lǐng)域,RISC-V芯片的低功耗
    發(fā)表于 01-29 08:38

    新的一年 RISC-V前景如何呢?

    1 月 7 日消息,RISC-V 領(lǐng)軍企業(yè) SiFive 成立中國(guó)分公司,中文名稱定為“芯伍科技”。 1 月 14 日消息,專注傳統(tǒng)與 AI 業(yè)務(wù),Imagination 放棄 RISC-V CPU 開(kāi)發(fā)。 新的一年,
    發(fā)表于 01-24 16:19

    RISC-V指令集概述

    RISC-V就是RISC的第五代指令集架構(gòu)。而RISC-V目標(biāo)就是“成為一種完全開(kāi)放的指令集架構(gòu),可被任何學(xué)術(shù)機(jī)構(gòu)或商業(yè)組織自由使用”。 RISC-V指令集由“基本指令集 +
    發(fā)表于 11-30 23:30

    關(guān)于RISC-V學(xué)習(xí)路線圖推薦

    )、密碼指令集(C)等。 RISC-V架構(gòu)特性 : 掌握RISC-V的精簡(jiǎn)、模塊化、可擴(kuò)展性和可裁剪性等特性。 RISC-V開(kāi)發(fā)工具與環(huán)
    發(fā)表于 11-30 15:21

    什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別

    是開(kāi)放的,任何人都可以使用它來(lái)開(kāi)發(fā)處理器芯片和其他硬件,而無(wú)需支付任何許可或使用費(fèi)用。RISC-V的設(shè)計(jì)簡(jiǎn)單,易于擴(kuò)展和自定義,可以在各種應(yīng)用場(chǎng)景和市場(chǎng)中使用。 什么是指令集架構(gòu)? 指令集架構(gòu)
    發(fā)表于 11-16 16:14

    RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期

    計(jì)算機(jī)由控制整體的CPU(中央處理器)和加速器兩部分構(gòu)成。在AI計(jì)算中,功耗和效率是兩個(gè)關(guān)鍵因素。RISC-V架構(gòu)通過(guò)其簡(jiǎn)潔的設(shè)計(jì)和定制化的擴(kuò)展,可以實(shí)現(xiàn)高效的能量使用。該架構(gòu)能夠通過(guò)小型且高效的處理單元
    發(fā)表于 10-31 16:06

    RISC-V近期市場(chǎng)情況調(diào)研

    RISC-V芯片的發(fā)展情況 全球趨勢(shì) :RISC-V架構(gòu)因其開(kāi)源、免費(fèi)、模塊化和可擴(kuò)展的特點(diǎn),獲得了業(yè)界的廣泛支持。包括蘋(píng)果、Intel、高通等國(guó)際巨頭都在積極布局RISC-V生態(tài)
    的頭像 發(fā)表于 10-23 15:10 ?1663次閱讀

    加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來(lái) !

    加入RISC-VAdvocate行列!我們正在尋找來(lái)自世界各地的RISC-V愛(ài)好者,通過(guò)全球推廣和參與,成為支持RISC-V進(jìn)步的關(guān)鍵參與者。作為一名RISC-VAdvocate,您將
    的頭像 發(fā)表于 09-10 08:08 ?869次閱讀
    加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來(lái) !

    RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    第二屆RISC-V中國(guó)峰會(huì)的南京會(huì)場(chǎng);青稞RISC-V的單雙線調(diào)試技術(shù),在第屆峰會(huì)上入選RISC-V新技術(shù)與新成果。
    的頭像 發(fā)表于 08-30 18:18 ?2351次閱讀
    <b class='flag-5'>RISC-V</b> Summit China 2024  青稞<b class='flag-5'>RISC-V</b>+接口PHY,賦能<b class='flag-5'>RISC-V</b>高效落地

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地

    量產(chǎn)芯片的關(guān)鍵技術(shù);公司籌備了第二屆RISC-V中國(guó)峰會(huì)的南京會(huì)場(chǎng);青稞RISC-V的單雙線調(diào)試技術(shù),在第屆峰會(huì)上入選RISC-V新技術(shù)與新成果。 02 連接聯(lián)網(wǎng)連世界 有核有根有
    發(fā)表于 08-30 17:37

    2024 RISC-V 中國(guó)峰會(huì):華秋電子助力RISC-V生態(tài)!

    第四屆RISC-V中國(guó)峰會(huì)(RISC-V Summit China 2024)于8月21日至23日在杭州盛大召開(kāi),成為RISC-V領(lǐng)域的一次重要盛會(huì)
    的頭像 發(fā)表于 08-26 18:33 ?1528次閱讀
    2024 <b class='flag-5'>RISC-V</b> 中國(guó)峰會(huì):華秋電子助力<b class='flag-5'>RISC-V</b>生態(tài)!

    2024 RISC-V 中國(guó)峰會(huì):華秋電子助力RISC-V生態(tài)!

    160+,生態(tài)技術(shù)文章8000+,策劃了70多場(chǎng)RISC-V系列公開(kāi)課,號(hào)召更多合作伙伴一起加入,參與RISC-V開(kāi)發(fā)者生態(tài)共建。 不僅如此,電子發(fā)燒友聯(lián)合RISC-V生態(tài)平臺(tái)伙伴發(fā)起2024第
    發(fā)表于 08-26 16:46

    risc-v的發(fā)展歷史

    本的RISC-V指令集架構(gòu),即RISC-V v2.0。這個(gè)版本為32位和64位的RISC-V架構(gòu)定義了基本的指令集,并概述了未來(lái)的擴(kuò)展指令集
    發(fā)表于 07-29 17:20

    rIsc-v的缺的是什么?

    RISC-V作為一種開(kāi)源的指令集架構(gòu)(ISA),自其誕生以來(lái)就受到廣泛關(guān)注和應(yīng)用,但它也存在一些不足之處。以下是RISC-V架構(gòu)目前存在的主要缺點(diǎn): 1. 性能問(wèn)題 相對(duì)于專用ISA的性能差距:盡管
    發(fā)表于 07-29 17:18

    為什么要有RISC-V

    的,永遠(yuǎn)不會(huì)改變。這為編譯器編寫(xiě)者,操作系統(tǒng)開(kāi)發(fā)人員和匯 編語(yǔ)言程序員提供了穩(wěn)定的目標(biāo)。模塊化來(lái)源于可選的標(biāo)準(zhǔn)擴(kuò)展,根據(jù)應(yīng)用程序的需要,硬件可以包含或不包含這些擴(kuò)展。這種模塊化特性使得RISC-V具有了
    發(fā)表于 07-27 15:05