完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 大模型
以大模型作為基礎(chǔ)模型支撐AI產(chǎn)業(yè)應(yīng)用邏輯已經(jīng)被證明實(shí)用性,AI大模型為AI落地應(yīng)用提供了一種通用化的解決方案;各自各樣參數(shù)不一、面向不同行業(yè)、面向不同任務(wù)的“大模型”也陸續(xù)發(fā)布,大模型已經(jīng)成為整個(gè)AI 界追逐的寵兒,AI大模型有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化程度高等特點(diǎn)。
文章:2903個(gè) 瀏覽:3683次 帖子:18個(gè)
一個(gè)給NLP領(lǐng)域帶來(lái)革新的預(yù)訓(xùn)練語(yǔ)言大模型Bert
之前的文章和大家詳細(xì)的介紹了靜態(tài)的詞向量表示word2vec理論加實(shí)戰(zhàn),但是word2vec存在一個(gè)很大的問(wèn)題,由于是靜態(tài)詞向量所以無(wú)法表示一詞多義,對(duì)...
2023-02-28 標(biāo)簽:GPTELMOSTransformer 7.9萬(wàn) 0
大模型訓(xùn)練為什么不能用4090顯卡,GPU訓(xùn)練性能和成本對(duì)比
為什么?一般有 tensor parallelism、pipeline parallelism、data parallelism 幾種并行方式,分別在模...
通往AGI之路:揭秘英偉達(dá)A100、A800、H800、V100在高性能計(jì)算與大模型訓(xùn)練中的霸主地位
英偉達(dá)前段時(shí)間發(fā)布GH 200包含 36 個(gè) NVLink 開(kāi)關(guān),將 256 個(gè) GH200 Grace Hopper 芯片和 144TB 的共享內(nèi)存連...
全微調(diào)(Full Fine-tuning):全微調(diào)是指對(duì)整個(gè)預(yù)訓(xùn)練模型進(jìn)行微調(diào),包括所有的模型參數(shù)。在這種方法中,預(yù)訓(xùn)練模型的所有層和參數(shù)都會(huì)被更新和優(yōu)...
2024-01-03 標(biāo)簽:gpu深度學(xué)習(xí)ChatGPT 2.6萬(wàn) 0
對(duì)于位置編碼,常規(guī)的做法是在計(jì)算 query,key 和 value 向量之前,會(huì)計(jì)算一個(gè)位置編碼向量 加到詞嵌入 上,位置編碼向量 同樣也是 維向量,...
2023-09-05 標(biāo)簽:向量旋轉(zhuǎn)編碼大模型 1.5萬(wàn) 0
什么是大模型、大模型是怎么訓(xùn)練出來(lái)的及大模型作用
本文通俗簡(jiǎn)單地介紹了什么是大模型、大模型是怎么訓(xùn)練出來(lái)的和大模型的作用。 ? 什么是大模型 大模型,英文名叫Large Model,大型模型。早期的時(shí)候...
InfiniBand和RoCEv2網(wǎng)絡(luò)簡(jiǎn)介及解決方案
超高帶寬、超低延遲、超高可靠,這是大模型訓(xùn)練對(duì)于網(wǎng)絡(luò)的要求。
2023-09-22 標(biāo)簽:數(shù)據(jù)中心AITCP 1.1萬(wàn) 0
圖解大模型系列之:Megatron源碼解讀1,分布式環(huán)境初始化
使用Megatron來(lái)訓(xùn)練gpt類(lèi)大模型的項(xiàng)目有很多。在這個(gè)系列里,我選擇了由THUDM開(kāi)發(fā)的CodeGeeX項(xiàng)目,它是gpt在代碼生成方向上的應(yīng)用,對(duì)...
大模型為什么要微調(diào)?大模型微調(diào)的原理
在人工智能(AI)領(lǐng)域,特別是自然語(yǔ)言處理(NLP)領(lǐng)域,大模型(如BERT、GPT系列等)的出現(xiàn)為許多復(fù)雜任務(wù)提供了強(qiáng)大的解決方案。然而,這些預(yù)訓(xùn)練的...
vLLM是一個(gè)開(kāi)源的大模型推理加速框架,通過(guò)PagedAttention高效地管理attention中緩存的張量,實(shí)現(xiàn)了比HuggingFace Tra...
2023-10-10 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)gpu服務(wù)器 6399 0
在人工智能(AI)的廣闊領(lǐng)域中,模型作為算法與數(shù)據(jù)之間的橋梁,扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度,我們可以將其大致分為AI大模型和小模型。這兩...
開(kāi)發(fā)者如何使用訊飛星火認(rèn)知大模型API?
之前我們使用網(wǎng)頁(yè)文本輸入的方式體驗(yàn)了訊飛星火認(rèn)知大模型的功能(是什么讓科大訊飛1個(gè)月股價(jià)翻倍?),本篇博文將從開(kāi)發(fā)者角度來(lái)看看如何使用訊飛星火認(rèn)知大模型API。
首先看吞吐量,看起來(lái)沒(méi)有什么違和的,在單卡能放下模型的情況下,確實(shí)是 H100 的吞吐量最高,達(dá)到 4090 的兩倍。
單模態(tài)大模型,通常大于100M~1B參數(shù)。具有較強(qiáng)的通用性,比如對(duì)圖片中任意物體進(jìn)行分割,或者生成任意內(nèi)容的圖片或聲音。極大降低了場(chǎng)景的定制成本。
隨著B(niǎo)ERT、GPT等預(yù)訓(xùn)練模型取得成功,預(yù)訓(xùn)-微調(diào)范式已經(jīng)被運(yùn)用在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、多模態(tài)語(yǔ)言模型等多種場(chǎng)景,越來(lái)越多的預(yù)訓(xùn)練模型取得了優(yōu)異的效果。
圖解大模型訓(xùn)練之:Megatron源碼解讀2,模型并行
前文說(shuō)過(guò),用Megatron做分布式訓(xùn)練的開(kāi)源大模型有很多,我們選用的是THUDM開(kāi)源的CodeGeeX(代碼生成式大模型,類(lèi)比于openAI Code...
什么是混合專(zhuān)家模型?混合專(zhuān)家模型 (MoEs)優(yōu)劣勢(shì)分析
門(mén)控網(wǎng)絡(luò)或路由: 這個(gè)部分用于決定哪些令牌 (token) 被發(fā)送到哪個(gè)專(zhuān)家。例如,在下圖中,“More”這個(gè)令牌可能被發(fā)送到第二個(gè)專(zhuān)家,而“Param...
2024-02-22 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)AITransformer 5144 0
在科技日新月異的今天,人工智能(AI)已成為推動(dòng)社會(huì)進(jìn)步的重要力量。而在人工智能的眾多分支中,大模型(Large Models)作為近年來(lái)興起的概念,以...
2024-07-04 標(biāo)簽:計(jì)算機(jī)人工智能大模型 4962 0
AI大模型(如LLM,即大型語(yǔ)言模型)與傳統(tǒng)AI在多個(gè)方面存在顯著的區(qū)別。以下將從技術(shù)層面、應(yīng)用場(chǎng)景、性能表現(xiàn)、計(jì)算資源和成本、以及發(fā)展趨勢(shì)和挑戰(zhàn)等角度...
2024-07-15 標(biāo)簽:AI深度學(xué)習(xí)大模型 4904 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專(zhuān)題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |