完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 大模型
以大模型作為基礎(chǔ)模型支撐AI產(chǎn)業(yè)應(yīng)用邏輯已經(jīng)被證明實(shí)用性,AI大模型為AI落地應(yīng)用提供了一種通用化的解決方案;各自各樣參數(shù)不一、面向不同行業(yè)、面向不同任務(wù)的“大模型”也陸續(xù)發(fā)布,大模型已經(jīng)成為整個(gè)AI 界追逐的寵兒,AI大模型有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化程度高等特點(diǎn)。
文章:3046個(gè) 瀏覽:3965次 帖子:18個(gè)
深度學(xué)習(xí)模型部署與優(yōu)化:策略與實(shí)踐;L40S與A100、H100的對(duì)比分析
隨著生成式AI應(yīng)用的迅猛發(fā)展,我們正處在前所未有的大爆發(fā)時(shí)代。在這個(gè)時(shí)代,深度學(xué)習(xí)模型的部署成為一個(gè)亟待解決的問(wèn)題。盡管GPU在訓(xùn)練和推理中扮演著關(guān)鍵角...
2023-10-07 標(biāo)簽:gpuAI深度學(xué)習(xí) 1909 0
開源大模型FLM-101B:訓(xùn)練成本最低的超100B參數(shù)大模型
近期,一支來(lái)自中國(guó)的研究團(tuán)隊(duì)正是針對(duì)這些問(wèn)題提出了解決方案,他們推出了FLM-101B模型及其配套的訓(xùn)練策略。FLM-101B不僅大幅降低了訓(xùn)練成本,而...
數(shù)據(jù)并行是最常見的并行形式,因?yàn)樗芎?jiǎn)單。在數(shù)據(jù)并行訓(xùn)練中,數(shù)據(jù)集被分割成幾個(gè)碎片,每個(gè)碎片被分配到一個(gè)設(shè)備上。這相當(dāng)于沿批次(Batch)維度對(duì)訓(xùn)練過(guò)...
2023-08-24 標(biāo)簽:模型數(shù)據(jù)集pytorch 1905 0
隨著現(xiàn)在AI的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究也越來(lái)越多,從目前的市場(chǎng)來(lái)說(shuō),有些公司已經(jīng)有了專門做推理的ASIC,像Groq的LPU,...
中科大&字節(jié)提出UniDoc:統(tǒng)一的面向文字場(chǎng)景的多模態(tài)大模型
如上圖所示,UniDoc基于預(yù)訓(xùn)練的視覺(jué)大模型及大語(yǔ)言模型,將文字的檢測(cè)、識(shí)別、spotting(圖中未畫出)、多模態(tài)理解等四個(gè)任務(wù),通過(guò)多模態(tài)指令微調(diào)...
2023-08-31 標(biāo)簽:語(yǔ)言模型數(shù)據(jù)集大模型 1898 0
經(jīng)典 Transformer 使用不可學(xué)習(xí)的余弦編碼,加在模型底層的詞向量輸入上。GPT、BERT將其改為可學(xué)習(xí)的絕對(duì)位置編碼,并沿用到了RoBERTa...
隨著人工智能技術(shù)的不斷發(fā)展,大模型(Large Models)在各個(gè)領(lǐng)域中發(fā)揮著越來(lái)越重要的作用。然而,要實(shí)現(xiàn)這些大模型的高效運(yùn)行,就需要強(qiáng)大的算力支持...
2024-07-05 標(biāo)簽:人工智能自然語(yǔ)言處理大模型 1795 0
解析優(yōu)化的調(diào)度邏輯和cuda實(shí)現(xiàn)
0x0. 前言 這篇文章來(lái)解析一下Megaton-LM涉及到的一個(gè)優(yōu)化gradient_accumulation_fusion。這里fusion的意思是...
大型語(yǔ)言模型在關(guān)鍵任務(wù)和實(shí)際應(yīng)用中的挑戰(zhàn)
大型語(yǔ)言模型的出現(xiàn)極大地推動(dòng)了自然語(yǔ)言處理領(lǐng)域的進(jìn)步,但同時(shí)也存在一些局限性,比如模型可能會(huì)產(chǎn)生看似合理但實(shí)際上是錯(cuò)誤或虛假的內(nèi)容,這一現(xiàn)象被稱為幻覺(jué)(...
2023-08-15 標(biāo)簽:解碼器數(shù)據(jù)語(yǔ)言模型 1776 0
無(wú)任何數(shù)學(xué)公式理解大模型基本原理
前言 為什么我們使用chatgpt問(wèn)一個(gè)問(wèn)題,回答時(shí),他是一個(gè)字或者一個(gè)詞一個(gè)詞的蹦出來(lái),感覺(jué)是有個(gè)人在輸入,顯得很高級(jí),其實(shí)這這一個(gè)詞一個(gè)詞蹦不是為了...
2024-06-25 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)大模型 1772 0
如何充分挖掘預(yù)訓(xùn)練視覺(jué)-語(yǔ)言基礎(chǔ)大模型的更好零樣本學(xué)習(xí)能力
因此,合適的prompt對(duì)于模型的效果至關(guān)重要。大量研究表明,prompt的微小差別,可能會(huì)造成效果的巨大差異。研究者們就如何設(shè)計(jì)prompt做出了各種...
2022-10-19 標(biāo)簽:模型數(shù)據(jù)集Clip 1769 0
什么是RAG,RAG學(xué)習(xí)和實(shí)踐經(jīng)驗(yàn)
高級(jí)的RAG能很大程度優(yōu)化原始RAG的問(wèn)題,在索引、檢索和生成上都有更多精細(xì)的優(yōu)化,主要的優(yōu)化點(diǎn)會(huì)集中在索引、向量模型優(yōu)化、檢索后處理等模塊進(jìn)行優(yōu)化
2024-04-24 標(biāo)簽:大模型 1766 0
2024年是大模型在邊緣側(cè)&端側(cè)落地的第一年。從這一年開始,頭部手機(jī)廠商在自己的旗艦機(jī)型中內(nèi)置了3B以下的本地大模型,證明了3B以下大模型的商業(yè)...
大模型是一個(gè)實(shí)驗(yàn)工程,涉及數(shù)據(jù)清洗、底層框架、算法策略等多個(gè)工序,每個(gè)環(huán)節(jié)都有很多坑,因此知道如何避坑和技術(shù)選型非常重要,可以節(jié)省很多算力和時(shí)間。
據(jù)科技部新一代人工智能發(fā)展研究中心發(fā)布的報(bào)告顯示,我國(guó)已發(fā)布79個(gè)參數(shù)規(guī)模超過(guò)10億的大模型,幾乎形成了百模大戰(zhàn)的局面。在大模型研發(fā)方面,中國(guó)14個(gè)省區(qū)...
LLM(大型語(yǔ)言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn),旨在提高模型在處理復(fù)雜任務(wù)時(shí)的效率和響應(yīng)速度。以下是對(duì)LLM大模型推理加速關(guān)鍵技術(shù)...
BERT和 GPT-3 等語(yǔ)言模型針對(duì)語(yǔ)言任務(wù)進(jìn)行了預(yù)訓(xùn)練。微調(diào)使它們適應(yīng)特定領(lǐng)域,如營(yíng)銷、醫(yī)療保健、金融。在本指南中,您將了解 LLM 架構(gòu)、微調(diào)過(guò)程...
2024-01-19 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)nlpChatGPT 1722 0
基于AX650N/AX630C部署多模態(tài)大模型InternVL2-1B
InternVL2是由上海人工智能實(shí)驗(yàn)室OpenGVLab發(fā)布的一款多模態(tài)大模型,中文名稱為“書生·萬(wàn)象”。該模型在多學(xué)科問(wèn)答(MMMU)等任務(wù)上表現(xiàn)出...
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |