完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 大模型
以大模型作為基礎(chǔ)模型支撐AI產(chǎn)業(yè)應(yīng)用邏輯已經(jīng)被證明實(shí)用性,AI大模型為AI落地應(yīng)用提供了一種通用化的解決方案;各自各樣參數(shù)不一、面向不同行業(yè)、面向不同任務(wù)的“大模型”也陸續(xù)發(fā)布,大模型已經(jīng)成為整個AI 界追逐的寵兒,AI大模型有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化程度高等特點(diǎn)。
文章:2903個 瀏覽:3683次 帖子:18個
通用大型語言模型(LLM)推理基準(zhǔn):研究者們介紹了多種基于文本的推理任務(wù)和基準(zhǔn),用于評估LLMs在不同領(lǐng)域(如常識、數(shù)學(xué)推理、常識推理、事實(shí)推理和編程)...
不同于上述工作從待干預(yù)模型自身抽取引導(dǎo)向量,我們意在從LLMs預(yù)訓(xùn)練過程的切片中構(gòu)建引導(dǎo)向量來干預(yù)指令微調(diào)模型(SFT Model),試圖提升指令微調(diào)模...
張宏江深度解析:大模型技術(shù)發(fā)展的八大觀察點(diǎn)
在大模型的發(fā)展史上,Scaling Law(規(guī)模律)發(fā)揮了核心作用,它是推動模型性能持續(xù)提升的主要動力。Scaling Law揭示了這樣一個現(xiàn)象:較小的...
2024-03-14 標(biāo)簽:操作系統(tǒng)Agi自然語言處理 374 0
對于所有“基座”(Base)模型,–template 參數(shù)可以是 default, alpaca, vicuna 等任意值。但“對話”(Chat)模型請...
2024-03-13 標(biāo)簽:機(jī)器學(xué)習(xí)大模型 1260 0
首先看吞吐量,看起來沒有什么違和的,在單卡能放下模型的情況下,確實(shí)是 H100 的吞吐量最高,達(dá)到 4090 的兩倍。
OpenVINO?協(xié)同Semantic Kernel:優(yōu)化大模型應(yīng)用性能新路徑
作為主要面向 RAG 任務(wù)方向的框架,Semantic Kernel 可以簡化大模型應(yīng)用開發(fā)過程,而在 RAG 任務(wù)中最常用的深度學(xué)習(xí)模型就是 Embe...
篇論文主要研究了大型語言模型(LLMs)中的一個現(xiàn)象,即在模型的隱藏狀態(tài)中存在極少數(shù)激活值(activations)遠(yuǎn)大于其他激活值的情況,這些被稱為“...
2024-03-01 標(biāo)簽:大模型 749 0
深度學(xué)習(xí)(DL)與自動駕駛(AD)的融合標(biāo)志著該領(lǐng)域的重大飛躍,吸引了學(xué)術(shù)界和工業(yè)界的關(guān)注。配備了攝像頭和激光雷達(dá)的AD系統(tǒng)模擬了類似人類的決策過程。
谷歌大型模型終于開放源代碼,遲到但重要的開源戰(zhàn)略
在人工智能領(lǐng)域,谷歌可以算是開源的鼻祖。今天幾乎所有的大語言模型,都基于谷歌在 2017 年發(fā)布的 Transformer 論文;谷歌的發(fā)布的 BERT...
利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)
對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準(zhǔn)確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
2024-02-22 標(biāo)簽:數(shù)據(jù)庫語言模型知識圖譜 1499 0
利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(上)
向量數(shù)據(jù)庫是一組高維向量的集合,用于表示實(shí)體或概念,例如單詞、短語或文檔。向量數(shù)據(jù)庫可以根據(jù)實(shí)體或概念的向量表示來度量它們之間的相似性或關(guān)聯(lián)性。
2024-02-22 標(biāo)簽:數(shù)據(jù)庫大模型 1487 0
應(yīng)用大模型提升研發(fā)效率的實(shí)踐與探索
對于模型訓(xùn)練,我們可以采用 3D 并行訓(xùn)練的方式來實(shí)現(xiàn)。將模型參數(shù)和梯度張量劃分為多個分區(qū),分配到不同 GPU 卡上進(jìn)行計算。每張卡負(fù)責(zé)自己分區(qū)的梯度和...
什么是混合專家模型?混合專家模型 (MoEs)優(yōu)劣勢分析
門控網(wǎng)絡(luò)或路由: 這個部分用于決定哪些令牌 (token) 被發(fā)送到哪個專家。例如,在下圖中,“More”這個令牌可能被發(fā)送到第二個專家,而“Param...
2024-02-22 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)AITransformer 5144 0
大模型:即基礎(chǔ)模型,在海量數(shù)據(jù)和計算資源的基礎(chǔ)上通過預(yù)先訓(xùn)練出來的,具有大參數(shù)規(guī)模的深度學(xué)習(xí)模型 >狹義多指大語言模型,廣義還包括CV、多模態(tài)等...
2024-02-22 標(biāo)簽:AI人工智能大數(shù)據(jù) 461 0
大模型系列:Flash Attention V2整體運(yùn)作流程
基于1.1中的思想,我們在V2中將原本的內(nèi)外循環(huán)置換了位置(示意圖就不畫了,基本可以對比V1示意圖想象出來)。我們直接來看V2的偽代碼(如果對以下偽代碼...
自然語言處理領(lǐng)域存在著一個非常有趣的現(xiàn)象:在多語言模型中,不同的語言之間似乎存在著一種隱含的對齊關(guān)系。
2024-02-20 標(biāo)簽:機(jī)器學(xué)習(xí)自然語言處理大模型 721 0
Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大會 上分享了他如何在測試中使用 ChatGPT。
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |