一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

deepseek國(guó)產(chǎn)芯片加速 DeepSeek的國(guó)產(chǎn)AI芯片天團(tuán)

工程師 ? 來源:EEWorld電子工程世界 ? 作者:付斌 ? 2025-02-10 15:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

遙想兩年前,ChatGPT給了世界一記AI沖擊,而DeepSeek無疑是第二記沖擊。我們不僅對(duì)DeepSeek強(qiáng)勁的性能所震撼,也讓遠(yuǎn)在大洋彼岸的OpenAI、谷歌、META等一眾玩家感受到莫大壓力,從而紛紛繼續(xù)“卷”起來,效仿DeepSeek的“開源”模式。

對(duì)于DeepSeek本身,人們關(guān)注其如何在有限算力實(shí)現(xiàn)強(qiáng)大性能,更關(guān)注其在重重條令圍城之下的未來之路。而在最近,全世界的芯片廠商集體出動(dòng),紛紛宣布支持DeepSeek。尤其是眾多國(guó)產(chǎn)AI芯片廠商,集體發(fā)力,為DeepSeek建立了一個(gè)堅(jiān)實(shí)的后盾。

緣起:DeepSeek成功背后

為什么DeepSeek能夠掀起如此巨浪?因?yàn)榱钊梭@訝的是,目前普遍認(rèn)為DeepSeek僅僅用了550萬(wàn)美元的成本實(shí)現(xiàn)了openAI上億美元做到的事。總結(jié)起來,DeepSeek有四點(diǎn)創(chuàng)新:

第一,拉低整體成本。信息顯示,DeepSeek V3模型的訓(xùn)練總計(jì)耗用278.8萬(wàn)GPU小時(shí),相當(dāng)于在2048塊H800 GPU集群上訓(xùn)練約2個(gè)月,成本為557.6萬(wàn)美元。相比之下,GPT-4o的訓(xùn)練成本約為1億美元,需使用上萬(wàn)塊性能更強(qiáng)的H100 GPU。同時(shí),DeepSeek V3的成本僅為L(zhǎng)lama 3的7%。AI專家指出,達(dá)到DeepSeek V3級(jí)別的能力需接近16000顆GPU的集群。

之所以有很低的成本,是DeepSeek的模型架構(gòu)與主流設(shè)計(jì)有所不同,采用了細(xì)顆粒度的MoE(混合專家)結(jié)構(gòu)。雖然細(xì)顆粒度MoE并非首創(chuàng),例如阿里也在探索這一方向,但DeepSeek通過這一架構(gòu)在推理時(shí)僅激活部分參數(shù),從而顯著降低成本。此外,DeepSeek在推理機(jī)制中引入了LLA,與市場(chǎng)上常見的多頭注意力機(jī)制不同,后者需要所有參數(shù)參與計(jì)算,而DeepSeek僅激活少量參數(shù),進(jìn)一步提升了效率。當(dāng)前先進(jìn)模型大多采用鄧氏架構(gòu),而DeepSeek的創(chuàng)新在于通過細(xì)顆粒度MoE和LLA實(shí)現(xiàn)了更高效的推理。

第二,訓(xùn)練方法。傳統(tǒng)方法為FP32和FP16的混合精度,DeepSeek則采用FP8參數(shù),比較敏感的組件還是FP16。分布式混合精度目前做的比較少,訓(xùn)練方法里面也有工程優(yōu)化,之前時(shí)延導(dǎo)致GPU利用率不是很高,DeepSeek用流水線并行,高效利用通信網(wǎng)絡(luò),提升速率。

第三,編程不同。DeepSeek采用了NVIDIA PTX指令集(Parallel Thread Execution ISA)來提升執(zhí)行效能。PTX是NVIDIA GPU最底層的控制語(yǔ)言,用更細(xì)顆粒度來調(diào)度底層單元,將硬件調(diào)度細(xì)化。不過,此處需要注意PTX并非是CUDA的替代品,對(duì)于大部分開發(fā)者來說學(xué)習(xí)門檻較高,所以才有了CUDA來簡(jiǎn)化開發(fā)過程。

第四,AI Infra,通常集群是三層網(wǎng)絡(luò),DeepSeek是兩層,通信庫(kù)降低PCIe消耗,減少GPU內(nèi)存消耗增高網(wǎng)絡(luò)通信速度,HF Reduce、分布式文件系統(tǒng)、調(diào)度平臺(tái)用得比較靈活。

雖說在各種突破之下,DeepSeek的表現(xiàn)驚人。但對(duì)大多數(shù)用戶來說,也許更多的體驗(yàn)是“服務(wù)器繁忙,請(qǐng)稍后再試”,除了國(guó)外對(duì)于DeepSeek的攻擊以外,也許DeepSeek的算力真的不夠用了。

根據(jù)國(guó)泰君安證券分析師舒迪、李奇測(cè)算,假設(shè)DeepSeek日均訪問量為1億次、每次提問10次,每次提問的回復(fù)用到1000個(gè)token,1000個(gè)token大概對(duì)應(yīng)750個(gè)英文字母,則DeepSeek每秒的推理算力需求為1.6*1019TOPs。在這種普通推理情境下,假設(shè)DeepSeek采用的是FP8精度的H100卡做推理,利用率50%,那么推理端H100卡的需求為16177張,A100卡的需求為51282張。

這種情況下,AI芯片就顯得格外重要了。

后盾:國(guó)產(chǎn)芯片撐起一片天

事實(shí)上,芯片算力一直都在追著大模型奔跑。換句話說,未來算力需求一定難以滿足現(xiàn)在AI發(fā)展,DeepSeek未來會(huì)面對(duì)

據(jù)OpenAI測(cè)算,自2012年以來,AI模型訓(xùn)練算力需求每3~4個(gè)月就翻一番,每年訓(xùn)練AI模型所需算力增長(zhǎng)幅度高達(dá)10倍。而連摩爾定律中,芯片計(jì)算性能翻一番的周期為18~24個(gè)月,更何況摩爾定律已經(jīng)出現(xiàn)放緩跡象。專家預(yù)測(cè),未來幾年OpenAI僅訓(xùn)練模型?少還需要200~300億美元的硬件,Google需要200-300億美元,Anthropic需要100-200億美元,未來幾年至少投入1000億美元純粹用到訓(xùn)練?模型。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2F0117e63dj00srfxod005wd200u000h7g00eo008e.jpg&thumbnail=660x2147483647&quality=80&type=jpg

芯片廠商當(dāng)然沒有錯(cuò)過DeepSeek這一機(jī)會(huì),比如在春節(jié)期間,國(guó)外芯片廠商接連宣布支持DeepSeek:

1月25日,AMD將DeepSeek-V3模型集成于Instinct MI300X GPU;

1月31日,NVIDIA NIM微服務(wù)預(yù)覽版支持DeepSeek-R1模型英偉達(dá);

1月31日,英特爾DeepSeek模型能在酷睿AIPC上離線使用;

2月1日,英特爾Gaudi 2D Al加速器支持DeepSeek Janus Pro模型。

自從AI大模型來了,英偉達(dá)喝湯喝到撐,GPU也就成了香餑餑。但在地緣政治局勢(shì)愈發(fā)緊張的現(xiàn)如今,國(guó)內(nèi)高端AI芯片不斷被圍追堵截。因此,自主可控成了不可不談的問題。近幾日,DeepSeek獲國(guó)產(chǎn)芯片廠商力挺,成為支撐DeepSeek的“天團(tuán)”。

1.華為:華為云宣布與硅基流動(dòng)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù);DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū);華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine,全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優(yōu)化,加速客戶AI應(yīng)用快速落地;

2.沐曦:Gitee AI聯(lián)合沐曦首發(fā)全套DeepSeek R1千問蒸餾模型,全免費(fèi)體驗(yàn);DeepSeek-V3滿血版在國(guó)產(chǎn)沐曦GPU首發(fā)體驗(yàn)上線;

3.天數(shù)智芯:成功完成與 DeepSeek R1 的適配工作,并且已正式上線多款大模型服務(wù),其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等;

4.摩爾線程:基于Ollama開源框架,完成了對(duì)DeepSeek-R1-Distill-Qwen-7B蒸餾模型的部署,并在多種中文任務(wù)中展現(xiàn)了優(yōu)異的性能;

5.海光信息:DeepSeek V3和R1模型完成海光DCU適配并正式上線;海光DCU成功適配DeepSeek-Janus-Pro多模態(tài)大模型;

6.壁仞科技:DeepSeek R1在壁仞國(guó)產(chǎn)AI算力平臺(tái)發(fā)布,全系列模型一站式賦能開發(fā)者創(chuàng)新;

7.太初元碁:基于太初T100加速卡2小時(shí)適配DeepSeek-R1系列模型,一鍵體驗(yàn),免費(fèi)API服務(wù);

8.云天勵(lì)飛:完成 DeepEdge10 “算力積木”芯片平臺(tái)與DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B大模型的適配,可以交付客戶使用;

9.燧原科技:完成對(duì)DeepSeek全量模型的高效適配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸餾模型。截至目前,DeepSeek的全量模型已在慶陽(yáng)、無錫、成都等智算中心完成了數(shù)萬(wàn)卡的快速部署;

10.昆侖芯:完成全版本模型適配,這其中包括DeepSeek MoE 模型及其蒸餾的Llama/Qwen等小規(guī)模dense模型;

11.靈汐芯片:完成了DeepSeek-R1系列模型在靈汐KA200芯片及相關(guān)智算卡的適配,助力國(guó)產(chǎn)大模型與類腦智能硬件系統(tǒng)的深度融合;

12.鯤云科技:全新一代的可重構(gòu)數(shù)據(jù)流AI芯片CAISA 430成功適配DeepSeek R1蒸餾模型推理;

13.希姆計(jì)算:僅用數(shù)小時(shí)就將DeepSeek-R1全系列蒸餾模型快速適配到自研RISC-V開源指令集的推理加速卡系列之上,并落地全國(guó)多個(gè)千卡級(jí)以上智算中心;

14.算能:算能自研RISC-V開源指令集融合服務(wù)器SRM1-20,成功適配并本地部署DeepSeek-R1-Distill-Qwen-7B/1.5B模型;

15.清微智能:可重構(gòu)計(jì)算架構(gòu)RPU芯片已完成DeepSeek-R1系列模型的適配和部署運(yùn)行;

16.龍芯中科:搭載龍芯3號(hào)CPU的設(shè)備成功啟動(dòng)運(yùn)行DeepSeek R1 7B模型,實(shí)現(xiàn)本地化部署;

17.瀚博:已完成DeepSeek-V3與R1全系列模型訓(xùn)推適配,單機(jī)可支持V3與R1 671B全量滿血版模型部署。

復(fù)盤:國(guó)產(chǎn)AI芯片發(fā)展現(xiàn)狀

前兩年,美國(guó)千方百計(jì)阻止英偉達(dá)向中國(guó)出售尖端AI芯片,不想放棄中國(guó)市場(chǎng)的英偉達(dá),迅速推出中國(guó)特供版,但對(duì)國(guó)內(nèi)來說,卻不香了。所謂中國(guó)特供芯片,性能砍了25%,但減量不減價(jià),國(guó)產(chǎn)廠商則紛紛點(diǎn)名華為,尤其是華為升騰910B芯片。那么,除了華為,我國(guó)還有哪些AI芯片企業(yè)值得關(guān)注?

AI芯片主要分為GPGPU(通用圖形處理器)、FPGA(可編程邏輯器件)、ASIC(專用集成電路)、存算一體和類腦芯片幾種。根據(jù)在網(wǎng)絡(luò)中的位置,又可以分為云端AI芯片 、邊緣和終端AI芯片。

GPU/GPGPU與GPU不同,GPGPU就是將GPU圖形顯示部分“摘掉”,全力走通用計(jì)算,特別適合用在深度學(xué)習(xí)訓(xùn)練方面。目前國(guó)內(nèi)GPU存在許多玩家,整個(gè)行業(yè)也經(jīng)歷過一輪洗牌。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2F54b8d398j00srfxoe00f6d200u0012ng00fe00jt.jpg&thumbnail=660x2147483647&quality=80&type=jpg

FPGA:可編程的靈活性是任何其它計(jì)算芯片無法替代的,同時(shí)它在AI領(lǐng)域也具備一定計(jì)算能力,但相對(duì)來說,F(xiàn)PGA的成本就相對(duì)高一些了,而且FPGA開發(fā)也很難,軟件生態(tài)沒有GPGPU的CUDA那么方便。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2Fff8d0298j00srfxof007vd200u000oxg00f000cg.jpg&thumbnail=660x2147483647&quality=80&type=jpg

ASIC:性能強(qiáng)、功耗低,NPU也是加入神經(jīng)單元的一種ASIC,不過針對(duì)特定算法計(jì)算,算法是無法修改的,想要做另一種算法就要再造一種ASIC芯片,前期開發(fā)需要FPGA輔助進(jìn)行。

值得一提的是,TPU,全稱Tensor Processing Unit,是一種專為處理張量運(yùn)算而設(shè)計(jì)的ASIC芯片,由谷歌自研在2016年推出首款產(chǎn)品,目前國(guó)內(nèi)也有中昊芯英這一玩家。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2Fc3c99909j00srfxog002vd200rg00hgg00dq008q.jpg&thumbnail=660x2147483647&quality=80&type=jpg

存算一體:能耗比極佳,能夠突破存儲(chǔ)墻和功耗墻,但商業(yè)化進(jìn)程加速了,而且據(jù)說ST也準(zhǔn)備在未來發(fā)布具有存算一體芯片的MCU。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2Fc60bac1bj00srfxoh009ud200pa00u0g00cn00f0.jpg&thumbnail=660x2147483647&quality=80&type=jpg

類腦計(jì)算:性能更強(qiáng)、功耗更低,算法也變成了SNN,但全世界都在研究之中,還未商業(yè)化。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2F292a309dj00srfxoi007rd200su00tmg00ef00et.jpg&thumbnail=660x2147483647&quality=80&type=jpg

可重構(gòu)計(jì)算:能夠重新配置的數(shù)據(jù)流處理器架構(gòu),專為特定用例量身定制,可在其“計(jì)算結(jié)構(gòu)”上并行執(zhí)行經(jīng)過特殊優(yōu)化的代碼。特別是在低功耗嵌入式和邊緣計(jì)算中,并且需要支持通用編程語(yǔ)言的專有軟件堆棧(編譯器)。

目前,可重構(gòu)計(jì)算的玩家包括清微智能、鯤云科技、千芯科技、瀾起科技。(可參考文章:《》)

融合:千行百業(yè)正在被重塑

DeepSeek誕生的本身,也在促進(jìn)著國(guó)內(nèi)所有行業(yè)的發(fā)展,形成了一個(gè)循環(huán)的產(chǎn)業(yè)鏈。千行百業(yè),正在因?yàn)镈eepSeek而重塑,各行各業(yè)也不斷支持DeepSeek。

1.汽車產(chǎn)業(yè):吉利汽車、東風(fēng)汽車、東風(fēng)旗下嵐圖汽車等均宣布了接入DeepSeek,大模型“上車”已經(jīng)成為大趨勢(shì);

2.手機(jī):華為系統(tǒng)級(jí)智能體小藝在HarmonyOS NEXT(原生鴻蒙)上接入了DeepSeek最新的R1模型,OPPO Find N5也將接入DeepSeek;

3.云計(jì)算:阿里云、百度智能云、騰訊云、華為云已經(jīng)官宣支持 DeepSeek大模型;

4.教育應(yīng)用:網(wǎng)易有道、云學(xué)堂均宣布全面擁抱DeepSeek-R1;

5.網(wǎng)絡(luò)安全:360、奇安信、啟明星辰、安恒、北信源、天融信、國(guó)投智能、安博通、永信至誠(chéng)、亞信、拓爾思、觀安信息均宣布接入DeepSeek;

6.生物醫(yī)藥:恒瑞醫(yī)藥、醫(yī)渡科技、智云健康、豫資開勒均宣布了DeepSeek的接入與部署;

7.電信運(yùn)營(yíng)商:三大運(yùn)營(yíng)商中國(guó)移動(dòng)、聯(lián)通、電信全面宣布接入DeepSeek;

8.軟件公司:遠(yuǎn)光軟件、安恒信息、當(dāng)虹科技、萬(wàn)興科技、金慧軟件接入DeepSeek模型。

總之,DeepSeek作為一次“全民狂歡”,其意義非凡。為了契合這個(gè)話題,我們也問了DeepSeek自己對(duì)于自己誕生的意義,它的回答是:DeepSeek的誕生不僅是技術(shù)上的突破,更是對(duì)AI未來形態(tài)的積極探索。它通過開源共享、垂直應(yīng)用和AGI愿景,推動(dòng)AI從“工具”向“伙伴”演進(jìn),同時(shí)助力中國(guó)在全球AI競(jìng)爭(zhēng)中占據(jù)更重要的戰(zhàn)略地位。其意義不僅限于商業(yè)成功,更在于為人類與AI共生的未來提供了一種可能性。

作者:EEWorld電子工程世界 付斌 在此特別鳴謝!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 國(guó)產(chǎn)芯片
    +關(guān)注

    關(guān)注

    2

    文章

    340

    瀏覽量

    30883
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35911
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1200

    瀏覽量

    15653
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    797

    瀏覽量

    1744
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI驅(qū)動(dòng)連接器賽道,材料界“DeepSeek加速國(guó)產(chǎn)

    的材料,則是構(gòu)建強(qiáng)大連接系統(tǒng)的基石。 如今,材料界的“DeepSeek”們正加速推動(dòng)高速連接器材料的國(guó)產(chǎn)化進(jìn)程,打破國(guó)外壟斷,為AI產(chǎn)業(yè)的自主可控注入強(qiáng)勁動(dòng)力。 百億高速連接器市場(chǎng) 材
    的頭像 發(fā)表于 07-07 14:04 ?191次閱讀

    HarmonyOS NEXT開發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用

    隨著HarmonyOS Next的持續(xù)發(fā)布,鴻蒙系統(tǒng)對(duì)AI能力的支持顯著增強(qiáng)。本文將深入探討如何在鴻蒙應(yīng)用中集成AI模型,結(jié)合接入DeepSeek,一起來探索開發(fā)鴻蒙原生應(yīng)用的更多可能吧! 第一步
    發(fā)表于 03-07 14:56

    EVASH芯片公司接入DeepSeekAI驅(qū)動(dòng)的芯片設(shè)計(jì)革新

    EVASH芯片公司接入DeepSeekAI驅(qū)動(dòng)的芯片設(shè)計(jì)革新
    的頭像 發(fā)表于 03-03 17:45 ?462次閱讀

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    、關(guān)于FPGA的未來——“無限可能的未來世界” AI時(shí)代的FPGA未來前景如何?FPGA+AI如何重塑未來芯片生態(tài)? 看看大聰明DeepSeek如何預(yù)測(cè)FPGA的前景......1.
    發(fā)表于 03-03 11:21

    RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作為國(guó)產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。DeepSeek-R1作為該系列最新迭代版本,實(shí)現(xiàn)了長(zhǎng)文本處理效
    發(fā)表于 02-27 16:45

    后摩智能攜手聯(lián)想開打造基于DeepSeek的信創(chuàng)AI PC

    AI技術(shù)重構(gòu)產(chǎn)業(yè)生態(tài)的關(guān)鍵節(jié)點(diǎn),國(guó)產(chǎn)芯片國(guó)產(chǎn)AI模型的深度融合正成為推動(dòng)信創(chuàng)產(chǎn)業(yè)發(fā)展的關(guān)鍵力量。后摩智能自主研發(fā)的NPU
    的頭像 發(fā)表于 02-24 17:51 ?1315次閱讀

    DeepSeek、晶振在AI終端中的相關(guān)應(yīng)用

    爆火背后AI芯片必定加速發(fā)展,晶振的作用是為芯片提供穩(wěn)定的時(shí)鐘信號(hào),確保其高效穩(wěn)定運(yùn)行??梢哉f,沒有晶振,AI
    的頭像 發(fā)表于 02-19 14:44 ?616次閱讀

    DeepSeek一體機(jī)發(fā)布!四大廠商入局,加速AI應(yīng)用落地

    電子發(fā)燒友原創(chuàng) 章鷹 近日,DeepSeek推出的AI大模型R1火爆,隨著DeepSeek的開源和國(guó)產(chǎn)大模型成本的下降,人工智能技術(shù)在企業(yè)的應(yīng)用場(chǎng)景大幅度拓展,
    的頭像 發(fā)表于 02-16 00:11 ?4209次閱讀
    <b class='flag-5'>DeepSeek</b>一體機(jī)發(fā)布!四大廠商入局,<b class='flag-5'>加速</b><b class='flag-5'>AI</b>應(yīng)用落地

    DeepSeek大模型受行業(yè)熱捧,加速AI應(yīng)用迭代

    DeepSeek大模型的誕生在行業(yè)內(nèi)掀起了巨大波瀾,吸引了眾多券商及上市公司的關(guān)注。近期,多家機(jī)構(gòu)紛紛宣布,無論是硬件還是軟件方面,都將接入DeepSeek,旨在加速AI應(yīng)用產(chǎn)品的迭
    的頭像 發(fā)表于 02-14 14:14 ?608次閱讀

    黑芝麻智能芯片全面兼容DeepSeek模型推理

    目前,黑芝麻智能武當(dāng)C1200家族芯片已經(jīng)完成DeepSeek模型的部署,A2000也將全面支持基于DeepSeek的多模態(tài)大模型。 伴隨DeepSeek
    的頭像 發(fā)表于 02-14 11:27 ?593次閱讀

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個(gè)不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場(chǎng)景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是二者的實(shí)質(zhì)性
    發(fā)表于 02-14 02:08

    無問芯穹實(shí)現(xiàn)七家國(guó)產(chǎn)芯片DeepSeek適配

    近日,無問芯穹宣布了一個(gè)重大進(jìn)展:其DeepSeek-R1、V3系列模型已成功適配并優(yōu)化至壁仞、海光、摩爾線程、沐曦、昇騰、燧原以及天數(shù)智芯等七家國(guó)產(chǎn)芯片平臺(tái)。這一成就標(biāo)志著無問芯穹在國(guó)產(chǎn)
    的頭像 發(fā)表于 02-13 16:04 ?654次閱讀

    【實(shí)測(cè)】用全志A733平板搭建一個(gè)端側(cè)Deepseek算力平臺(tái)

    ? 隨著DeepSeek 的蒸餾技術(shù)的橫空出世,端側(cè) SoC 芯片上運(yùn)行大模型成為可能。那么端側(cè)芯片跑大模型的效果如何呢?本文將在全志 A733 芯片平臺(tái)上部署一個(gè)
    發(fā)表于 02-13 10:19

    航天宏圖權(quán)大模型接入DeepSeek

    隨著國(guó)產(chǎn)AI大模型DeepSeek的快速崛起與技術(shù)突破,其在多模態(tài)數(shù)據(jù)處理、智能推理與行業(yè)應(yīng)用方面的卓越能力為AI領(lǐng)域注入了新的活力。DeepSee
    的頭像 發(fā)表于 02-11 10:20 ?510次閱讀

    中軟國(guó)際科創(chuàng)中心上線DeepSeek模型

    DeepSeek的昇騰遷移、模型部署、模型蒸餾、模型精調(diào)、SAAS應(yīng)用、Agent開發(fā)等多樣化AI服務(wù),推動(dòng)人工智能在各領(lǐng)域的應(yīng)用,加速國(guó)產(chǎn)化AGI產(chǎn)業(yè)發(fā)展!
    的頭像 發(fā)表于 02-08 18:02 ?1358次閱讀