一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超過(guò)150萬(wàn)個(gè)大模型,DeepSeek全球最受歡迎

Felix分析 ? 來(lái)源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2025-02-25 00:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)北京時(shí)間 2 月 24 日凌晨 3 點(diǎn),全球最大開(kāi)源平臺(tái)之一 huggingface 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Clement Delangue 發(fā)布的最新數(shù)據(jù)顯示,中國(guó)開(kāi)源大模型 DeepSeek-R1 在 huggingface 平臺(tái)上超過(guò) 150 萬(wàn)個(gè)模型中脫穎而出,成為該平臺(tái)最受歡迎的開(kāi)源大模型,點(diǎn)贊數(shù)突破 1 萬(wàn)。


目前,DeepSeek 已在全球范圍內(nèi)成為爆火的 AI 大模型。1 月 26 日,DeepSeek 首次登上蘋(píng)果 App Store 全球榜首并持續(xù)領(lǐng)先。上線(xiàn) 18 天,其下載量達(dá)到 1600 萬(wàn)次,幾乎是同期 ChatGPT 下載量的兩倍,其中印度是新用戶(hù)增長(zhǎng)的最大來(lái)源地。據(jù)統(tǒng)計(jì),DeepSeek 目前在全球 140 多個(gè)國(guó)家的 App 榜單中位居第一。

在流量方面,2025 年 1 月,DeepSeek 網(wǎng)站的桌面和移動(dòng)訪(fǎng)問(wèn)量飆升至 2.78 億次,而2024年12月僅為 1200 萬(wàn)次。中國(guó)貢獻(xiàn)了近四分之一的桌面流量,美國(guó)、巴西、印度、德國(guó)等國(guó)家也占據(jù)一定比例。

此前,Clement 特意發(fā)文祝賀 DeepSeek-R1 下載量突破 1000 萬(wàn)次,這一成績(jī)也創(chuàng)造了 huggingface 平臺(tái)有史以來(lái)最受歡迎模型的記錄。

那么,DeepSeek 究竟給開(kāi)源大模型的發(fā)展帶來(lái)了什么,使其如此火爆?

DeepSeek 給開(kāi)源大模型發(fā)展帶來(lái)的影響

DeepSeek 通過(guò)技術(shù)創(chuàng)新和商業(yè)策略的突破,重塑了開(kāi)源大模型行業(yè)的競(jìng)爭(zhēng)格局,為開(kāi)源 AI 大模型的發(fā)展帶來(lái)了積極影響。

帶動(dòng)技術(shù)創(chuàng)新
DeepSeek 在模型訓(xùn)練中采用強(qiáng)化學(xué)習(xí)和模型蒸餾技術(shù),在減少模型參數(shù)規(guī)模的同時(shí)提升性能。例如,R1 模型在數(shù)學(xué)推理任務(wù)中的準(zhǔn)確率高達(dá) 97.3%。在架構(gòu)設(shè)計(jì)方面,以 DeepSeek-V3 為例,其首創(chuàng)多頭潛注意力機(jī)制,有效解決了長(zhǎng)文本推理時(shí)的顯存效率瓶頸問(wèn)題,還革新了動(dòng)態(tài)路由算法,提高了專(zhuān)家利用率。

降低成本
DeepSeek 降低了開(kāi)源大模型的訓(xùn)練成本、推理成本和模型使用成本。其采用的混合專(zhuān)家模型(MoE)架構(gòu)利用動(dòng)態(tài)冗余策略,將計(jì)算成本降低至傳統(tǒng)模型的 1/10。結(jié)合自研的稀疏結(jié)構(gòu)(MLA 架構(gòu)),提升了推理效率,實(shí)現(xiàn)了性能與成本的平衡。通過(guò)純深度學(xué)習(xí)方法,DeepSeek 使 AI 涌現(xiàn)出自發(fā)推理能力,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上達(dá)到國(guó)際頂尖水平(如比肩 GPT-4/o1)。借助這些創(chuàng)新,DeepSeek 將大模型訓(xùn)練成本壓縮至 560 萬(wàn)美元量級(jí),僅為美國(guó)同類(lèi)模型的 1/100,打破了動(dòng)輒數(shù)億美元投入的行業(yè)慣例。同時(shí),DeepSeek 通過(guò)開(kāi)源以及提供低成本的 API,開(kāi)發(fā)者可以自由定制和二次開(kāi)發(fā)。其 API 定價(jià)親民,僅為 OpenAI 同類(lèi)產(chǎn)品的 1/10,讓中小企業(yè)能夠以較低成本進(jìn)入 AI 領(lǐng)域,推動(dòng)了大模型在更多領(lǐng)域的應(yīng)用和創(chuàng)新。

拓展應(yīng)用邊界
DeepSeek 拓展了開(kāi)源大模型新的應(yīng)用邊界,使 AI 大模型得以廣泛落地。DeepSeek 采用免費(fèi)商用開(kāi)源策略,完全開(kāi)放模型源碼并支持衍生開(kāi)發(fā),推動(dòng)開(kāi)發(fā)者生態(tài)快速擴(kuò)張。這種 “零門(mén)檻 + 零成本” 模式直接導(dǎo)致行業(yè)價(jià)格體系崩塌,API 使用成本降至 OpenAI 的 5%,最終引領(lǐng)市場(chǎng)進(jìn)入 “按厘計(jì)價(jià)” 甚至零成本時(shí)代。這一舉措激發(fā)了全球開(kāi)發(fā)者的熱情,推動(dòng)了技術(shù)共享與社區(qū)協(xié)作。眾多開(kāi)發(fā)者基于 DeepSeek 的模型進(jìn)行創(chuàng)新,加速了垂直領(lǐng)域小模型的發(fā)展。同時(shí),DeepSeek 憑借模型壓縮等技術(shù),成功適配智能眼鏡、工業(yè)終端等邊緣設(shè)備。在金融交易、工業(yè)質(zhì)檢、醫(yī)療影像分析等眾多垂直領(lǐng)域展現(xiàn)出獨(dú)特的應(yīng)用優(yōu)勢(shì),為各行業(yè)的數(shù)字化轉(zhuǎn)型提供了強(qiáng)大動(dòng)力,極大地拓展了開(kāi)源大模型的應(yīng)用場(chǎng)景。

推動(dòng)模型融合
DeepSeek 推動(dòng)了開(kāi)源大模型和閉源大模型的融合。其開(kāi)源模型 R1 發(fā)布后,迫使阿里、騰訊等巨頭跟進(jìn)降價(jià),同時(shí)刺激全球開(kāi)發(fā)者社區(qū)加速創(chuàng)新。在這個(gè)過(guò)程中,相當(dāng)一部分閉源大模型選擇與 DeepSeek 進(jìn)行融合。例如,2025 年 2 月,文心一言(現(xiàn)更名為 “文小言”)App 的 4.9.0 版本更新,接入了 DeepSeek-R1 開(kāi)源大模型,借助該模型優(yōu)化了拍照解題功能,通過(guò) “思維鏈” 技術(shù)將解題過(guò)程可視化;2 月 6 日,吉利汽車(chē)宣布將自研的星睿車(chē)控 FunctionCall 大模型、汽車(chē)主動(dòng)交互端側(cè)大模型等與 DeepSeek R1 大模型深度融合,以重新定義智能汽車(chē)的人機(jī)交互及智能駕駛;醫(yī)渡科技的 “AI 醫(yī)療大腦” YiduCore、智云健康的 “智云大腦” 等醫(yī)療領(lǐng)域的閉源模型也接入了 DeepSeek-R1 模型,用于升級(jí)智能預(yù)問(wèn)診、病歷生成與質(zhì)控等核心醫(yī)療 AI 應(yīng)用。DeepSeek 的成功促使其他大模型開(kāi)發(fā)者如 OpenAI、百度等開(kāi)始重新審視開(kāi)源策略,對(duì)整個(gè)行業(yè)的發(fā)展起到了積極的推動(dòng)作用。

毫無(wú)疑問(wèn),DeepSeek 改變了 AI 大模型的市場(chǎng)格局。憑借低成本、高性能、全國(guó)產(chǎn)的特點(diǎn),引發(fā)人工智能產(chǎn)業(yè)生態(tài)巨變,在一定程度上沖擊了 OpenAI 等巨頭主導(dǎo)的市場(chǎng)格局,加快形成大模型市場(chǎng)的新增長(zhǎng)極,推動(dòng)了整個(gè)行業(yè)的創(chuàng)新發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    789

    瀏覽量

    1541
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    最受歡迎的單板計(jì)算機(jī) x 最流行的移動(dòng)操作系統(tǒng)

    在本文中,我們將揭秘:應(yīng)在樹(shù)莓派上使用Android的4個(gè)理由從哪里獲取樹(shù)莓派的Android系統(tǒng)?該選擇哪一個(gè)?未來(lái)展望。在樹(shù)莓派上使用Android的4個(gè)理由樹(shù)莓派無(wú)疑是世界上最受歡迎
    的頭像 發(fā)表于 06-18 17:20 ?155次閱讀
    <b class='flag-5'>最受歡迎</b>的單板計(jì)算機(jī) x 最流行的移動(dòng)操作系統(tǒng)

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.62】一本書(shū)讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘

    2025年年初,DeepSeek 成為全球人工智能(AI)領(lǐng)域的焦點(diǎn),其DeepSeek-V3 和DeepSeek-R1 版本在行業(yè)內(nèi)引發(fā)了結(jié)構(gòu)性震動(dòng)。
    發(fā)表于 06-09 14:38

    如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開(kāi)發(fā)的開(kāi)源推理模型,用于解決需要邏輯
    的頭像 發(fā)表于 03-12 13:45 ?1361次閱讀
    如何使用OpenVINO運(yùn)行<b class='flag-5'>DeepSeek</b>-R1蒸餾<b class='flag-5'>模型</b>

    HarmonyOS NEXT開(kāi)發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用

    隨著HarmonyOS Next的持續(xù)發(fā)布,鴻蒙系統(tǒng)對(duì)AI能力的支持顯著增強(qiáng)。本文將深入探討如何在鴻蒙應(yīng)用中集成AI模型,結(jié)合接入DeepSeek,一起來(lái)探索開(kāi)發(fā)鴻蒙原生應(yīng)用的更多可能吧! 第一步
    發(fā)表于 03-07 14:56

    聆思CSK6大模型語(yǔ)音開(kāi)發(fā)板接入DeepSeek資料匯總(包含深度求索/火山引擎/硅基流動(dòng)華為昇騰滿(mǎn)血版)

    本帖最后由 jf_40317719 于 2025-3-6 21:20 編輯 近期也有不少開(kāi)發(fā)者想把自己的智能硬件接入DeepSeek模型,本篇就以聆思CSK6大模型開(kāi)發(fā)板接入DeepS
    發(fā)表于 03-06 17:02

    RK3588開(kāi)發(fā)板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作為國(guó)產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。DeepSeek-R1作為該系列最新迭代版本,實(shí)現(xiàn)了長(zhǎng)文本處理效
    發(fā)表于 02-27 16:45

    鴻蒙原生應(yīng)用開(kāi)發(fā)也可以使用DeepSeek

    近期DeepSeek火爆全球,那一樣很火的開(kāi)發(fā)鴻蒙原生應(yīng)用的DevEco Studio如果把它接入,會(huì)發(fā)生什么“化學(xué)反應(yīng)”呢?下面我們將詳細(xì)分享如何在DevEco Studio中利用CodeGPT
    發(fā)表于 02-20 18:06

    開(kāi)源大模型DeepSeek的開(kāi)放內(nèi)容詳析

    當(dāng)大家討論為什么 DeepSeek 能夠形成全球刷屏之勢(shì),讓所有廠(chǎng)商、平臺(tái)都集成之時(shí),「開(kāi)源」成為了最大的關(guān)鍵詞之一,圖靈獎(jiǎng)得主 Yann LeCun 稱(chēng)其是「開(kāi)源的勝利」。模型開(kāi)源一直備受關(guān)注,從
    的頭像 發(fā)表于 02-19 09:48 ?1368次閱讀
    開(kāi)源大<b class='flag-5'>模型</b><b class='flag-5'>DeepSeek</b>的開(kāi)放內(nèi)容詳析

    添越智創(chuàng)基于 RK3588 開(kāi)發(fā)板部署測(cè)試 DeepSeek 模型全攻略

    在 AI 技術(shù)日新月異的當(dāng)下,新的模型與突破不斷涌現(xiàn)。近期,DeepSeek(深度求索)模型以其卓越性能和親民成本,迅速在全球開(kāi)發(fā)者圈子里引發(fā)熱議。作為一款強(qiáng)大的語(yǔ)言
    發(fā)表于 02-14 17:42

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個(gè)不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場(chǎng)
    發(fā)表于 02-14 02:08

    【實(shí)測(cè)】用全志A733平板搭建一個(gè)端側(cè)Deepseek算力平臺(tái)

    ? 隨著DeepSeek 的蒸餾技術(shù)的橫空出世,端側(cè) SoC 芯片上運(yùn)行大模型成為可能。那么端側(cè)芯片跑大模型的效果如何呢?本文將在全志 A733 芯片平臺(tái)上部署一個(gè)
    發(fā)表于 02-13 10:19

    萬(wàn)里紅全面支持DeepSeek系列大模型

    新年伊始,DeepSeek模型及其應(yīng)用橫空出世,憑借著出色的推理能力,迅速激發(fā)了千行百業(yè)的使用熱情。萬(wàn)里紅積極響應(yīng)市場(chǎng)需求,快速迭代大模型知識(shí)應(yīng)用系統(tǒng),最新版本已全面支持私有化部署
    的頭像 發(fā)表于 02-10 10:45 ?494次閱讀

    商湯大裝置接入DeepSeek系列模型

    即日起,企業(yè)客戶(hù)和開(kāi)發(fā)者可在商湯大裝置萬(wàn)象平臺(tái)中,快速部署DeepSeek-V3、DeepSeek-R1等模型,可享受3個(gè)月內(nèi)1000
    的頭像 發(fā)表于 02-10 10:16 ?594次閱讀

    在龍芯3a6000上部署DeepSeek 和 Gemma2大模型

    serve 2.運(yùn)行deepseek-r1大模型 到以下網(wǎng)站選擇不同參數(shù)的大模型 https://ollama.com/library/deepseek-r1 新開(kāi)一
    發(fā)表于 02-07 19:35

    采用FP8混合精度,DeepSeek V3訓(xùn)練成本僅557.6萬(wàn)美元!

    一, 前言? ? 在AI領(lǐng)域,訓(xùn)練一個(gè)大型語(yǔ)言模型(LLM)是一個(gè)耗時(shí)且復(fù)雜的過(guò)程。根據(jù)之前在《從零開(kāi)始訓(xùn)練一個(gè)大語(yǔ)言模型需要投資多少錢(qián)?》
    的頭像 發(fā)表于 01-13 11:12 ?1218次閱讀