天堂网在线少妇之a,超碰91在线免费观看

作者：京東零售姜海

DeepSeek無疑是春節(jié)檔最火爆的話題，上線不足一月，其全球累計下載量已達4000萬，反超ChatGPT成為全球增長最快的AI應用，并且完全開源。那么究竟DeepSeek有什么魔力，能夠讓大家趨之若鶩，他又將怎樣改變世界AI格局和我們的生活，本篇文章將進行簡要解析。

DeepSeek與ChatGPT對比

說到人工智能就不得不提OpenAI和ChatGPT，這是繞不開的話題，要分析DeepSeek的實力，最簡單的方式就是跟ChatGPT進行對比。

模型分類

ChatGPT目前有兩種大模型，分別是面向普通用戶，解決日常應用問題的4-OMNI，以及面向?qū)I(yè)用戶，處理深度思考問題的O1，DeepSeek與之對標的分別是V3模型以及R1模型。

實用效果

據(jù)我目前的使用體驗下來，DeepSeek的實際體驗效果完全不輸ChatGPT，甚至在解決數(shù)學、物理和推理問題方面表現(xiàn)出色，響應速度比ChatGPT還要快，且能夠完整地展示其思考和給出答案的過程，例如最經(jīng)典的，讓絕大多數(shù)AI翻車的“1.11和1.9誰大？”的問題，ChatGPT給出的回答是：

前言不搭后語，而反觀DeepSeek：

可以看到DeepSeek不僅給出了正確答案，而且展示了詳細的解題思路，甚至有最后的驗證。我也測試了許多其他的問題，DeepSeek完全不拉垮，相對于ChatGPT，他在中文領(lǐng)域的問題理解和處理更加到位，使用體驗非常好。

這無疑也使得蘋果公司柳暗花明又一村，為彌補apple intelligence上在中國區(qū)無法使用ChatGPT提供了完美的解決方案。

成本

成本分為兩部分：硬件成本和訓練成本。AI大模型構(gòu)建算法絕大部分都是基于公開的論文，所以市場上的大模型，底層邏輯都大同小異，訓練數(shù)據(jù)也來自于互聯(lián)網(wǎng)，所以主要的成本體現(xiàn)在硬件上，也就是提供AI算力的芯片，自從AI大爆發(fā)以來，大家的共識就是堆砌的芯片越多，大模型的表現(xiàn)就越優(yōu)秀。我先簡單介紹一下為什么提升AI的性能就要堆砌大量的芯片。

AI算力的芯片領(lǐng)域是英偉達（Nvidia）一家獨大，芯片價格非常昂貴，目前該公司最先進的B200芯片單張的價格就高達4萬美金，而且對于AI公司來說你還必須買，因為芯片的產(chǎn)能有限，如果你不搶就會被競爭對手買走，導致你的大模型算力不如他的。

英偉達公司為自家的芯片研發(fā)了一種叫CUDA的核心的技術(shù)，其全名叫做Compute Unified Device Architecture（統(tǒng)一計算設(shè)備架構(gòu)）。

這是一種并行計算平臺和編程模型。開發(fā)者通過它，可以間接利用GPU的處理能力，大幅提升計算性能。簡單的說，CUDA核心就像是一間間的海水提純工廠，它可以把如海洋般的GPU算力轉(zhuǎn)換成AI開發(fā)者可以直接使用的AI算力，越多的CUDA核心數(shù)量就意味著更大的AI算力。

這也就是為什么AI行業(yè)越發(fā)展，芯片的需求量越大，英偉達的市值就越高。美國也多次通過英偉達“鎖算力”以及限制芯片出口，阻礙中國的AI發(fā)展。AI行業(yè)的發(fā)展被一家公司扼住喉嚨的現(xiàn)象顯然極度不合理，英偉達可謂是真正的萬惡之源。

OpenAI不受限制，所以囤積了大量的英偉達芯片，訓練ChatGPT據(jù)傳用到了5萬張英偉達的芯片，而DeepSeek作為中國公司，在這方面相比自然相去甚遠。

DeepSeek沖擊

由于CUDA技術(shù)被英偉達牢牢掌握，所以間接提高了所有AI大模型的使用成本，阻礙了AI的發(fā)展。以ChatGPT為例，4-OMNI和O1兩個大模型的研發(fā)成本高達數(shù)十億美金，免費用戶使用有諸多限制，付費用戶每月20美金，專業(yè)用戶每月200美金，如果企業(yè)想要接入OpenAI的人工智能服務，調(diào)用API做客服等用途，則更是按字符收費，雖然比人工客服省錢，但也是一筆不小的開銷。這些收入中，絕大多數(shù)都是用來平衡購買芯片帶來的巨大成本。

DeepSeek之所以引起全球矚目，就是因為他在“芯片”受限的前提下，達到了與ChatGPT近似的使用體驗，甚至在某些領(lǐng)域還遠遠超過了。OpenAI和它的母公司微軟囤積了大量的高端芯片，而DeepSeek手里的芯片，不論從數(shù)量還是質(zhì)量上都不占優(yōu)勢，甚至可以說遠遠落后。

在深度解析DeepSeek開源的模型代碼之后，研究人員發(fā)現(xiàn)，DeepSeek之所以能夠絕地反擊，秘訣就在于他繞過了CUDA核心的限制，使用了完全創(chuàng)新的技術(shù)訓練大模型，直接利用英偉達的底層技術(shù)調(diào)用了GPU的算力，相當于能直接使用如大海般的GPU資源，所以才能使用低端的芯片，在極短的時間內(nèi)完成了模型的訓練，達到了與ChatGPT近似的效果。

而且此技術(shù)成功解除了AI模型對英偉達芯片的依賴，使DeepSeek可以使用華為的芯片進行訓練。DeepSeek服務調(diào)用的費用只有ChatGPT的十分之一，具有非常高的性價比和廣闊的應用前景。

整體來說，DeepSeek用了很少的錢，很低端的工具，就把美國投入上百億美元的事給辦了。自從DeepSeek爆火之后，市場普遍認為英偉達的芯片估值過高，要實現(xiàn)高性能的AI并不需要如此之貴的芯片，最高端的芯片也并不值那個價錢，這直接導致英偉達的股價當天就暴跌17%，創(chuàng)造了美國股市歷史上單日最大跌幅，截至目前英偉達市值蒸發(fā)近6000億美元。

技術(shù)曝光的第二天，英偉達，微軟和亞馬遜的計算平臺都宣布接入DeepSeek模型，堪稱AI界的“斯普特尼克時刻”，就如同當年蘇聯(lián)率先成功發(fā)射人造衛(wèi)星時一樣，讓一直以為自己在技術(shù)上遙遙領(lǐng)先的西方世界陷入了一片混亂，世界AI市場的格局就此改變。

本地化部署R1模型

DeepSeek雖然好，但是用過的同學都知道他有個致命的問題，就是萬惡的資本主義經(jīng)常組織針對DeepSeek的網(wǎng)絡攻擊，導致使用時出現(xiàn)“服務器繁忙的問題”。

為了避免被攻擊，降低延遲和卡頓，規(guī)避共享敏感信息的風險，同時更靈活的進行微調(diào)和實驗，我們可以把R1模型部署到本地。

安裝Ollama

首先登陸Ollama官網(wǎng)：https://ollama.com/。打開官網(wǎng)，然后點擊下載，之后安裝到本地。

拉取 DeepSeek R1 模型

然后打開Ollama 的模型列表： https://ollama.com/library/deepseek-r1 ，搜索到DeepSeek R1：

顯卡需求

各個模型版本需求的顯卡檔次大致如下表：

模型（DeepSeek-R1）	顯卡檔次	顯存需求
1.5b	GTX1050以上	1GB
7b	RTX2050、RTX3060以上	4GB
8b	RTX2060、RTX3070以上	5GB
14b	RTX3080、RTX4070以上	8GB
32b	RTX4080以上	18GB
70b	RTX4090、RTX5080以上	36GB以上

我們普通的電腦安裝1.5B，7B就可以使用，然后在【右上角的的代碼】復制，打開終端，輸入上述下載命令回車后，會出現(xiàn)模型下載進度，當進度為100%就說明該模型已經(jīng)下載到本地了。

輸入ollama list可以查看安裝的模型。

此時已經(jīng)可以在控制臺使用R1模型進行問答了。

包裝GUI

只能在命令行中使用既不美觀也特別的不方便，所以我們可以使用現(xiàn)成的GUI進行包裝，相當于包上圖形用戶界面。這里以Cherry Studio為例，下載對應版本后打開。

在設(shè)置中選擇模型服務，選中Ollama

填入對應的本地模型信息：

然后就可以使用了！希望本篇文章能夠幫到大家！

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

大模型

大模型

+關(guān)注

關(guān)注
2

文章
3146

瀏覽量
4076
DeepSeek

DeepSeek

+關(guān)注

關(guān)注
1

文章
798

瀏覽量
1757

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

DeepSeek沖擊（含本地化部署實踐）

評論