一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新火種AI|2024乍到,會(huì)成為小模型的當(dāng)打之年嗎?

新火種 ? 來源:新火種 ? 作者:新火種 ? 2024-01-10 22:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


作者:小巖

編輯:美美

乘著ChatGPT爆火的東風(fēng),2023年成為了當(dāng)之無愧的“大模型爆發(fā)之年”。跟隨ChatGPT的腳步,諸多大廠和知名企業(yè)推出了自己的AI大模型。也正因此,大模型賽道的競(jìng)爭變得異常激烈,燒錢的勢(shì)頭也變得異常兇猛。

不過,這樣的趨勢(shì)很可能在2024年產(chǎn)生變化。每個(gè)事物的發(fā)展都要經(jīng)歷“產(chǎn)生,發(fā)展,高潮,低谷”的階段,已經(jīng)在2023年大放異彩,涌現(xiàn)無數(shù)高光時(shí)刻的大模型很可能在2024年漸漸冷卻,褪掉光環(huán),而小模型,則有可能成為今年的破局之道。

“大模型雖然亮眼,但企業(yè)對(duì)這些技術(shù)的采用幾乎沒有實(shí)質(zhì)性的增長”。

眾所周知,在高新技術(shù)和燒錢測(cè)試的加持下,大模型產(chǎn)品的表現(xiàn)變得十分突出,整個(gè)賽道也卷的出奇。但可惜的是,這些花大力氣砸出來的優(yōu)秀大模型產(chǎn)品很難成功變現(xiàn)。

根據(jù)印度IT巨頭Infosys的最新發(fā)現(xiàn),只有6 %的歐洲公司通過生成式AI用例創(chuàng)造了商業(yè)價(jià)值。麥肯錫也在2023年的一份報(bào)告中得出結(jié)論,“盡管生成式AI的使用可能會(huì)刺激其他人工智能工具的采用,但我們認(rèn)為,企業(yè)對(duì)這些技術(shù)的采用幾乎沒有實(shí)質(zhì)性的增長。”

而資本市場(chǎng)對(duì)于大模型AI的態(tài)度也不樂觀。從融資規(guī)模來看,生成式AI的投資浪潮是一次“短暫繁榮”,盡管頭部以及率先搶占先機(jī)的AI公司獲得了不少資本的青睞,但后續(xù)的AI公司如果想要收獲資金,并不容易。根據(jù)Crunchbase數(shù)據(jù)顯示,2023 年,人工智能獨(dú)角獸公司的融資大幅下降,僅為 2021 年市場(chǎng)高峰時(shí)的25 %左右;全球最活躍的9大 VC 在AI獨(dú)角獸公司的投資也是大幅下降。

究其原因,這并不難理解。潮水退去,方知誰在裸泳。投資者都是趨利避害的,自然想看到自己投資的AI公司產(chǎn)出盡可能多的利潤。在這種情況下,針對(duì)AI的投資泡沫會(huì)越來越少,據(jù)此,AI公司試錯(cuò)的成本將大大提高。

大模型發(fā)展即將受阻,小模型能否順勢(shì)而為,迎來自己的井噴元年?

在這種情況下,AI模型需要朝著效率更高,成本更低的方向去發(fā)展。從這個(gè)角度去說,小模型很可能比大模型更實(shí)用,更方便。

Snorkel AI曾做過一個(gè)試驗(yàn),分別用GPT-3微調(diào)和自己搭建的小模型來訓(xùn)練一個(gè)法律領(lǐng)域的垂直模型。GPT-3的微調(diào)和搭建成本是7418美元,10000推理的花費(fèi)是173美元,而自己搭建的小模型成本僅為1915美元,10000次推理也只是花費(fèi)了0.26美元。從正確率來看,GPT-3微調(diào)的垂直模型正確率為71.4 %,小模型則為71.3 %。

值得一提的是,GPT-3的參數(shù)量很大,是小模型的1400倍。我們當(dāng)然不能因?yàn)镚PT-3微調(diào)的正確率與小模型的正確率相似就妄下結(jié)論,認(rèn)為“參數(shù)量沒用”。不過,這或許就是“殺雞焉用牛刀”的道理,就像《華爾街日?qǐng)?bào)》提到的那句玩笑,用GPT-4總結(jié)電子郵件就像“讓蘭博基尼送披薩”。畢竟,在很多場(chǎng)景下,用戶需要的并沒有那么多。

目前,國內(nèi)的AI領(lǐng)域也在面臨相同的狀況。

如今,國內(nèi)已經(jīng)發(fā)布的所謂“大模型”超過200個(gè),“百模大戰(zhàn)”進(jìn)行的如火如荼。而處于頭部的幾個(gè)大模型都曾宣稱自己的參數(shù)規(guī)模超千億級(jí)別,有的甚至達(dá)到了萬億的規(guī)模。

但規(guī)模只要夠大,就一定夠好嗎?未必。百度的李彥宏曾經(jīng)說過,“100多個(gè)大模型浪費(fèi)社會(huì)資源……尤其在中國算力還受限制情況下,企業(yè)應(yīng)該去探索各行各業(yè)的應(yīng)用結(jié)合,全新的 APP產(chǎn)品可能性等?!?/p>

事實(shí)上,與李彥宏持有相同觀點(diǎn)的人并不在少數(shù)。相較于要把AI模型的規(guī)模不斷做大這件事,大家更應(yīng)該關(guān)注如何將模型更好的應(yīng)用到實(shí)處。不是大模型做不起,而是小模型更具性價(jià)比。

做小模型的本質(zhì),其實(shí)是在做離用戶更近的模型。

更重要的是,從某種層面來說,更好操作,更低成本的小模型或許更能匹配C端用戶的核心訴求。

大模型看似高大上,但卻存在成本高,個(gè)性化不足的問題。如果大模型可以變小,甚至直接走進(jìn)移動(dòng)端,將模型塞進(jìn)手機(jī)智能汽車,機(jī)器人等設(shè)備,那么一定會(huì)大大提高C端用戶的黏著度。特別是從創(chuàng)業(yè)角度來看,搭建離用戶更近的模型自然也更有生存空間,因?yàn)樗麄冸x用戶更近。

事實(shí)上,很多企業(yè)已經(jīng)將這樣的策略提上了日程。有媒體報(bào)道,早在2022年初,阿里巴巴達(dá)摩院,上海浙江大學(xué)高等研究院,以及上海人工智能實(shí)驗(yàn)室的聯(lián)合研究團(tuán)隊(duì)通過蒸餾壓縮和參數(shù)共享等技術(shù)手段,將3.4億參數(shù)的M6模型壓縮到了百萬參數(shù),其規(guī)模只有以大模型的三十分之一,卻保留了大模型90 %以上的性能。當(dāng)然,2022年的3.4億,較今天的大模型規(guī)模來看不算太大,但這個(gè)舉動(dòng)無疑為“大規(guī)模瘦身”開了一個(gè)好頭。

2023年初,關(guān)于AI大模型的競(jìng)爭逐漸激烈,局面逐漸焦灼,最終演變成了一場(chǎng)聲勢(shì)浩大的模型競(jìng)賽。如今,潮水褪去,在耗費(fèi)了大量金錢,人力,時(shí)間成本之后,愈來愈多的AI公司悟出了一個(gè)道理:如何“變大”并不是關(guān)鍵,關(guān)鍵在于要如何“既大又好”,更重要的是,當(dāng)大模型進(jìn)入應(yīng)用環(huán)節(jié),如何該做到“以小馭大。

如同區(qū)塊鏈行業(yè)一樣,野蠻生長之后勢(shì)必會(huì)迎來監(jiān)管的壓力,AI也將面臨同樣的狀況。如今,隨著AI影響力的增強(qiáng),相關(guān)的問題也開始凸顯譬如Midjourney + Elevenlabs 生成的假新聞就引起過極大的影響。

此外,AI大模型的推進(jìn)將消耗掉大量的資源。有新聞報(bào)道,到2027年,全球的AI需求可能會(huì)消耗掉66億立方米的水資源,幾乎相當(dāng)于美國華盛頓州全年的取水量。AI對(duì)環(huán)境和能源可能造成的影響會(huì)對(duì)AI行業(yè)造成一定的經(jīng)濟(jì)壓力和政治壓力。到了那時(shí),如何用更少的數(shù)據(jù),更少的能源訓(xùn)練出更好用的模型,就成為了未來的重中之重。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279242
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48987

    瀏覽量

    249143
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1589

    瀏覽量

    9067
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3132

    瀏覽量

    4050
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    在人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,
    發(fā)表于 07-04 11:10

    如何賦能醫(yī)療AI模型應(yīng)用?

    “百模大戰(zhàn)”。不僅如此,這些通用AI模型還逐漸滲透各個(gè)垂直行業(yè)中,其中生命科學(xué)和醫(yī)療健康行業(yè)成為了拓展速度較快的一個(gè)領(lǐng)域。從2023年2月至10月初,國內(nèi)市場(chǎng)上
    的頭像 發(fā)表于 05-07 09:36 ?257次閱讀
    如何賦能醫(yī)療<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>應(yīng)用?

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+ 入門篇學(xué)習(xí)

    很高興又有機(jī)會(huì)學(xué)習(xí)ai技術(shù),這次試讀的是「零基礎(chǔ)開發(fā)AI Agent」,作者葉濤、管鍇、張心雨。 大模型的普及是近三年來的一件大事,萬物皆可大模型
    發(fā)表于 05-02 09:26

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點(diǎn),從通用模型向場(chǎng)景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無界”為主題召開天璣開發(fā)者大會(huì)2025(MDDC 2025),不僅聚合了全球生態(tài)
    發(fā)表于 04-13 19:52

    AI模型端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI模型解決方案,激活場(chǎng)景智能新范式

    AI技術(shù)飛速發(fā)展的當(dāng)下,AI模型的應(yīng)用正從云端向端側(cè)加速滲透。 作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,移遠(yuǎn)通信憑借深厚的技術(shù)積累與前瞻性的戰(zhàn)略布局,在
    發(fā)表于 03-27 11:26 ?233次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解決方案,激活場(chǎng)景智能新范式

    AI模型端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI模型解決方案,激活場(chǎng)景智能新范式

    AI技術(shù)飛速發(fā)展的當(dāng)下,AI模型的應(yīng)用正從云端向端側(cè)加速滲透。作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,移遠(yuǎn)通信憑借深厚的技術(shù)積累與前瞻性的戰(zhàn)略布局,在
    的頭像 發(fā)表于 03-26 19:05 ?459次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解決方案,激活場(chǎng)景智能新范式

    AI模型在汽車應(yīng)用中的推理、降本與可解釋性研究

    佐思汽研發(fā)布《2024-2025年AI模型及其在汽車領(lǐng)域的應(yīng)用研究報(bào)告》。 推理能力成為模型性能提升的驅(qū)動(dòng)引擎
    的頭像 發(fā)表于 02-18 15:02 ?1221次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在汽車應(yīng)用中的推理、降本與可解釋性研究

    2024AI編程技術(shù)與工具發(fā)展總結(jié)

    最近,開源中國 OSCHINA、Gitee 與 Gitee AI? 聯(lián)合發(fā)布了《2024 中國開源開發(fā)者報(bào)告》 。 報(bào)告聚焦 AI模型領(lǐng)域,對(duì)過去一年的技術(shù)演進(jìn)動(dòng)態(tài)、技術(shù)趨勢(shì)、以及
    的頭像 發(fā)表于 02-13 09:11 ?665次閱讀
    <b class='flag-5'>2024</b>年<b class='flag-5'>AI</b>編程技術(shù)與工具發(fā)展總結(jié)

    探索智慧實(shí)踐,洞見AI未來!星宸科技2024開發(fā)者大會(huì)暨產(chǎn)品發(fā)布會(huì)成功舉辦

    在人工智能技術(shù)飛速發(fā)展的當(dāng)下,多模態(tài)大模型加速向行業(yè)深耕,為更大范圍滿足AI產(chǎn)業(yè)創(chuàng)新融合需求,12月20日,星宸科技以“Leading AI Everywhere”為主題的“
    的頭像 發(fā)表于 12-23 14:34 ?1040次閱讀
    探索智慧實(shí)踐,洞見<b class='flag-5'>AI</b>未來!星宸科技<b class='flag-5'>2024</b>開發(fā)者大會(huì)暨產(chǎn)品發(fā)布<b class='flag-5'>會(huì)成</b>功舉辦

    AI模型市場(chǎng)分析

    隨著人工智能技術(shù)的快速發(fā)展,AI模型成為全球科技競(jìng)爭的新高地、未來產(chǎn)業(yè)的新賽道以及經(jīng)濟(jì)發(fā)展的新引擎。下面,AI部落小編分析了當(dāng)前AI
    的頭像 發(fā)表于 11-01 09:51 ?558次閱讀

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.49】大模型啟示錄:一本AI應(yīng)用百科全書

    一次大模型變革中,完全不缺態(tài)度,只缺認(rèn)知與落地的經(jīng)驗(yàn)。 在過去的兩年中,我們看到了全球太多的巨頭和普通中小企業(yè),進(jìn)入All in AI的投資周期。有的已經(jīng)開始落地具體的生產(chǎn)流程,例如企業(yè)內(nèi)部客服、優(yōu)化
    發(fā)表于 10-28 15:34

    博聯(lián)AI模型全屋智能亮相2024中國建博會(huì)

    2024中國建博會(huì)(廣州)在廣交會(huì)展館及保利世貿(mào)博覽館盛大啟幕。 BroadLink博聯(lián)智能攜AI模型全屋智能以及AI商業(yè)照明解決方案驚喜亮相, 全方位展示
    的頭像 發(fā)表于 09-12 15:46 ?737次閱讀

    長虹發(fā)布滄海智能體AI TV與智匯家AI模型

    2024年德國柏林消費(fèi)電子展覽會(huì)(IFA2024)盛大啟幕,長虹集團(tuán)攜全球首款滄海智能體AI TV與長虹美菱智匯家AI模型驚艷亮相。滄海智
    的頭像 發(fā)表于 09-10 18:21 ?1232次閱讀

    ai模型ai框架的關(guān)系是什么

    的數(shù)據(jù)和計(jì)算資源來進(jìn)行訓(xùn)練。AI模型的主要特點(diǎn)包括: 1.1 參數(shù)數(shù)量大:AI模型的參數(shù)數(shù)量通常在數(shù)百萬數(shù)十億之間,這使得它們能夠捕捉
    的頭像 發(fā)表于 07-16 10:07 ?8.9w次閱讀

    ai模型和傳統(tǒng)ai的區(qū)別在哪?

    的BERT模型使用了33億個(gè)參數(shù),而傳統(tǒng)AI模型通常只有幾千幾百萬個(gè)參數(shù)。 模型復(fù)雜度 AI
    的頭像 發(fā)表于 07-16 10:06 ?2671次閱讀