一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型應(yīng)用,必須警惕“速成幻覺”

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2023-07-26 09:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們知道,大模型會(huì)編造不正確的答案,產(chǎn)生“幻覺”。

其實(shí),在應(yīng)用層面,還存在一個(gè)更隱蔽的“幻覺”,就是創(chuàng)業(yè)公司忽略了大模型落地所需要的長周期、重基建和工程化難度,帶來的“速成幻覺”。

隨著“百模大戰(zhàn)”拉開序幕,大模型過剩帶來的市場擠壓,也給整個(gè)大模型生態(tài)帶來了行業(yè)洗牌的風(fēng)險(xiǎn)。

越來越多的人有了共識(shí),基礎(chǔ)通用大模型競爭激烈,注定是少數(shù)人的游戲。創(chuàng)業(yè)公司隨時(shí)可能倒掉,造成項(xiàng)目爛尾。

具備技術(shù)、產(chǎn)品和行業(yè)優(yōu)勢(shì)的“第一梯隊(duì)”大廠,比如百度的文心大模型3.5,已經(jīng)跟國內(nèi)其他模型拉開了差距,具有了一定的先發(fā)優(yōu)勢(shì)和市場打開度,更容易在這場白熱化競爭中生存下來。

既然大模型很難“速成”,那么創(chuàng)業(yè)公司的“幻覺”,又是從何而來的呢?

第一種“幻覺”:開源干翻閉源

創(chuàng)業(yè)公司紛紛入局大模型,給它們勇氣的,不是梁靜茹,而是開源。

以Meta的Llama 2、智譜AI的ChatGLM為代表的開源大模型,陸續(xù)免費(fèi)并支持授權(quán)商用,這無疑是一件好事,讓創(chuàng)業(yè)公司不用重復(fù)造輪子,可以用開源大模型作為基座模型,快速開發(fā)出相應(yīng)的商用版本大模型或大模型應(yīng)用。

開源的低門檻、低成本,帶來了“開源干翻閉源”的幻覺。

為什么說是幻覺?我們可以從企業(yè)視角為出發(fā)點(diǎn)——即使有了開源模型,想要落地應(yīng)用大模型,還有哪些必要條件?

一是云基礎(chǔ)設(shè)施。

大模型落地需要進(jìn)一步微調(diào)、訓(xùn)練、運(yùn)行,要在云平臺(tái)上運(yùn)行。而創(chuàng)業(yè)公司跟OpenAI 、百度等閉源頭部公司的一大差距,就在于缺少跟云平臺(tái)的“緊耦合”。

眾所周知,OpenAI有微軟的大力支持,百度文心大模型背后是百度智能云,這些大廠自研大模型,都對(duì)云基礎(chǔ)設(shè)施的計(jì)算硬件集群、資源調(diào)度等,進(jìn)行針對(duì)性的協(xié)調(diào)優(yōu)化,大模型+AI云的緊密配合,可以更高效地利用計(jì)算資源,降低大模型的邊際成本。

wKgaomS_1r6AVOnaAABUJ9i0SDU031.jpg

海外大模型開源社區(qū)的“明星”如Together會(huì)為企業(yè)客戶提供開源模型及配套的云平臺(tái),MosaicML也提供Mosaic Cloud 和多云混合服務(wù),國內(nèi)的開源項(xiàng)目如ChatGLM,也選擇與多家云廠商合作。

可以看到,開源項(xiàng)目跟云平臺(tái)的“松耦合”,會(huì)受到云平臺(tái)的配合度、商業(yè)政策等的影響,一旦后期出現(xiàn)資源漲價(jià)、利益分成、研發(fā)意向變化,都會(huì)給基于開源的大模型項(xiàng)目帶來商業(yè)化風(fēng)險(xiǎn)。

其次,是二次開發(fā)。

基于開源模型的創(chuàng)業(yè)公司,往往是在底座模型的基礎(chǔ)上做一些微調(diào),靈活有余,但開源模型的分支多、變異快、創(chuàng)新迭代速度快,不承諾任何確定性,一般由程序員自組織來完成開發(fā),這就導(dǎo)致基于開源的大模型穩(wěn)定性不足,對(duì)客戶技術(shù)團(tuán)隊(duì)二次開發(fā)能力要求很高,選型難度也很大。

目前看,第一梯隊(duì)的大廠推出的基礎(chǔ)大模型,更能滿足企業(yè)對(duì)大模型穩(wěn)定性、可靠性的需求。

因?yàn)殚]源大模型,遵循的不是開源范式,而是工程范式,所以,會(huì)以保證開發(fā)質(zhì)量為前提,對(duì)用戶需求進(jìn)行明確的描述,組織工程師按照規(guī)范的開發(fā)流程和周期,以確定的時(shí)間和預(yù)算,更好的控制開發(fā)質(zhì)量,保證開發(fā)效率。

開源是一件好事,但開源并不是一把萬能鑰匙。如果不解決基礎(chǔ)設(shè)施、二次開發(fā)等瓶頸,創(chuàng)業(yè)公司也無法靠開源,快速取得成功。

第二個(gè)“幻覺”:三五個(gè)人干翻大廠

因?yàn)殚_源,創(chuàng)業(yè)公司和互聯(lián)網(wǎng)企業(yè)都可以叫賣大模型,這就產(chǎn)生了第二個(gè)“幻覺”:三五個(gè)人的創(chuàng)業(yè)團(tuán)隊(duì),就能干翻AI大廠。

需要注意的是,“百模大戰(zhàn)”帶來了白熱化的淘汰賽,同時(shí),大模型還在以周為單位進(jìn)行迭代。

在激蕩的市場競爭中,具有長期研發(fā)能力和投入意愿的大廠,更容易保持動(dòng)態(tài)的生長力和持久的話語權(quán),體現(xiàn)在幾個(gè)方面:

一是模型本身的技術(shù)城池。

谷歌研發(fā)人員此前曾發(fā)文稱,因?yàn)殚_源,谷歌和OpenAI都沒有護(hù)城河。這在長期看是對(duì)的,但大廠在大模型技術(shù)上的領(lǐng)先性,也是現(xiàn)實(shí)存在的優(yōu)勢(shì),這個(gè)技術(shù)代差,足以在大模型的商用周期中,為大廠帶來顯著的競爭優(yōu)勢(shì)。

而且,大模型具有數(shù)據(jù)上的“飛輪效應(yīng)”,更早應(yīng)用、更多用戶的大廠大模型,會(huì)不斷拉大效果差距。比如國內(nèi)最早推向大眾的文心大模型,其3.5版本已經(jīng)在一些基準(zhǔn)測(cè)試中,超過了GPT3.5的表現(xiàn),而宣稱達(dá)到GPT-3.5的Llama 2剛開源不久,因此目前國產(chǎn)開源大模型最多也就達(dá)到GPT-3的水平。

二是持續(xù)迭代的成長能力。

大模型落地不是一蹴而就的,企業(yè)應(yīng)用大模型也不能上馬后很快不了了之,后續(xù)的算力成本、數(shù)據(jù)工程負(fù)擔(dān)、每一次迭代的資金壓力,很快就成為困擾很多大模型公司的頭疼問題。

目前,已經(jīng)有不少曾經(jīng)想走商業(yè)閉源路線的大模型創(chuàng)業(yè)公司,直接宣布退出競爭。光年之外中途離場,被美團(tuán)接手;Hugging Face專注賣算力資源和咨詢業(yè)務(wù),做大模型更多是“面子工程”。部分企業(yè)的表現(xiàn),也會(huì)直接影響到市場對(duì)其“是否有錢繼續(xù)做大模型”的信心。

從成長性看,有資金實(shí)力、基礎(chǔ)設(shè)施完整、商業(yè)表現(xiàn)良好的大廠,才能陪企業(yè)用戶走得更遠(yuǎn)。

比如“文心一言”3月16日推出以來,在一個(gè)月內(nèi)完成4次迭代,將推理成本降為原來的十分之一,離不開百度在大模型上的長期投入,以及人、錢、卡、基建等多種方面的儲(chǔ)備,才讓文心一言可以持續(xù)進(jìn)化,在高速迭代的大模型競爭中保持領(lǐng)先。

wKgZomS_1r6AeoMbAACeQFMMP20279.jpg

三是完善的工具鏈。

沒有人會(huì)否認(rèn),大模型是拿來用的,不是為了當(dāng)擺設(shè)或“公關(guān)效應(yīng)”的。

要用,就要考慮到技術(shù)和場景的適配。不同行業(yè)和企業(yè)對(duì)于大模型落地的需求,可能是完全不同的,這種差異化,需要更完善、全面的配套工具,來降低應(yīng)用門檻。舉個(gè)例子,行業(yè)+大模型需要進(jìn)行專有數(shù)據(jù)的清洗、標(biāo)注、向量化等工作,這個(gè)過程是非常復(fù)雜的。

三五人的創(chuàng)業(yè)團(tuán)隊(duì),很難將主要研發(fā)力量,放在開發(fā)這些看上去技術(shù)含量不高、但對(duì)用戶十分重要的工具上。

這時(shí)候,百度等大廠長期押注AI的優(yōu)勢(shì)就凸顯出來了,已經(jīng)沉淀了從數(shù)據(jù)集、模型訓(xùn)練、開發(fā)部署等整套流程的工具,并且開箱即用,把大模型到產(chǎn)業(yè)落地的門檻不斷降低,從而開啟增長飛輪。

四是長期積累的行業(yè)Knowhow。

大模型產(chǎn)業(yè)化,走向ToB和ToG是大勢(shì)所趨,要求對(duì)行業(yè)Knowhow有深層次的理解。因此,政企客戶在大模型選型時(shí),非??粗貜S商的成功案例和行業(yè)服務(wù)經(jīng)驗(yàn)。

AI大廠在產(chǎn)業(yè)已經(jīng)深耕多年,因此大模型的商業(yè)開發(fā)度更高。目前,百度“文心大模型+飛槳深度學(xué)習(xí)框架”的組合已與300多家客戶合作,在400多個(gè)企業(yè)場景中取得良好測(cè)試效果,并打造了10多個(gè)行業(yè)大模型。

與之相比,還沒有走通產(chǎn)業(yè)場景的創(chuàng)業(yè)公司,在技術(shù)體驗(yàn)、功能創(chuàng)新、工程能力等細(xì)節(jié)上,可能還需要花費(fèi)更多時(shí)間去摸索。

從這些角度看,頭部大模型已經(jīng)建立起了較為明顯的優(yōu)勢(shì),并且還在持續(xù)進(jìn)化。三五人的創(chuàng)業(yè)公司,想要在高速迭代的大模型競爭中干翻大廠,需要補(bǔ)的課有點(diǎn)多。

第三個(gè)“幻覺”:大模型能“賺快錢”

創(chuàng)業(yè)公司通過“資金換規(guī)?!钡亩唐娇鞈?zhàn)略,上市融資再套現(xiàn)離場,來兌現(xiàn)投資回報(bào),已經(jīng)越來越難了,在大模型領(lǐng)域并不現(xiàn)實(shí)。那么,另一條路就是通過ToB客戶付費(fèi),來完成大模型的商業(yè)化。

眾所周知,ToB行業(yè)要干苦活累活。

企業(yè)客戶在業(yè)務(wù)場景中接入大模型,可能帶來一系列復(fù)雜的整合動(dòng)作,是一個(gè)體系化工程,這就要求大模型廠商不能單一快節(jié)奏地交付,而要提供解決方案式的整體能力,以及長時(shí)間的更新運(yùn)維服務(wù)。

一個(gè)項(xiàng)目的交付、運(yùn)維、迭代、回款等,可能以年計(jì),是無法快進(jìn)快出的。所以,大模型下沉到行業(yè),必須打消“賺快錢”的念頭,以長期主義的心態(tài)來做生意。

構(gòu)建服務(wù)團(tuán)隊(duì)、形成服務(wù)基因,對(duì)創(chuàng)業(yè)公司及其背后的投資機(jī)構(gòu)的耐心和定力來說,是不小的考驗(yàn)。

與之相比,大廠在長期走向ToB/ToG市場的過程中,已經(jīng)經(jīng)歷了客戶的捶打,鍛煉出了更加成熟的服務(wù)鐵軍,也證明了自身的定力。

以百度為例,對(duì)于不同行業(yè),有深入了解客戶的交付、運(yùn)維和保障專屬團(tuán)隊(duì),在大模型落地應(yīng)用時(shí),能夠給予更具針對(duì)性的方案,從而減少無效支出,讓大模型更好地幫助企業(yè)提質(zhì)增效。

大模型廠商不能一心只想“賺快錢”,要沉下心來走向產(chǎn)業(yè)深處。同樣的,企業(yè)引入大模型也不能一心只“圖便宜”,要從智能化轉(zhuǎn)型升級(jí)的這個(gè)生命周期出發(fā)算總賬,綜合考慮改造、交付、運(yùn)維等多項(xiàng)成本。

大模型強(qiáng)大的理解能力和泛化能力,會(huì)加速產(chǎn)業(yè)智能化的進(jìn)程,也讓AI企業(yè)和創(chuàng)業(yè)公司發(fā)現(xiàn)了新的機(jī)會(huì)。

就像啤酒總是伴隨著泡沫,在一擁而上的大模型創(chuàng)投熱潮中,創(chuàng)業(yè)公司和企業(yè)客戶也很容易陷入“速成幻覺”。

大模型走向產(chǎn)業(yè)的長路,更需保持冷靜和理性,警惕“爛尾”風(fēng)險(xiǎn)。希望大家真正飲下的,是用時(shí)間和技術(shù)沉淀的精釀,而非隨時(shí)可能消失的“泡沫”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280004
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1590

    瀏覽量

    9108
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    133

    瀏覽量

    1863
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4073
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI智能體+AIoT:智能時(shí)代的關(guān)鍵聯(lián)結(jié),還是又一場幻覺與泡沫?

    從大模型的爆發(fā),到邊緣計(jì)算的逐漸普及,從智能語音助手走進(jìn)家庭,到智能設(shè)備接入云端,AI智能體與AIoT的結(jié)合,正成為產(chǎn)業(yè)界的新熱點(diǎn)。但在技術(shù)熱潮的背后,我們必須提出一個(gè)冷靜的問題:我們是為了更好
    的頭像 發(fā)表于 07-11 14:57 ?532次閱讀
    AI智能體+AIoT:智能時(shí)代的關(guān)鍵聯(lián)結(jié),還是又一場<b class='flag-5'>幻覺</b>與泡沫?

    開普云「開悟智核」:極致性價(jià)比的智能體一體機(jī),破局大模型應(yīng)用難題

    當(dāng)下,AI一體機(jī)憑借開箱即用、數(shù)據(jù)可控等優(yōu)勢(shì),成為行業(yè)大模型落地的重要載體之一。然而實(shí)際應(yīng)用時(shí),用戶卻面臨諸多問題:算力成本與性能難以平衡;非滿血版模型存在“幻覺”、精度低等問題;由于缺乏好用的智能
    的頭像 發(fā)表于 06-09 10:34 ?395次閱讀
    開普云「開悟智核」:極致性價(jià)比的智能體一體機(jī),破局大<b class='flag-5'>模型</b>應(yīng)用難題

    如何高效訓(xùn)練AI模型?這些常用工具你必須知道!

    模型的發(fā)展同樣面臨瓶頸,訓(xùn)練所需的硬件資源日益增加,比如英偉達(dá)的芯片、電力等(這也可能是ChatGPT5遲遲沒有出來的原因)。業(yè)界有觀點(diǎn)認(rèn)為,在大多數(shù)情況下,并不需要全能的大模型,而是更適合專注于
    的頭像 發(fā)表于 04-17 16:43 ?1708次閱讀
    如何高效訓(xùn)練AI<b class='flag-5'>模型</b>?這些常用工具你<b class='flag-5'>必須</b>知道!

    淺談華為通信大模型的關(guān)鍵技術(shù)

    推理、幻覺糾正及多維聯(lián)合決策等方面創(chuàng)新成果的肯定。為此,我們將分三期深入解讀華為通信大模型無線的關(guān)鍵技術(shù)和價(jià)值應(yīng)用,本期聚焦于通信大模型的部署、訓(xùn)練和推理的關(guān)鍵技術(shù)。
    的頭像 發(fā)表于 03-26 14:35 ?627次閱讀

    請(qǐng)問如何獲得AD8000的IBIS模型

    當(dāng)使用 AD8000 設(shè)計(jì)帶寬為 1000M 的放大器電路時(shí),必須使用 AD8000 的 IBIS 模型進(jìn)行 SI/PI 仿真。AD8000是否有可用的IBIS型號(hào)?如果是這樣,請(qǐng)發(fā)送給我。如果沒有,是否有其他具有類似參數(shù)的芯片提供用于仿真的 IBIS
    發(fā)表于 03-24 06:08

    利用騰訊ima收藏公眾號(hào)推文構(gòu)建個(gè)人知識(shí)庫,拒絕AI幻覺

    關(guān)于SiCMOSFET短路認(rèn)知誤區(qū)。相信很多同學(xué)都遇到過這樣的困擾,在越專業(yè)的細(xì)分領(lǐng)域,AI幻覺越嚴(yán)重,甚至格式標(biāo)準(zhǔn)、出處明確的學(xué)術(shù)論文竟然都有可能是編造的。趙工
    的頭像 發(fā)表于 03-19 18:32 ?1711次閱讀
    利用騰訊ima收藏公眾號(hào)推文構(gòu)建個(gè)人知識(shí)庫,拒絕AI<b class='flag-5'>幻覺</b>

    百度發(fā)布文心大模型4.5和文心大模型X1

    文心大模型4.5是百度自主研發(fā)的新一代原生多模態(tài)基礎(chǔ)大模型,通過多個(gè)模態(tài)聯(lián)合建模實(shí)現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進(jìn)的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。
    的頭像 發(fā)表于 03-18 16:29 ?477次閱讀

    維智科技時(shí)空大模型助力城市治理智能化轉(zhuǎn)型

    近期,“AI幻覺”引發(fā)廣泛關(guān)注。這一現(xiàn)象指大模型在生成信息時(shí)可能基于統(tǒng)計(jì)規(guī)律“虛構(gòu)”不準(zhǔn)確內(nèi)容,例如在回答“周邊咖啡館分布”時(shí)編造不存在的地點(diǎn)及營業(yè)信息。
    的頭像 發(fā)表于 03-13 11:42 ?517次閱讀

    DeepSeek大模型如何推動(dòng)“AI+物流”融合創(chuàng)新

    在人工智能技術(shù)的迭代浪潮中,大模型(Large Language Models, LLM)正從文本生成、圖像創(chuàng)作走向垂直行業(yè)賦能。2025年新年,國產(chǎn) AI 大模型 DeepSeek 橫空出世,憑借其低成本、高精度和多模態(tài)能力,迅速成
    的頭像 發(fā)表于 02-28 16:36 ?689次閱讀

    如何在英特爾平臺(tái)上高效部署DeepSeek模型

    隨著人工智能技術(shù)的迅猛發(fā)展,大規(guī)模語言模型(LLMs)在自然語言處理、內(nèi)容生成和智能對(duì)話等領(lǐng)域的應(yīng)用日益廣泛。國產(chǎn) AI 大模型 DeepSeek 憑借其強(qiáng)大的生成能力和廣泛的應(yīng)用場景,迅速成為業(yè)界焦點(diǎn)。
    的頭像 發(fā)表于 02-21 10:16 ?1592次閱讀
    如何在英特爾平臺(tái)上高效部署DeepSeek<b class='flag-5'>模型</b>

    模型遭遇算力墻,探索超級(jí)應(yīng)用的發(fā)展路徑

    的評(píng)論透露出 GPT-5 難產(chǎn)的隱憂,直言有限的算力約束讓 OpenAI 面臨迭代優(yōu)先級(jí)的艱難抉擇,在通往 AGI 的道路上一路高歌猛進(jìn)的領(lǐng)頭羊似乎撞上了“算力墻”。 除此之外,能耗、資金,難以根除的幻覺,有限的知識(shí)更新速率、有限的上下文寬度、高昂的運(yùn)營成本等等,都讓外界對(duì)大模型
    的頭像 發(fā)表于 02-10 17:24 ?1179次閱讀
    大<b class='flag-5'>模型</b>遭遇算力墻,探索超級(jí)應(yīng)用的發(fā)展路徑

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+第一章初體驗(yàn)

    子發(fā)燒友論壇的專業(yè)活動(dòng)。 一、大模型的基礎(chǔ)認(rèn)知 第一章開篇從大模型的本質(zhì)切入,什么是大模型,指出其核心在于海量數(shù)據(jù)的訓(xùn)練與參數(shù)規(guī)模的擴(kuò)展。幻覺問題:生成內(nèi)容可能存在事實(shí)性錯(cuò)誤或邏輯
    發(fā)表于 02-07 10:42

    穿過幻覺荒野,大模型RAG越野賽

    檢索與AI,整合出廣闊未來
    的頭像 發(fā)表于 01-28 14:18 ?3835次閱讀
    穿過<b class='flag-5'>幻覺</b>荒野,大<b class='flag-5'>模型</b>RAG越野賽

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.52】基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化

    (Retrieval-Augmented Agenerated,檢索增強(qiáng)生成)與Agent(AI智能體)。本篇小棗君首先嘗試用通俗易懂的語言幫助大家認(rèn)識(shí)RAG這一重要應(yīng)用形式。 01 了解大模型的“幻覺” 在了解為什么出現(xiàn)RAG之前
    發(fā)表于 12-04 10:50

    李彥宏:大模型行業(yè)消除幻覺,iRAG技術(shù)引領(lǐng)文生圖新紀(jì)元

    在近日舉辦的百度世界大會(huì)上,百度創(chuàng)始人李彥宏分享了關(guān)于大模型行業(yè)的最新觀察。他指出,過去24個(gè)月里,大模型行業(yè)經(jīng)歷了顯著的變化,其中最引人注目的是大模型已基本消除了幻覺現(xiàn)象。這一進(jìn)步標(biāo)
    的頭像 發(fā)表于 11-14 11:39 ?646次閱讀