一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

做大模型時代的「Linux」, ChatGPT僅是開端

傳感器技術(shù) ? 來源:AI科技評論 ? 2023-03-08 10:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大模型只是中間狀態(tài),開源的大模型技術(shù)生態(tài)才是未來。

一代人的時間里總會有幾次這樣的時刻:一種產(chǎn)品的出現(xiàn)將一項技術(shù)從昏暗的工程系地下室、臭氣熏天的書呆子們的臥室和業(yè)余愛好者們孤獨的洞穴中彈射出來,變成了連你的祖母都知道如何使用的東西。

《財富》雜志的這段話,捕捉了1994年網(wǎng)景瀏覽器和2007年iPhone的歷史意義,也描述了今天ChatGPT為人工智能領(lǐng)域帶來的變化。

它們都是一個生態(tài)體系的開端。ChatGPT的背后是AI大模型,但智能時代的未來不會僅僅是大模型本身,而將是大模型生態(tài)體系。

北京智源人工智能研究院院長黃鐵軍認為,過去的「煉」大模型并非一種正常的狀態(tài),AI一定是通過作為公共產(chǎn)品的智力而非個別的大模型來提供服務(wù)的。在未來,大模型會有很多,但大模型生態(tài)體系不會超過3個。

而要建立提供數(shù)據(jù)、訓(xùn)練、治理等全套服務(wù)的大模型生態(tài)體系,并非哪一家企業(yè)能為之,需要更多機構(gòu)一起合作。在黃鐵軍看來,智能時代需要真開源,不是某一家企業(yè)控制下的開源,而是像LinuxRISC-V 那樣的開源。

如果不想在這一波AI大模型熱潮中被卡脖子,我們只有開源一條路。

為了加快這一步伐,智源研究院在2月28日發(fā)布了FlagOpen(飛智)大模型技術(shù)開源體系,大模型領(lǐng)域的「Linux」正在誕生。

1

ChatGPT 水面之下:回歸技術(shù)理性

愛迪生曾在曼哈頓的一個街區(qū)鋪設(shè)電網(wǎng),點亮了那個街區(qū),OpenAI推出ChatGPT也具有同樣的局部驗證性作用。在大呼驚奇過后,國內(nèi)各家紛紛趕制中國版ChatGPT,相當(dāng)于各自建立一個小型電網(wǎng)、為一部分用戶服務(wù)。

但這距離大模型作為一種產(chǎn)品服務(wù)進入到千家萬戶還有很長一段距離。

我們亟需從ChatGPT的商業(yè)化狂潮中回歸到技術(shù)理性。要看到的是,ChatGPT作為一個產(chǎn)品只是水面上的冰山一角,水面之下是大模型的底層技術(shù)體系。

一方面,商業(yè)模式尚未清晰,大模型的戰(zhàn)略“占位”意圖更加明顯,僅少數(shù)玩家具備技術(shù)基礎(chǔ)的相對充分累積。而總資源有限,算力稀缺,資本驅(qū)動的模式可能會導(dǎo)致重復(fù)性浪費,影響潛在的技術(shù)進步可能性。

另一方面,如今的大模型雖然已經(jīng)足夠大,但將來要走什么樣的技術(shù)路線還是一個開放的問題,有許多問題尚待解決,比如是否會有新的架構(gòu)和算法、如何解釋大模型的涌現(xiàn)能力、怎么提高大模型的高級認知能力等等。

不僅僅是科學(xué)問題,在大模型的產(chǎn)業(yè)化過程中,如何用更少的計算成本、智能水平更高的大模型去提供AI服務(wù),也需要長期考慮。就像有了發(fā)電廠之后,仍要繼續(xù)鉆研提高發(fā)電效率的技術(shù),研究家庭用電接口的方式等等。

所以,中國是否也要做一個ChatGPT出來?基于當(dāng)前匆匆回應(yīng),也許不如進一步面向未來看問題—— 如何驅(qū)動整個大模型產(chǎn)業(yè)及生態(tài)產(chǎn)生越來越多令人驚喜的AI現(xiàn)象?

「大模型只是冰山一角,我們要在大模型磅礴的大生態(tài)中找準自己的歷史性位置。」黃鐵軍認為,大模型是一種中間狀態(tài),它不是最終的服務(wù)形態(tài),而是現(xiàn)階段用特定技術(shù)、特定算法訓(xùn)練出來的結(jié)果。未來的形態(tài)應(yīng)當(dāng)是以大模型為技術(shù)手段、向所有人提供24×7服務(wù)的智能運營系統(tǒng)。

如同今天的通信網(wǎng)絡(luò)運營商僅有幾家巨頭,將來大模型的服務(wù)運營體系也會屈指可數(shù)——但龐大的產(chǎn)業(yè)群帶來的商業(yè)機遇會更多。

從技術(shù)出發(fā)建立生態(tài),需要一個協(xié)作的方式。研究人員提出不同的大模型技術(shù)創(chuàng)新,并匯聚到一個開源開放的技術(shù)體系下,去展示能力、評估和比較。而且,不是止步于造一個大模型出來,而是持續(xù)地進行技術(shù)迭代。

智源聯(lián)合多家產(chǎn)學(xué)研單位建立大模型技術(shù)開源體系FlagOpen,正是面向這樣一個長遠的命題:在智能時代以大模型為代表的產(chǎn)業(yè)體系中,我們應(yīng)該做些什么?

而無論是從對前沿技術(shù)的重視程度還是組織的中立性來看,智源作為非營利研究機構(gòu)做大模型開源這件事是再合適不過。

2從大模型引領(lǐng)者到開源先鋒

「某種意義上,我們是后退一步,而不是去趕一個熱點?!裹S鐵軍說道。

在各路勢力一個接一個宣稱入局ChatGPT的熱潮中,智源推出國內(nèi)首個大模型開源體系,也更加希望保持冷靜的理性思考,探索還能為人工智能前沿研發(fā)底層環(huán)境做些什么。

作為非營利機構(gòu),智源一直聚焦打造有重大技術(shù)挑戰(zhàn)、需要緊密工程協(xié)作、長期攻關(guān)的重大系統(tǒng)級成果。相較于近期的商業(yè)化熱潮,智源顯然更關(guān)心技術(shù)本身,與大模型領(lǐng)域的長期發(fā)展。

大模型在中國起飛之初,智源是當(dāng)之無愧的引領(lǐng)者。過去幾年,已經(jīng)積累了冰山之下大模型的技術(shù)棧。這是智源做大模型開源這件事的底氣。

坐落在「宇宙中心」五道口,智源匯聚了來自北大、清華、人大、中科院等學(xué)術(shù)高地的AI人才。作為中立非營利創(chuàng)新科研機構(gòu),相比高校與企業(yè),一方面可以更好地匯集企業(yè)、學(xué)界資源集中力量做大事;另一方面非商業(yè)不逐利,愿意尊重科研創(chuàng)新規(guī)律,讓科研人員在自由的環(huán)境中充分進行創(chuàng)造力探索。

對有價值問題的聚焦,使得其成為上一波大模型熱潮中的頭雁。

2020年OpenAI發(fā)布GPT-3,智源立即喊出“大模型時代即將到來”的AI未來圖景,堅定奔走推動大模型研究路線,并迅速組織了“悟道”大模型攻關(guān)團隊,訓(xùn)練出了中文預(yù)訓(xùn)練語言模型CPM?!拔虻馈眻F隊的成員,目前已成為國內(nèi)大模型研究的中堅力量。

之后,智源繼續(xù)加大對大模型的投入,在2021年3月發(fā)布了大模型項目“悟道1.0”,包含中文語言、圖文多模態(tài)、認知和蛋白質(zhì)序列預(yù)測四個方向的模型。3個月后,智源又推出創(chuàng)造當(dāng)時“全球最大”紀錄的“悟道2.0”大模型項目。

如今,大模型無限堆參數(shù)的熱潮已經(jīng)冷卻,如何在大模型的封閉生態(tài)形成前,推動建立大模型開源體系,擁抱開源開放,鼓勵人工智能的底層技術(shù)創(chuàng)新集體熱情?

黃鐵軍斷言:「不可能、也不應(yīng)該有任何一家企業(yè)來完全封閉地主導(dǎo)大模型這么一個重要的方向?!?/p>

大模型的重要性在于,它通過一個通用模型來完成多場景任務(wù),作為底座能夠誕生無數(shù)AI應(yīng)用,因而是AI時代的基礎(chǔ)設(shè)施。而從技術(shù)層面來講,當(dāng)前的大模型仍具有諸多難以透徹理解的黑箱特性,因此更加需要以開源開放的方式讓大模型更安全地提供服務(wù)。

而開源本身也已經(jīng)成為必然趨勢。以操作系統(tǒng)為例,為何大家都愿意用開源的操作系統(tǒng)?對于商業(yè)公司而言,使用開源產(chǎn)品帶來的并非僅僅是成本的降低,更重要的是風(fēng)險的降低和質(zhì)量的提高。由一家企業(yè)維護的閉源項目一旦終止,用戶就要遷移全部技術(shù)棧,但開源不會出現(xiàn)這種風(fēng)險,而且技術(shù)問題在開源的情況下也能更快得到解決。

對于研發(fā)成本極大的大模型而言,開源更是能夠集約資源、匯聚人類智慧,避免重復(fù)造輪子。智源已經(jīng)在大模型開源這條路上走了一段距離?!肝虻馈瓜盗心P鸵呀?jīng)在持續(xù)開源,包括「悟道2.0」通用語言大模型GLM、「悟道3.0」視覺預(yù)訓(xùn)練大模型EVA、視覺通用多任務(wù)模型Painter、文生圖大模型AltDiffusion等等。

過去,智源匯集承載產(chǎn)學(xué)研各界力量推動大模型研究事業(yè);現(xiàn)在,智源正在推進更艱巨的大模型開源開放生態(tài)建設(shè)——推出了FlagOpen(飛智)大模型技術(shù)開源體系。

3FlagOpen:大模型時代的「Linux」

大模型的技術(shù)創(chuàng)新涉及算法、模型、數(shù)據(jù)、工具、評測等各個層面,因此FlagOpen開源體系也全面涵蓋了這些模塊,能夠讓開發(fā)者和企業(yè)更快、更低門檻地上手大模型的研發(fā)。

智源之所以選擇在當(dāng)下發(fā)布FlagOpen開源體系,其中一個考慮也是因為看到在這一波ChatGPT熱潮中,許多以往沒有大模型研發(fā)經(jīng)驗的初創(chuàng)團隊,也開始嘗試自研大模型,對他們而言,F(xiàn)lagOpen來得非常及時。

fcd0c864-bd21-11ed-bfe3-dac502259ad0.jpg

FlagOpen開源體系中的重頭戲,是一個大模型算法、模型及工具一站式開源項目FlagAI。該項目已經(jīng)涵蓋了各領(lǐng)域的一些明星大模型,如語言大模型OPT、T5,視覺大模型ViT、Swin Transformer,多模態(tài)大模型CLIP等,以及智源自家的大模型。

這些大模型在實際調(diào)用和復(fù)現(xiàn)過程中的技術(shù)門檻很高,為此FlagAI集成了很多主流大模型算法技術(shù),以及多種大模型并行處理和訓(xùn)練加速技術(shù),并且支持微調(diào),開箱即用的方式對開發(fā)者非常友好。

大模型生態(tài)的另一要素是AI硬件評測,AI軟硬件技術(shù)棧異構(gòu)程度高、兼容性差,應(yīng)用場景復(fù)雜多變,都給評測帶來了很多挑戰(zhàn)。

FlagPerf搭建的AI硬件評測體系,提供了可直接下載且適配各家芯片的整套評測軟件,能大大降低用戶企業(yè)和芯片企業(yè)的人力成本。

FlagPerf的推出,也體現(xiàn)了智源開源開放的決心。一方面,不同于目前知名的AI基準評測MLperf,F(xiàn)lagPerf不搞排名榜單,且及時跟進最新的大模型基準;另一方面,其他大廠企業(yè)做的評測本身有其商業(yè)訴求,不夠開放,而智源作為中立機構(gòu),建立評測體系的目的是為了讓大模型產(chǎn)業(yè)更加成熟,所以評測涵蓋各種芯片,而非僅僅某一款,并且支持多種深度學(xué)習(xí)框架,對用戶企業(yè)的選擇不加限制。

也正因如此,智源第一時間就把多個廠商和團隊拉了進來,包括天數(shù)智芯、百度PaddlePaddle、昆侖芯科技、中國移動等,一同推進AI硬件評測建設(shè)。林詠華談道,「我們首先希望它先變成一個事實的基準。所謂事實基準是大家評測硬件的時候都愛用它,至于未來要不要發(fā)展成產(chǎn)業(yè)的標準,我們順其自然?!?/p>

科學(xué)、公開的大模型評測基準及工具,同樣是大模型取得技術(shù)進步的重要條件。尤其是當(dāng)下AIGC的應(yīng)用越發(fā)火熱,行業(yè)亟需對模型在AI生成任務(wù)上的評估?;A(chǔ)大模型評測開源項目FlagEval為此提供了覆蓋多種模態(tài)和測評維度的評測工具,其中就包括多模態(tài)領(lǐng)域的CLIP系列模型。

在數(shù)據(jù)方面,智源構(gòu)建了支撐大模型訓(xùn)練的WuDaoCorpora語料庫,包含文本、對話、圖文對、視頻文本對四類數(shù)據(jù)。FlagData還集成了包含清洗、標注、壓縮、統(tǒng)計分析等功能在內(nèi)的多個數(shù)據(jù)處理工具與算法。

在AI走向工程化的趨勢下,大型數(shù)據(jù)集的構(gòu)建正在成為中國的巨大機會,這個過程需要更大、更開放的協(xié)作。智源此次發(fā)布的OpenLabel是中文世界首個開放數(shù)據(jù)標注平臺,它轉(zhuǎn)動了數(shù)據(jù)飛輪,正持續(xù)為大模型提供訓(xùn)數(shù)據(jù)源。

除了以上四大模塊,F(xiàn)lagOpen開源體系中還涵蓋了文生圖開源項目集合FlagStudio,以及AI應(yīng)用微服務(wù)框架開源項目FlagBoot,為大模型的研發(fā)和應(yīng)用開放了全方位的能力。

FlagOpen專門圍繞大模型而搭建的開源體系,這也是它與其它開源平臺的區(qū)別所在。國外有HuggingFace、國內(nèi)有魔搭社區(qū)(Model Scope),而關(guān)于FlagOpen的定位,林詠華解釋:

「我們不只是想構(gòu)建一個很多人參與的繁華社區(qū),更是希望推動大模型技術(shù)的發(fā)展。」

從產(chǎn)品的角度講,F(xiàn)lagOpen為用戶在研發(fā)大模型的需求上提供了一個更合適的選擇。針對“開源的不如閉源”說法,黃鐵軍認為,開源開放是一個大趨勢,開源形式的產(chǎn)品將會占據(jù)比較大的份額,而在一個特定方向上某個閉源產(chǎn)品做得更好,這一點并不奇怪。

「這不等于誰打敗誰了,而是大家在滿足自己需求時所做的不同選擇?!咕拖馤inux成功在市場競爭中占據(jù)主要份額,但它不是把所有操作系統(tǒng)都打敗了。

FlagOpen剛剛邁出了開源第一步。智源開源的策略并非等一切都足夠完備再開源,而是把種子點做了之后就開源,這樣可以更快地推動企業(yè)和團隊在非商業(yè)合作協(xié)議下互相合作。比如,AI 硬件評測開源項目是先從最難也最短缺的訓(xùn)練端做起,這一塊做好了推理端便不是難點。

類比13年前云計算開源平臺OpenStack的起家,Rackspace和NASA合伙做了Nova并將其作為種子開源,同時成立了OpenStack基金會,讓更多企業(yè)一起參與貢獻,這才有了國內(nèi)今天所有的云計算廠商。

這也是智源做大模型開源的初心。而對于FlagOpen的未來,智源的期待是將其打造成大模型時代的「Linux」。

「什么叫一個開源項目成功了?就是大多數(shù)做產(chǎn)品和服務(wù)的企業(yè)都用這樣的開源體系,就像Linux和Risc-V的開源開放帶來了廣泛采用,希望FlagOpen在智能時代也能發(fā)揮類似的作用?!?/p>

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49008

    瀏覽量

    249311
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3517

    瀏覽量

    50405
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1589

    瀏覽量

    9087
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3138

    瀏覽量

    4059

原文標題:做大模型時代的「Linux」, ChatGPT 僅是開端

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    模型時代的深度學(xué)習(xí)框架

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 在 CNN時代 ,AI模型的參數(shù)規(guī)模都在百萬級別,僅需在單張消費類顯卡上即可完成訓(xùn)練。例如,以業(yè)界知名的CNN模型: ResNet50 為例,模型
    的頭像 發(fā)表于 04-25 11:43 ?265次閱讀
    大<b class='flag-5'>模型</b><b class='flag-5'>時代</b>的深度學(xué)習(xí)框架

    OpenAI嘗試減少對ChatGPT的審查

    近日,OpenAI宣布了一項新政策,旨在改變其訓(xùn)練人工智能模型的方式,以明確擁護“知識自由”的理念。OpenAI強調(diào),無論一個話題多么具有挑戰(zhàn)性或爭議性,都應(yīng)當(dāng)被平等對待和呈現(xiàn)。 據(jù)OpenAI表示
    的頭像 發(fā)表于 02-17 14:42 ?1721次閱讀

    【「大模型啟示錄」閱讀體驗】+開啟智能時代的新鑰匙

    閱讀之旅。在翻開這本書之前,我對大模型的認知僅僅停留在它是一種強大的人工智能技術(shù),可以進行自然語言處理、圖像識別等任務(wù)。我知道像 ChatGPT 這樣的應(yīng)用是基于大模型開發(fā)的,能夠與人類進行較為流暢
    發(fā)表于 12-24 13:10

    OpenAI發(fā)布滿血版ChatGPT Pro

    科技巨頭OpenAI近期宣布了一項重大更新,正式推出了其備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1,旨在為用戶提供更為強大的處理能力和更高質(zhì)量的回答。 據(jù)了解
    的頭像 發(fā)表于 12-06 11:10 ?815次閱讀

    ChatGPT:怎樣打造智能客服體驗的重要工具?

    ChatGPT作為智能對話生成模型,可以幫助打造智能客服體驗的重要工具。以下是一些方法和步驟:1.數(shù)據(jù)收集和準備:收集和整理與客服相關(guān)的數(shù)據(jù),包括常見問題、回答示例、客戶對話記錄等。這將用于訓(xùn)練
    的頭像 發(fā)表于 11-01 11:12 ?438次閱讀
    <b class='flag-5'>ChatGPT</b>:怎樣打造智能客服體驗的重要工具?

    如何評估 ChatGPT 輸出內(nèi)容的準確性

    評估 ChatGPT 輸出內(nèi)容的準確性是一個復(fù)雜的過程,因為它涉及到多個因素,包括但不限于數(shù)據(jù)的質(zhì)量和多樣性、模型的訓(xùn)練、上下文的理解、以及輸出內(nèi)容的邏輯一致性。以下是一些評估 ChatGPT 輸出
    的頭像 發(fā)表于 10-25 17:48 ?1148次閱讀

    如何提升 ChatGPT 的響應(yīng)速度

    提升 ChatGPT 的響應(yīng)速度是一個涉及多個層面的復(fù)雜問題。以下是一些可能的方法和策略,可以幫助提高 ChatGPT 的響應(yīng)速度: 優(yōu)化算法 : 并行處理 :通過并行處理技術(shù),可以讓多個計算任務(wù)
    的頭像 發(fā)表于 10-25 17:39 ?1580次閱讀

    ChatGPT 與人工智能的未來發(fā)展

    ChatGPT是人工智能領(lǐng)域的一個重要里程碑,它代表了自然語言處理(NLP)技術(shù)的最新進展。ChatGPT是由人工智能研究實驗室OpenAI開發(fā)的一種深度學(xué)習(xí)模型,它能夠理解和生成自然語言文本。這種
    的頭像 發(fā)表于 10-25 16:30 ?2524次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建一個基于ChatGPT的聊天系統(tǒng)是一個涉及多個步驟的過程,包括理解ChatGPT的API、設(shè)計用戶界面、處理數(shù)據(jù)和集成ChatGPT模型。以下是一個簡化的指南,用于創(chuàng)建一個基本的聊
    的頭像 發(fā)表于 10-25 16:23 ?1014次閱讀

    如何使用 ChatGPT 進行內(nèi)容創(chuàng)作

    ChatGPT平臺。 選擇模型ChatGPT目前支持GPT3.5和GPT4兩個模型。根據(jù)創(chuàng)作需求,選擇合適的模型。一般來說,GPT4
    的頭像 發(fā)表于 10-25 16:08 ?1013次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 桌面應(yīng)用,您可以聊聊文件和照片。這款應(yīng)用為您帶來了 OpenAI 最新的模型改進,包括訪問我們最新、最智能的模型OpenAI o1-preview 。” Windows 版
    的頭像 發(fā)表于 10-18 15:50 ?525次閱讀

    科技云報到:大模型時代下,向量數(shù)據(jù)庫的野望

    科技云報到:大模型時代下,向量數(shù)據(jù)庫的野望
    的頭像 發(fā)表于 10-14 17:18 ?536次閱讀

    【「大模型時代的基礎(chǔ)架構(gòu)」閱讀體驗】+ 未知領(lǐng)域的感受

    國慶前就收到《大模型時代的基礎(chǔ)架構(gòu)》一書,感謝電子發(fā)燒友論壇。歡度國慶之余,今天才靜下心來體驗此書,書不厚,200余頁,彩色圖例,印刷精美! 當(dāng)初申請此書,主要是看到副標題“大模型算力中心建設(shè)指南
    發(fā)表于 10-08 10:40

    模型時代的算力需求

    現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的算力,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 俯瞰全書

    的機會! 本人曾經(jīng)也參與過語音識別產(chǎn)品的開發(fā),包括在線和離線識別,但僅是應(yīng)用語言模型實現(xiàn)端側(cè)的應(yīng)用開發(fā),相當(dāng)于調(diào)用模型的接口函數(shù),實際對模型的設(shè)計、訓(xùn)練和運行機理并不了解,我想通過學(xué)習(xí)
    發(fā)表于 07-21 13:35