電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,北京智源大會舉辦,在本次會議上,智源研究院發(fā)布了全面開源的“悟道3.0”系列大模型及算法。
繼2021年悟道大模型項目發(fā)布之后,智源“悟道3.0”進入全面開源新階段,此次發(fā)布的一系列成果包括“悟道·天鷹”(Aquila)語言大模型系列、天秤(FlagEval)開源大模型評測體系與開放平臺、“悟道 · 視界”視覺大模型系列,以及一系列多模態(tài)模型成果。
悟道3.0全面開源意味著什么
悟道·天鷹語言大模型是首個具備中英雙語知識,支持商用許可協(xié)議、國內(nèi)數(shù)據(jù)合規(guī)需求的開源語言大模型。這一模型在中英文高質(zhì)量語料基礎(chǔ)上從“0”開始訓(xùn)練,通過數(shù)據(jù)質(zhì)量的控制、多種訓(xùn)練的優(yōu)化方法,實現(xiàn)在更小的數(shù)據(jù)集、更短的訓(xùn)練時間獲得更優(yōu)的性能。
天秤大模型評測體系及開放平臺,旨在建立科學(xué)、公正、開放的評測基準(zhǔn)、方法、工具集,協(xié)助研究人員全方位評估基礎(chǔ)模型及訓(xùn)練算法的性能,同時探索利用AI方法實現(xiàn)對主觀評測的輔助,大幅提升評測的效率和客觀性。
悟道·視界視覺大模型則系統(tǒng)化解決了當(dāng)前計算機視覺領(lǐng)域的一系列瓶頸問題,包括任務(wù)統(tǒng)一、模型規(guī)模化以及數(shù)據(jù)效率等。
悟道3.0的全面開源,意味著全球開發(fā)者和研究者都可以無門檻地獲取和使用這款高效的AI模型,開發(fā)者們可以利用悟道3.0進行各種開發(fā)和優(yōu)化,進一步提升其性能和適用性。悟道3.0全面開源,將助力更多的應(yīng)用和創(chuàng)新誕生,推動人工智能技術(shù)的全面普及和深入應(yīng)用。
大模型的發(fā)展趨勢
當(dāng)前大模型是業(yè)界關(guān)注的熱點,什么是大模型呢?據(jù)智源研究院院長黃鐵軍介紹,大模型至少有三個特點:其一是規(guī)模要大,神經(jīng)網(wǎng)絡(luò)參數(shù)要達到百億規(guī)模以上;其二是要有涌現(xiàn)性,即可以產(chǎn)生預(yù)料之外的新能力,如果一個模型只從原有的數(shù)據(jù)、算法推導(dǎo)出來結(jié)果,那不叫“涌現(xiàn)”;其三是通用性,不限于針對專門問題或者專門領(lǐng)域,能夠解決各類問題。
目前國內(nèi)不少企業(yè)都已經(jīng)發(fā)布自己的大模型產(chǎn)品,然而整體來看訓(xùn)練出來的不少大模型還不夠大,智能水平也不夠高。在黃鐵軍看來,單從語言模型來看,未來三年左右的時間,大語言模型的規(guī)模還將繼續(xù)放大,能力也會比現(xiàn)在更強,這是大模型發(fā)展的一個基本趨勢。
另外雖然現(xiàn)在越來越多的企業(yè)都在研究大模型,不過未來大模型生態(tài)只可能會有很少的幾個,比如三個左右,無論是幾十個還還是幾百個大模型,這都只是技術(shù)迭代過程中的中間產(chǎn)物。
大模型本身是一個大體系,是由千千萬萬企業(yè)共同構(gòu)建的生態(tài)系統(tǒng)。未來每個企業(yè)都將會在大模型生態(tài)中找到自己的位置,不一定是訓(xùn)練或者銷售大模型,可能是在整個生態(tài)系統(tǒng)中的某個環(huán)節(jié)。就如同在互聯(lián)網(wǎng)發(fā)展初期,人們也曾認(rèn)為賣鏟子的最賺錢,而大家都在做路由器,但最終只有幾個企業(yè)能夠做出好的路由器產(chǎn)品。
因此對于入局大模型生態(tài)體系的企業(yè)來說,不是大家都要去訓(xùn)練自己的大模型,而是需要在整個生態(tài)體系中,找到自己的優(yōu)勢和定位,在自己的領(lǐng)域做到最好,去實現(xiàn)盈利。
小結(jié)
當(dāng)前眾多企業(yè)還在積極投入到大模型的研究中,而“悟道3.0”系列大模型的全面開源,有利于促進更多應(yīng)用和創(chuàng)新。
發(fā)展趨勢方面,未來三年左右時間,大模型的規(guī)模還將放大,另外未來大模型生態(tài)中可能只會有很少幾個企業(yè)脫穎而出,然而這個生態(tài)系統(tǒng)卻有很多環(huán)節(jié),入局這個領(lǐng)域的企業(yè),可以找準(zhǔn)自己的優(yōu)勢和定位,在某幾個環(huán)節(jié)實現(xiàn)自己的價值。
-
AI
+關(guān)注
關(guān)注
88文章
34912瀏覽量
277922
發(fā)布評論請先 登錄
【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+ 入門篇學(xué)習(xí)
如何基于Kahn處理網(wǎng)絡(luò)定義AI引擎圖形編程模型

首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
AI開源模型庫有什么用
正點原子ESP32S3系列開發(fā)板全面支持小智AI
百度文心大模型將升級并開源
AMD發(fā)布10億參數(shù)開源AI模型OLMo
Llama 3 與開源AI模型的關(guān)系
IBM發(fā)布Granite 3.0 AI模型家族
如何評估AI大模型的效果
人工智能ai4s試讀申請
關(guān)于一些有助于優(yōu)化電源設(shè)計的新型材料
MSPM0-高級控制計時器有助于實現(xiàn)更好的控制和更好的數(shù)字輸出

有助于提高網(wǎng)絡(luò)設(shè)備性能的FRAM SF25C20(MB85RS2MT)

評論