由AI大模型工場(chǎng)主辦的AI大模型生態(tài)暨算力大會(huì)在京舉行。作為國(guó)內(nèi)最具影響力與最懂大模型的AI生態(tài)大會(huì),此次大會(huì)以「AI NATIVE,生成未來」為主題,圍繞大模型、算力、數(shù)據(jù)產(chǎn)業(yè)、基礎(chǔ)設(shè)施全產(chǎn)業(yè)鏈、應(yīng)用場(chǎng)景等多個(gè)維度展開深度剖析與對(duì)話。
云知聲 AI Labs 研發(fā)副總裁劉升平應(yīng)邀出席論壇并作主題演講,以《山海大模型的訓(xùn)練優(yōu)化方法及應(yīng)用實(shí)踐》為題,深入剖析大模型訓(xùn)練與優(yōu)化之道,并結(jié)合具體實(shí)踐案例,帶領(lǐng)與會(huì)人員進(jìn)一步了解大模型在多領(lǐng)域的落地應(yīng)用和創(chuàng)新成果。
山海持續(xù)進(jìn)化背后,大模型訓(xùn)練與優(yōu)化之道
云知聲是國(guó)家級(jí)專精特新“小巨人”企業(yè),2018年起連續(xù)六年上榜CB Insights全球人工智能獨(dú)角獸榜單;自2018年起連續(xù)5批參與承建6項(xiàng)國(guó)家重點(diǎn)研發(fā)計(jì)劃(“科技創(chuàng)新2030-新一代人工智能重大項(xiàng)目”),承擔(dān)北京科技計(jì)劃3項(xiàng);先后獲得北京科技進(jìn)步獎(jiǎng)一等獎(jiǎng)、吳文俊人工智能科技進(jìn)步獎(jiǎng)、福建省科技進(jìn)步獎(jiǎng)一等獎(jiǎng)等榮譽(yù)獎(jiǎng)項(xiàng)。
作為國(guó)內(nèi)AGI技術(shù)產(chǎn)業(yè)化的先行者,云知聲于2023年5月發(fā)布山海大模型,其通用能力在權(quán)威測(cè)評(píng)機(jī)構(gòu)SuperCLUE發(fā)布的《中文大模型基準(zhǔn)測(cè)評(píng)2024上半年報(bào)告》中,以總分72的優(yōu)異成績(jī)穩(wěn)居全球大模型第一梯隊(duì);其醫(yī)療能力登頂今年4月MedBench評(píng)測(cè)榜,在2023 PromptCBLUE醫(yī)療大模型評(píng)測(cè)獲通用賽道一等獎(jiǎng)。
而山海之所以能夠持續(xù)在行業(yè)中保持領(lǐng)先地位,得益于團(tuán)隊(duì)對(duì)技術(shù)創(chuàng)新的不懈追求和對(duì)產(chǎn)品性能的持續(xù)精進(jìn)與優(yōu)化。
現(xiàn)場(chǎng),劉升平分享了山海大模型的通用訓(xùn)練策略,包含預(yù)訓(xùn)練、微調(diào)、偏好學(xué)習(xí)和自我提升四個(gè)步驟。同時(shí),他指出,面向不同的行業(yè)、不同的企業(yè)、不同的應(yīng)用,需要提供相應(yīng)級(jí)別的大模型?;诖?,云知聲提出了面向應(yīng)用場(chǎng)景的優(yōu)化方法包括提示工程、微調(diào)、檢索增強(qiáng)生成、對(duì)齊(反饋學(xué)習(xí))、Agent機(jī)制、增量預(yù)訓(xùn)練、可控解碼策略七種武器和一個(gè)秘方(數(shù)據(jù)訓(xùn)練的生產(chǎn)、選擇與配比),這些策略共同構(gòu)成了一套全面的方法論,確保了山海大模型能夠在實(shí)際應(yīng)用中達(dá)到最佳效果。
加速大模型落地,山海的實(shí)踐應(yīng)用探索
大模型是“成本”,應(yīng)用才是“價(jià)值”。劉升平指出,用戶不僅是為大模型付費(fèi),更是為其在實(shí)際場(chǎng)景中的應(yīng)用價(jià)值買單。
大模型的應(yīng)用五花八門,從大模型語(yǔ)言理解與生成能力的本源深究,其應(yīng)用場(chǎng)景可基于語(yǔ)言進(jìn)行分類。
自然語(yǔ)言
自然語(yǔ)言是人類在日常生活中使用的語(yǔ)言,可細(xì)分為口語(yǔ)和書面語(yǔ):
面向口語(yǔ),大模型有兩大應(yīng)用場(chǎng)景:一是人機(jī)對(duì)話系統(tǒng),大模型作為參與者與人類進(jìn)行對(duì)話,云知聲基于山海大模型打造的智慧座艙交互、智慧家居交互、智能客服與外呼等應(yīng)用均屬于這一范疇;二是人人對(duì)話系統(tǒng),大模型作為旁觀者,將人與人之間的對(duì)話錄音轉(zhuǎn)寫成文字,并進(jìn)行深入分析。例如,在會(huì)議記錄系統(tǒng)中,山海大模型能夠?qū)?huì)議中的口語(yǔ)對(duì)話實(shí)時(shí)轉(zhuǎn)錄并生成會(huì)議紀(jì)要;在門診病歷生成系統(tǒng)中,它能夠?qū)⑨t(yī)生與患者的對(duì)話轉(zhuǎn)錄并生成符合臨床規(guī)范的病歷。
面向書面語(yǔ),大模型應(yīng)用可提供一個(gè)全面覆蓋文本生命周期的解決方案。從文本的創(chuàng)作到審核,再到問答、文本抽取與分析,大模型極大提升了文本處理的效率和質(zhì)量。云知聲藍(lán)藻AI內(nèi)容創(chuàng)作平臺(tái)和獸牙AI聚合平臺(tái),就充分展示了山海大模型在文本智能化處理方面的強(qiáng)大能力。
形式語(yǔ)言
形式語(yǔ)言被設(shè)計(jì)用來執(zhí)行特定任務(wù),通常用于計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域。這種語(yǔ)言具有嚴(yán)格的規(guī)則和結(jié)構(gòu),不允許有任何歧義或模糊性。例如,編程語(yǔ)言就是一種形式語(yǔ)言?;谛问秸Z(yǔ)言的特性開發(fā)的代碼智能系統(tǒng)通過自動(dòng)化代碼生成,能夠幫助開發(fā)者減少手動(dòng)編寫代碼的時(shí)間,同時(shí)確保代碼的質(zhì)量和安全性。
在選擇大模型應(yīng)用場(chǎng)景時(shí),劉升平強(qiáng)調(diào),需要權(quán)衡大模型的成熟度以及對(duì)幻覺的容忍度,以確保選擇的場(chǎng)景能夠最大化大模型的優(yōu)勢(shì),同時(shí)最小化潛在風(fēng)險(xiǎn)。
-
AI
+關(guān)注
關(guān)注
88文章
35136瀏覽量
279759 -
云知聲
+關(guān)注
關(guān)注
0文章
230瀏覽量
8774 -
算力
+關(guān)注
關(guān)注
2文章
1200瀏覽量
15651 -
大模型
+關(guān)注
關(guān)注
2文章
3141瀏覽量
4066
原文標(biāo)題:云知聲出席AI大模型生態(tài)暨算力大會(huì)并作主題分享
文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
云知聲在港交所成功上市
云知聲與商湯科技達(dá)成戰(zhàn)略合作
云知聲榮登甲子光年2025中國(guó)AI產(chǎn)業(yè)逐浪者榜單
云知聲再度登頂MedBench榜單
云知聲Atlas超算平臺(tái)的核心亮點(diǎn)
云知聲與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于云知聲山海大模型的多元智慧場(chǎng)景

云知聲榮登2024大模型企業(yè)TOP50榜單
云知聲入選創(chuàng)業(yè)邦《2024 AIGC創(chuàng)新應(yīng)用洞察報(bào)告》
云知聲山海大模型多項(xiàng)能力全球領(lǐng)跑

云知聲與國(guó)信領(lǐng)英簽署戰(zhàn)略合作協(xié)議
云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測(cè)評(píng)榜首

評(píng)論