一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海大模型各項性能持續(xù)優(yōu)化

云知聲 ? 來源:云知聲 ? 2023-06-26 11:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

云知聲山海大模型正式發(fā)布,交出其在AGI領(lǐng)域的第一份答卷,并進入有序迭代階段。時隔一個月,山海大模型迎來了又一次比較大的升級——各項性能持續(xù)優(yōu)化,且在核心能力上實現(xiàn)三大升級:通過迭代實現(xiàn)了在特定領(lǐng)域內(nèi)的專業(yè)知識積累,詩詞創(chuàng)作能力、數(shù)學(xué)計算能力實現(xiàn)突破。

技術(shù)加碼,性能持續(xù)優(yōu)化

01吞吐效率接近理論上限60%

UniScale通過引入全新的Attention高效計算方式和相關(guān)底層算子的優(yōu)化來提高浮點運算效率,另外,也進一步優(yōu)化了訓(xùn)練框架中的通信策略,進一步提升了多機多卡的吞吐效率。UniScale目前在多機多卡大模型訓(xùn)練計算效率接近理論上限的60%,而當前公開的主流框架訓(xùn)練效率約45%左右,因此所提方法能夠吞吐量在原有基礎(chǔ)上提升了15個點。在推理部分,通過解碼策略優(yōu)化、量化和高效算子適配,相對原始推理性能翻倍,并適配了不同性能的顯卡推理部署。這意味著訓(xùn)推一體框架UniScale 具有出色的并行計算能力,能夠同時處理多個任務(wù),大大提高了模型的訓(xùn)練速度。也表明在相同的時間內(nèi),UniScale可以完成更加高效的計算任務(wù),降低推理部署成本。

3be7ec68-1348-11ee-962d-dac502259ad0.png

02微調(diào)速度提升15倍

UniScale通過集成QLoRA微調(diào)(Dettmers et al., 2023)技術(shù),不僅極大地減少了微調(diào)所需的硬件資源,還提高了微調(diào)速度。QLoRA是在LoRA微調(diào)(Hu et al., 2021)基礎(chǔ)上結(jié)合了4位量化、雙量化和統(tǒng)一內(nèi)存分頁技術(shù),是一種高效的模型參數(shù)微調(diào)方法,不僅可以在普通消費級GPU上完成大規(guī)模語言模型的微調(diào),還能夠在較少的迭代次數(shù)內(nèi)快速收斂。與此同時,我們實現(xiàn)了一種多指令統(tǒng)一微調(diào)技術(shù),能夠進一步減少模型的計算和通信開銷,加快微調(diào)的速度。我們經(jīng)過實驗驗證,UniScale在使用QLoRA微調(diào)和統(tǒng)一微調(diào)技術(shù)之后,微調(diào)速度提升了約15倍。

這一改進對于微調(diào)任務(wù)非常重要,特別是當資源有限的情況下在大規(guī)模數(shù)據(jù)集上進行微調(diào)的場景。傳統(tǒng)的微調(diào)方法需要耗費較長的時間來逐步調(diào)整模型參數(shù),而QLoRA微調(diào)能夠通過多種量化方法顯著減少顯存占用,大大減少了微調(diào)所需的內(nèi)存,同時性能幾乎與標準微調(diào)相當。與此同時,微調(diào)后的模型可以直接用于模型部署,符合UniScale訓(xùn)練與推理一體化的設(shè)計理念,這項改進使得UniScale成為一個非常有效的深度學(xué)習平臺,提供了更快速、高效的微調(diào)實驗方案。

3bfa5ff6-1348-11ee-962d-dac502259ad0.png ? ?

能力突破,效果加速提升

01醫(yī)療能力超越Med-PaLM 2

山海大模型實現(xiàn)了在特定領(lǐng)域內(nèi)專業(yè)知識的快速積累,通過語料的不斷迭代升級,專業(yè)能力持續(xù)突破。以醫(yī)療領(lǐng)域為例,山海大模型學(xué)習了大量教材、百科等高質(zhì)量醫(yī)學(xué)文獻,使其能夠提供更加全面、專業(yè)的醫(yī)療信息支持。在擴展了醫(yī)療大模型的領(lǐng)域知識的同時,山海大模型仍舊保持原有的高性能、高準確率等特點。醫(yī)療大模型的改進為醫(yī)生們提供更強大的支持和指導(dǎo),以提高醫(yī)療效果。目前該模型在MedQA任務(wù)上提升到了87.1%,超越Med-PaLM 2,臨床執(zhí)業(yè)醫(yī)師資格考試提升到了523(總分600分),超過了99%的考生水平。

3c25c1be-1348-11ee-962d-dac502259ad0.png

02詩詞創(chuàng)作能力升級

在詩詞創(chuàng)作方面上,山海大模型不僅在預(yù)訓(xùn)練階段增加了7萬多首古詩詞數(shù)據(jù),補充詩詞相關(guān)的知識,在指令學(xué)習階段,也精心設(shè)計近40種不同的指令,基本覆蓋日常對詩詞數(shù)據(jù)相關(guān)知識考察的內(nèi)容,充分發(fā)掘大模型的潛力,進一步提升創(chuàng)作能力。通過指令學(xué)習的方法,山海大模型學(xué)會了運用類似的修辭手法和表達方式,使其創(chuàng)作效果更富詩意、更具情感溫度。不僅如此,山海大模型還能夠根據(jù)主題和情感要求進行定制化創(chuàng)作——這一突破不僅得益于詩詞相關(guān)的指令學(xué)習數(shù)據(jù)的引入,也歸功于山海大模型自身強大的計算和學(xué)習能力。

03數(shù)學(xué)能力提升

山海大模型的數(shù)學(xué)計算能力主要依賴預(yù)訓(xùn)練階段扎實、系統(tǒng)的數(shù)學(xué)理論體系和指令學(xué)習階段基于插件的具體題型的求解能力。為了進一步提升山海大模型的數(shù)學(xué)能力,我們主要針對以下兩方面進行優(yōu)化:

a) 我們在預(yù)訓(xùn)練階段提供人工和模型精心挑選的高質(zhì)量預(yù)訓(xùn)練數(shù)據(jù),其中包括從小學(xué)到大學(xué)所有數(shù)學(xué)學(xué)科的教材、練習冊等,通過這些數(shù)據(jù)的學(xué)習,模型就具備了系統(tǒng)的數(shù)學(xué)理論體系和解決各種數(shù)學(xué)問題的基礎(chǔ)。

b) 基于 react 思想的指令學(xué)習是大模型數(shù)學(xué)能力的必要步驟。在此階段,對每一種題型,我們給出具體的解題思路,包括 reasoning and acting,教會大模型解決各種問題的能力。解題過程中,為了解決大模型無法做精確數(shù)值計算的問題,將數(shù)值運算移交給插件完成,插件完成數(shù)值計算或者方程求解之后,將答案返回大模型,大模型繼續(xù)問題求解,直到給出最終答案。

從5月24日正式發(fā)布以來,山海大模型始終在不斷訓(xùn)練、調(diào)優(yōu),致力通過自身不斷的迭代進化兌現(xiàn)AI應(yīng)用價值;保持高速演進的同時,也在探索與具體場景深度融合的更多可能。

目前,云知聲山海大模型已深入到智慧醫(yī)療、智慧教育、知識管理、智慧營銷、智能客服等具體場景中,基于山海大模型打造的場景應(yīng)用正不斷豐富、不斷拓展。

7月6日-7月8日,云知聲將攜山海大模型及其醫(yī)療、銀行、車載、客服等最新場景應(yīng)用亮相2023世界人工智能大會,歡迎大家屆時蒞臨云知聲展位參觀交流。

從能力升級到場景應(yīng)用,基于多年技術(shù)積累,云知聲正加速推進山海大模型的迭代演變。未來山海會有怎樣的驚喜和亮點,值得你的期待。
責任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2505

    瀏覽量

    69503
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3518

    瀏覽量

    50406
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    230

    瀏覽量

    8768

原文標題:山海大模型迎來新一輪迭代,醫(yī)療能力超越Med-PaLM 2

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    在港交所成功上市

    近日,智能科技股份有限公司(以下簡稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號:0
    的頭像 發(fā)表于 07-03 17:41 ?490次閱讀

    與商湯科技達成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡稱“”)與上海商湯智能科技有限公司(以下簡稱“商湯
    的頭像 發(fā)表于 06-20 14:52 ?439次閱讀

    榮登甲子光年2025中國AI產(chǎn)業(yè)逐浪者榜單

    近日,由甲子光年主辦的「AI共潮生·2025甲子引力X科技產(chǎn)業(yè)新風向」在上海工業(yè)智能中心成功舉辦。憑借山海模型的領(lǐng)先技術(shù)實力與多領(lǐng)域
    的頭像 發(fā)表于 05-26 14:13 ?381次閱讀

    再度登頂MedBench榜單

    近日,中文醫(yī)療大模型權(quán)威評測平臺MedBench公布最新自測榜單結(jié)果,基于山海模型打造的
    的頭像 發(fā)表于 05-20 10:12 ?337次閱讀

    陳吉勝:大模型應(yīng)用分析與案例介紹

    近日,上海師范大學(xué)信息與機電工程學(xué)院第四屆人工智能競賽挑戰(zhàn)周系列活動正式開幕。作為國內(nèi)AI領(lǐng)域的頭部獨角獸企業(yè),受到特別邀請。
    的頭像 發(fā)表于 12-13 14:20 ?761次閱讀

    與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于山海模型的多元智慧場景

    ?? 12月6日,(上海)智能科技有限公司(以下簡稱““)與上海英內(nèi)物聯(lián)網(wǎng)科技股份有
    的頭像 發(fā)表于 12-06 20:05 ?1266次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧場景

    學(xué)院持續(xù)開展人工智能專題培訓(xùn)

    近日,旗下學(xué)院在北京、上海、廈門三地開展AI專題培訓(xùn),深度賦能教師、企業(yè)家、外企高層等多元化群體,
    的頭像 發(fā)表于 11-29 18:18 ?801次閱讀

    榮登2024大模型企業(yè)TOP50榜單

    近日,智領(lǐng)未來·向新而行—2024人工智能大模型產(chǎn)業(yè)大會在京召開,會上揭曉2024大模型企業(yè)TOP50榜單,榮登榜單,
    的頭像 發(fā)表于 11-29 17:52 ?931次閱讀

    山海模型多項能力全球領(lǐng)跑

    國內(nèi)人工智能權(quán)威機構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評測選取海內(nèi)外24個具有代表性的大模型,結(jié)果顯示,山海模型對齊、智能體、安全等多項能力全球領(lǐng)跑。
    的頭像 發(fā)表于 10-12 14:30 ?815次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項能力全球領(lǐng)跑

    與國信領(lǐng)英簽署戰(zhàn)略合作協(xié)議

    智能科技股份有限公司(以下簡稱“”)與蘇州國信領(lǐng)英教育科技有限公司(以下簡稱“國信領(lǐng)
    的頭像 發(fā)表于 10-12 14:16 ?738次閱讀

    山海模型的訓(xùn)練優(yōu)化方法及應(yīng)用實踐

    由AI大模型工場主辦的AI大模型生態(tài)暨算力大會在京舉行。作為國內(nèi)最具影響力與最懂大模型的AI生態(tài)大會,此次大會以「AI NATIVE,生成未來」為主題,圍繞大模型、算力、數(shù)據(jù)產(chǎn)業(yè)、基礎(chǔ)
    的頭像 發(fā)表于 10-12 14:12 ?644次閱讀

    山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

    近日,多模態(tài)人工智能模型基準評測集MMMU更新榜單,山海多模態(tài)大模型UniGPT-mMed
    的頭像 發(fā)表于 10-12 14:09 ?666次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測評榜首

    山海模型醫(yī)療專業(yè)能力全球第一

    近日,由上海AI實驗室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,繼4月份奪冠后,山海模型醫(yī)療行業(yè)版(UniGP
    的頭像 發(fā)表于 09-19 15:47 ?751次閱讀

    山海模型助力司法領(lǐng)域智慧化升級

    近期,成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海模型的司法領(lǐng)域應(yīng)用,極大提升了司法服務(wù)的可及性與便利性。這不僅是
    的頭像 發(fā)表于 09-12 14:44 ?889次閱讀

    推出山海多模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心獨運的山海多模態(tài)大
    的頭像 發(fā)表于 08-27 15:20 ?629次閱讀