一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)內(nèi)8種大模型體驗(yàn)測(cè)評(píng)報(bào)告(2023)

智能計(jì)算芯世界 ? 來源:智能計(jì)算芯世界 ? 2023-08-21 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能大模型體驗(yàn)報(bào)告2.0》報(bào)告指出當(dāng)前國(guó)產(chǎn)大模型產(chǎn)品已具有顯著進(jìn)步,訊飛星火、百度文心一言、商湯商量和智譜AI-ChatGLM均表現(xiàn)搶眼,但與接受過高等教育的人類相比,在智商、情商等方面仍存在一定程度差距。

報(bào)告選取360智腦、百度文心一言、瀾舟 Mchat、商湯商量、訊飛星火、阿里通義千問、昆侖天工、智譜 ChatGLM 共 8 種大模型產(chǎn)品進(jìn)行評(píng)測(cè),根據(jù)基礎(chǔ)能力、智商能力、情商能力、工具提取四個(gè)維度計(jì)算總分。

報(bào)告顯示,與2023年6月相比,當(dāng)前中國(guó)大模型產(chǎn)品進(jìn)步顯著。但與接受過高等教育的人類相比,大模型在智商、情商等方面還存在一定程度差距。具體來看,訊飛星火在工作提效方面優(yōu)勢(shì)明顯,百度文心一言基礎(chǔ)能力仍處領(lǐng)軍水準(zhǔn),商湯商量則在情商方面表現(xiàn)優(yōu)秀,智譜AI-ChatGLM整體表現(xiàn)優(yōu)秀。

針對(duì)各維度能力測(cè)評(píng),該報(bào)告還給出了相應(yīng)的案例展示和分析。

在基礎(chǔ)能力方面,人類與AI之間的差距并不顯著。課題組分別從語言能力(35%)、AI向善(10%)、跨模態(tài)(20%)和多輪對(duì)話(35%)四大指標(biāo)進(jìn)行測(cè)評(píng)。測(cè)評(píng)顯示,科技企業(yè)大模型中,百度文心一言表現(xiàn)最為搶眼,商湯商量、智譜AI-ChatGLM、360智腦表現(xiàn)優(yōu)良。

在智商評(píng)估方面,人類在智商方面仍然具有明顯優(yōu)勢(shì)。課題組分別從常識(shí)知識(shí)(20%)、邏輯能力(50%)和專業(yè)知識(shí)(30%)方面對(duì)科技企業(yè)大模型進(jìn)行考量。結(jié)果顯示,訊飛星火、智譜AI-ChatGLM表現(xiàn)突出,百度文心一言、昆侖萬維天工表現(xiàn)優(yōu)良。

在情商方面,AI與人類之間的差距最為明顯。人類在情緒理解和處理方面通常具有更強(qiáng)的優(yōu)勢(shì),和更靈活的處理能力。通過對(duì)處理日常事項(xiàng)(35%)、一語雙關(guān)(30%)、人際關(guān)系(35%)問題進(jìn)行分析發(fā)現(xiàn),科技企業(yè)大模型中,商湯商量表現(xiàn)亮眼,百度文心一言、瀾舟科技Mchat、智譜AI-ChatGLM及360智腦均表現(xiàn)優(yōu)良。

在工作效率提升方面,課題組重點(diǎn)在工具提效(50%)和生成創(chuàng)新(50%)方面進(jìn)行考量。結(jié)果顯示,訊飛星火表現(xiàn)最為搶眼,百度文心一言、商湯商量、智譜AI-ChatGLM表現(xiàn)優(yōu)良。不過,盡管AI具有高速度和高效率的優(yōu)勢(shì),但在某些復(fù)雜和具有創(chuàng)新性的任務(wù)中,人類的智慧和想象力仍然具有無法替代的作用。

在不同領(lǐng)域中,AI和人類表現(xiàn)出不同的優(yōu)劣勢(shì),但在整體上,AI大模型的發(fā)展為人類工作和生活的提質(zhì)增效帶來了重要的積極影響,大模型正在加速走進(jìn)生活、走進(jìn)產(chǎn)業(yè)。在本次體驗(yàn)測(cè)評(píng)基礎(chǔ)上,研究團(tuán)隊(duì)將繼續(xù)深耕,加強(qiáng)在大模型安全可解釋性、工作提效能力、實(shí)際落地情況、產(chǎn)業(yè)優(yōu)秀案例等維度上的探索與研究。


8c6e799a-3fb7-11ee-ac96-dac502259ad0.jpg

8c96aa82-3fb7-11ee-ac96-dac502259ad0.jpg

8cb26e98-3fb7-11ee-ac96-dac502259ad0.jpg

8cc9a55e-3fb7-11ee-ac96-dac502259ad0.jpg

8cee04e4-3fb7-11ee-ac96-dac502259ad0.jpg

8d38e482-3fb7-11ee-ac96-dac502259ad0.jpg

8d5ead5c-3fb7-11ee-ac96-dac502259ad0.jpg

8da5e230-3fb7-11ee-ac96-dac502259ad0.jpg

8dce081e-3fb7-11ee-ac96-dac502259ad0.jpg

8de89c24-3fb7-11ee-ac96-dac502259ad0.jpg

8e007768-3fb7-11ee-ac96-dac502259ad0.jpg

8e2299f6-3fb7-11ee-ac96-dac502259ad0.jpg

8e5c568c-3fb7-11ee-ac96-dac502259ad0.jpg

8e7e38d8-3fb7-11ee-ac96-dac502259ad0.jpg

8eae686e-3fb7-11ee-ac96-dac502259ad0.jpg

8ee20034-3fb7-11ee-ac96-dac502259ad0.jpg

8f073304-3fb7-11ee-ac96-dac502259ad0.jpg

8f266f8a-3fb7-11ee-ac96-dac502259ad0.jpg

8f4c71bc-3fb7-11ee-ac96-dac502259ad0.jpg

8f8e1482-3fb7-11ee-ac96-dac502259ad0.jpg

8fb0075e-3fb7-11ee-ac96-dac502259ad0.jpg

8fe6b218-3fb7-11ee-ac96-dac502259ad0.jpg

901e1cc6-3fb7-11ee-ac96-dac502259ad0.jpg

90417d24-3fb7-11ee-ac96-dac502259ad0.jpg

9072bea2-3fb7-11ee-ac96-dac502259ad0.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280035
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249595
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4076

原文標(biāo)題:國(guó)內(nèi)8種大模型體驗(yàn)測(cè)評(píng)報(bào)告(2023)

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    理想汽車榮獲汽車大模型安全證書

    2025中國(guó)汽車論壇舉行“智艙安言計(jì)劃——汽車生成式人工智能安全測(cè)評(píng)”頒證儀式。理想汽車車載大模型榮獲由CCIA汽車網(wǎng)絡(luò)安全工作委員會(huì)頒發(fā)的《生成內(nèi)容安全測(cè)評(píng)證書》,及人工智能生成合成內(nèi)容標(biāo)識(shí)服務(wù)
    的頭像 發(fā)表于 07-18 16:10 ?118次閱讀

    商湯日日新SenseNova融合模態(tài)大模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型

    的大模型。 可信AI多模態(tài)大模型評(píng)估2025年1月啟動(dòng),由中國(guó)信通院人工智能研究所牽頭,依據(jù)由業(yè)界60余家單位共同編制的《多模態(tài)大模型技術(shù)要求和評(píng)估方法》標(biāo)準(zhǔn)開展,是國(guó)內(nèi)最影響力和權(quán)威
    的頭像 發(fā)表于 06-11 11:57 ?683次閱讀

    中興通訊星云大模型登頂SuperCLUE推理專項(xiàng)榜單

    近日,中文大模型權(quán)威測(cè)評(píng)基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測(cè)評(píng)2025年5月報(bào)告》。報(bào)告
    的頭像 發(fā)表于 06-04 16:44 ?696次閱讀

    商湯科技日日新V6大模型斬獲“雙料第一” 一項(xiàng)國(guó)內(nèi)榜首,一個(gè)全球第一

    衛(wèi)冕“雙冠”! 通用語言能力并列國(guó)內(nèi)榜首、多模態(tài)能力全球最強(qiáng),商湯「日日新V6」近期斬獲“雙料第一”。 5月28日,權(quán)威大模型測(cè)評(píng)機(jī)構(gòu)SuperCLUE《中文大模型基準(zhǔn)
    的頭像 發(fā)表于 05-30 11:13 ?883次閱讀
    商湯科技日日新V6大<b class='flag-5'>模型</b>斬獲“雙料第一” 一項(xiàng)<b class='flag-5'>國(guó)內(nèi)</b>榜首,一個(gè)全球第一

    商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡(jiǎn)稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國(guó)大模型年度評(píng)測(cè)》結(jié)果顯示:在語言和多模態(tài)核心能力測(cè)評(píng)中,商湯“日日新”融合大模型斬獲國(guó)
    的頭像 發(fā)表于 03-18 10:35 ?584次閱讀

    華為通信大模型應(yīng)用NetMaster通過Tolly Group權(quán)威認(rèn)證

    近日,國(guó)際獨(dú)立測(cè)試機(jī)構(gòu)Tolly Group發(fā)布了對(duì)華為通信大模型應(yīng)用NetMaster的能力測(cè)評(píng)報(bào)告:華為NetMaster在網(wǎng)絡(luò)健康體檢與故障閉環(huán)處理兩大智能化運(yùn)維關(guān)鍵場(chǎng)景表現(xiàn)優(yōu)異,滿足且超越AI大
    的頭像 發(fā)表于 01-16 11:14 ?593次閱讀

    商湯“日日新”融合大模型榮獲雙料冠軍

    技術(shù)領(lǐng)域取得了重大進(jìn)展。 值得一提的是,“日日新”融合大模型在兩大權(quán)威評(píng)測(cè)榜單上均表現(xiàn)優(yōu)異,一舉奪得雙料冠軍。在國(guó)內(nèi)權(quán)威大模型測(cè)評(píng)機(jī)構(gòu)SuperCLUE最新發(fā)布的《中文大
    的頭像 發(fā)表于 01-13 16:10 ?575次閱讀

    基于 Flexus 云服務(wù)器 X 實(shí)例體驗(yàn)大模型部署體驗(yàn)測(cè)評(píng)

    前言 當(dāng)下,各種大模型層出不窮,先有 openai 的 chatgpt,后有百度文心一言,再就是國(guó)內(nèi)模型齊頭并進(jìn)的搶先發(fā)布。 讓普通的開發(fā)者不必為不能體驗(yàn) chatgpt 而擔(dān)憂,國(guó)內(nèi)
    的頭像 發(fā)表于 12-24 12:27 ?565次閱讀
    基于 Flexus 云服務(wù)器 X 實(shí)例體驗(yàn)大<b class='flag-5'>模型</b>部署體驗(yàn)<b class='flag-5'>測(cè)評(píng)</b>

    如何使用FP8新技術(shù)加速大模型訓(xùn)練

    利用 FP8 技術(shù)加速 LLM 推理和訓(xùn)練越來越受到關(guān)注,本文主要和大家介紹如何使用 FP8 這項(xiàng)新技術(shù)加速大模型的訓(xùn)練。 使用 FP8 進(jìn)行大模型
    的頭像 發(fā)表于 12-09 11:30 ?1077次閱讀

    商湯日日新·商量大模型位列國(guó)內(nèi)模型第一梯隊(duì)

    剛剛,中文大模型測(cè)評(píng)基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測(cè)評(píng)2024年10月報(bào)告》。
    的頭像 發(fā)表于 11-08 15:38 ?1014次閱讀

    高通發(fā)布《2023高通中國(guó)企業(yè)責(zé)任報(bào)告

    不久前,高通公司發(fā)布《2023高通中國(guó)企業(yè)責(zé)任報(bào)告》,這是高通連續(xù)第九年發(fā)布其中國(guó)區(qū)企業(yè)責(zé)任報(bào)告。此份報(bào)告介紹了高通如何通過賦能數(shù)字化轉(zhuǎn)型、負(fù)責(zé)任地經(jīng)營(yíng)以及可持續(xù)地運(yùn)營(yíng)這三個(gè)戰(zhàn)略重點(diǎn)領(lǐng)
    的頭像 發(fā)表于 11-08 11:18 ?809次閱讀

    商湯科技發(fā)布《2023年氣候信息披露報(bào)告

    今日,商湯正式發(fā)布《2023年氣候信息披露報(bào)告》,從氣候治理架構(gòu)、氣候相關(guān)風(fēng)險(xiǎn)與機(jī)遇評(píng)估、氣候策略及應(yīng)對(duì)措施、目標(biāo)與指標(biāo)管理等,全面展現(xiàn)了商湯對(duì)氣候相關(guān)風(fēng)險(xiǎn)和機(jī)遇的管理成效,擁抱綠色轉(zhuǎn)型,引領(lǐng)行業(yè)向低碳未來邁進(jìn)。
    的頭像 發(fā)表于 10-31 11:46 ?647次閱讀
    商湯科技發(fā)布《<b class='flag-5'>2023</b>年氣候信息披露<b class='flag-5'>報(bào)告</b>》

    中興通訊發(fā)布2023年可持續(xù)發(fā)展報(bào)告

    近日,中興通訊發(fā)布2023年度可持續(xù)發(fā)展報(bào)告,報(bào)告全面展現(xiàn)了2023年中興通訊秉承“數(shù)字經(jīng)濟(jì)筑路者”的生態(tài)定位,在綠色創(chuàng)新、社會(huì)貢獻(xiàn)、企業(yè)治理等領(lǐng)域的戰(zhàn)略布局、實(shí)施舉措和進(jìn)展成果。自2
    的頭像 發(fā)表于 09-14 14:33 ?1865次閱讀

    云知聲山海大模型位居全球大模型第一梯隊(duì)

    SuperCLUE發(fā)布《中文大模型基準(zhǔn)測(cè)評(píng)2024上半年報(bào)告》,報(bào)告選取國(guó)內(nèi)外有代表性的33個(gè)大模型
    的頭像 發(fā)表于 09-12 14:41 ?940次閱讀

    【附實(shí)操視頻】聆思CSK6大模型開發(fā)板接入國(guó)內(nèi)主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義千問)

    本帖最后由 jf_40317719 于 2024-8-22 10:15 編輯 多模態(tài)交互離不開硬件載體,近期有不少開發(fā)者在研究聆思CSK6大模型開發(fā)板除了使用出廠示例自帶的星火大模型,能不能
    發(fā)表于 08-22 10:12