一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

工聯(lián)院大模型測評:文心一言在工業(yè)領域表現(xiàn)超過GPT3.5,居國內(nèi)大模型首位

智能制造IMS ? 來源:智能制造IMS ? 2023-06-29 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,中國工業(yè)互聯(lián)網(wǎng)研究院(簡稱“工聯(lián)院”)針對人工智能大模型在中文工業(yè)領域的知識問答能力進行系統(tǒng)性評測。結果顯示,百度文心一言表現(xiàn)超過GPT3.5,綜合評價指數(shù)在國內(nèi)排名第一。

766eff46-15a2-11ee-962d-dac502259ad0.png

工聯(lián)院本次評測選取了工業(yè)領域典型的八大行業(yè)。百度文心一言在??電子設備、??裝備、???鋼鐵、采礦、電力、石化、建材等七大行業(yè)均獲國內(nèi)第一。

76c72202-15a2-11ee-962d-dac502259ad0.png

五大院士,八大IEEE Fellow,共十三位頂級專家構成了專家委員會。評測對象涵蓋GPT4、GPT3.5、文心一言、ChatGLM等國內(nèi)外具有代表性的頭部大模型。評估結果選取性能前六名的模型進行公布。

百度文心一言在國內(nèi)“最懂工業(yè)”

本次工業(yè)知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎能力、語句能力、概括能力和邏輯能力。

評測結果顯示,GPT4表現(xiàn)最佳。國內(nèi)頭部大模型表現(xiàn)亮眼,整體與GPT3.5相當。其中百度文心一言表現(xiàn)超過GPT3.5,在國內(nèi)大模型中排名第一。

772c8b4c-15a2-11ee-962d-dac502259ad0.png

在客觀題環(huán)節(jié),評測結果顯示,GPT4與文心一言表現(xiàn)好于其他大模型。但評測結果也同時指出,大模型普遍準確率有較大的提升空間。

7776d9fe-15a2-11ee-962d-dac502259ad0.png

主觀題方面,國內(nèi)大模型的基礎能力、語句能力與GPT4接近,概括能力、邏輯能力與GPT4有一定差距。

在大模型的自我認知能力和污染問題分析能力上,GPT4相較于其他大模型表現(xiàn)出更好的能力。

大模型發(fā)展新熱點:豐富特定行業(yè)專業(yè)知識

雖然國內(nèi)大模型在本次評測表現(xiàn)較好,甚至在部分行業(yè)趕超GPT3.5,但工聯(lián)院評測報告也指出,國內(nèi)外通用大模型在工業(yè)知識問答領域探索仍處于初級階段,國內(nèi)大模型與GPT4有差距,比如行業(yè)間的泛化能力有待加強。

實際上,工聯(lián)院評測報告揭示出通用大模型落地垂直行業(yè)的痛點,缺乏特定行業(yè)的專業(yè)知識。

關于解決難題的方法,工聯(lián)院評測報告給出的建議是,進一步豐富相關專業(yè)領域的數(shù)據(jù)訓練集,進一步進行專業(yè)化的微調(diào)。

當前,國內(nèi)科技公司紛紛加強與工業(yè)企業(yè)合作,期望通過在實際場景中探索應用大模型,彌補差距,趕超GPT4.0。

比如在本次評測中位居國內(nèi)模型第一的百度文心一言,與南方電網(wǎng)電力調(diào)度控制中心在電力調(diào)度場景探索使用調(diào)度AI大模型。在汽車行業(yè),長安汽車基于百度文心大模型正在開發(fā)生成式人工智能產(chǎn)品,賦能一款量產(chǎn)車型,實現(xiàn)提升用戶體驗的目標。除了能源、汽車制造,百度智能云還在建筑、采礦、物流、紡織等領域,探索使用大模型提升運營效率和用戶體驗效果。

通過在實際場景的探索應用,科技公司可以積攢更多的行業(yè)Know-how,擴展相關領域的數(shù)據(jù)訓練集。這種外部真實反饋有助驅動大模型更加快速的實現(xiàn)迭代升級。

未來,工聯(lián)院將持續(xù)開展通用大模型在工業(yè)領域更多維度的性能評測,包括但不限于大模型的魯棒性、安全性以及人類大價值觀等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 南方電網(wǎng)

    關注

    2

    文章

    194

    瀏覽量

    29483
  • 文心一言
    +關注

    關注

    0

    文章

    133

    瀏覽量

    1847
  • 大模型
    +關注

    關注

    2

    文章

    3132

    瀏覽量

    4050

原文標題:工聯(lián)院大模型測評:文心一言在工業(yè)領域表現(xiàn)超過GPT3.5,居國內(nèi)大模型首位

文章出處:【微信號:CADCAM_beijing,微信公眾號:智能制造IMS】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    寧暢與與百度模型展開深度技術合作

    與部署。 憑借覆蓋訓練、推理、微調(diào)全流程的AI?服務器產(chǎn)品矩陣,寧暢幫助企業(yè)模型時代鍵打通算力與應用“任督二脈”,顯著縮短模型落地周期。
    的頭像 發(fā)表于 07-07 16:26 ?181次閱讀

    黑芝麻智能與模型技術合作升級

    近日,模型正式開源,黑芝麻智能即日起快速啟動與模型技術合作。
    的頭像 發(fā)表于 07-04 17:24 ?351次閱讀
    黑芝麻智能與<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>技術合作升級

    百度模型X1 Turbo獲得信通當前大模型最高評級證書

    百度520居然還領了個證?是它, 信通當前大模型最高評級證書 ! 5月20日的百度AI Day 上,中國信通公布了大
    的頭像 發(fā)表于 05-21 18:19 ?659次閱讀
    百度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>X1 Turbo獲得信通<b class='flag-5'>院</b>當前大<b class='flag-5'>模型</b>最高評級證書

    如何賦能醫(yī)療AI大模型應用?

    引言自ChatGPT掀起熱潮以來,眾多AI大模型如雨后春筍般涌現(xiàn),其中包括百度科技的一言、科大訊飛的訊飛星火、華為的盤古AI大模型、騰訊
    的頭像 發(fā)表于 05-07 09:36 ?256次閱讀
    如何賦能醫(yī)療AI大<b class='flag-5'>模型</b>應用?

    deepseek和文一言兩者有什么區(qū)別?哪個跟合適您使用呢?

    (DeepSeek)公司開發(fā),該公司專注于開發(fā)低成本、高性能的AI模型,致力于通過技術創(chuàng)新推動人工智能技術的普惠化。DeepSeek可能基于獨特的技術架構和算法,如混合專家(MoE)架構和多頭潛在注意力(MLA)機制。 ◆
    的頭像 發(fā)表于 02-23 09:37 ?2437次閱讀

    百度下模型正式開源

    隨著模型的迭代升級和成本不斷下降,一言將于4月1日0時起全面免費,所有PC端和APP端
    的頭像 發(fā)表于 02-17 13:44 ?515次閱讀

    百度模型4月1日起全面免費開放

    列最新的模型功能。 百度表示,模型的此次升級不僅帶來了更加豐富的功能,還致力于提升用戶體驗。與此同時,百度還透露,
    的頭像 發(fā)表于 02-14 09:19 ?466次閱讀

    百度宣布一言將全面免費

    隨著模型的迭代升級和成本不斷下降,一言將于4月1日零時起,全面免費,所有PC端和APP
    的頭像 發(fā)表于 02-13 10:46 ?396次閱讀

    字節(jié)跳動豆包大模型1.5 Pro發(fā)布

    近日,字節(jié)跳動旗下的豆包大模型迎來了全新的升級——豆包大模型1.5 Pro正式發(fā)布。這款全新模型知識、代碼、推理、中文等多個測評基準上
    的頭像 發(fā)表于 01-23 15:24 ?632次閱讀

    電子發(fā)燒友榮獲電子工業(yè)出版社博視點 “2024 年度卓越合作伙伴”

    近日,憑借過去一年在書籍測評活動等方面的深度合作與卓越表現(xiàn),電子發(fā)燒友榮膺電子工業(yè)出版社博視點 “2024 年度卓越合作伙伴” 的殊榮,表
    發(fā)表于 01-20 15:46

    說清楚什么是AI大模型

    生成能力強,部分版本支持多模態(tài)輸入(如圖像理解) 一言 百度 針對中文優(yōu)化,適合國內(nèi)應用場景 LLa
    的頭像 發(fā)表于 01-02 09:53 ?1670次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>說清楚什么是AI大<b class='flag-5'>模型</b>

    【「大模型啟示錄」閱讀體驗】如何在客服領域應用大模型

    客服領域是大模型落地場景中最多的,也是最容易實現(xiàn)的。本身客服領域的特點就是問答形式,大模型接入難度低。今天跟隨《大
    發(fā)表于 12-17 16:53

    百度一言APP升級為

    百度宣布其文一言APP正式升級為,標志著百度智能搜索領域邁出了重要
    的頭像 發(fā)表于 09-04 16:06 ?984次閱讀

    【附實操視頻】聆思CSK6大模型開發(fā)板接入國內(nèi)主流大模型(星火大模型、一言、豆包、kimi、智譜glm、通義千問)

    接入一言、通義千問、豆包、智譜glm、kimi等國內(nèi)的大模型,但由于各家接口和數(shù)據(jù)格式不
    發(fā)表于 08-22 10:12

    智能硬件接入主流大模型做語音交互(附文一言、豆包、kimi、智譜glm、通義千問示例)

    接入一言、通義千問、豆包、智譜glm、kimi等國內(nèi)的大模型,這個是必須可以的。但由于各家接口和數(shù)據(jù)格式不
    發(fā)表于 08-21 19:13