國(guó)產(chǎn)AI大模型迎來(lái)對(duì)標(biāo)全球頂尖版本時(shí)刻!
4月23日,商湯科技帶來(lái)全新升級(jí)的「日日新SenseNova 5.0」大模型,具備更強(qiáng)的知識(shí)、數(shù)學(xué)、推理及代碼能力,綜合性能全面對(duì)標(biāo) GPT-4 Turbo,并在主流客觀評(píng)測(cè)上達(dá)到或超越 GPT-4 Turbo。
「日日新 5.0」能力提升主要得益三個(gè)方面:
采用混合專家架構(gòu)(MoE),激活少量參數(shù)就能完成推理。且推理時(shí)上下文窗口達(dá)到 200K 左右。
基于超過(guò)10TB tokens訓(xùn)練、覆蓋數(shù)千億量級(jí)的邏輯型合成思維鏈數(shù)據(jù)。
商湯AI大裝置SenseCore算力設(shè)施與算法設(shè)計(jì)的聯(lián)合調(diào)優(yōu)。
先看看BenchMark成績(jī):
「日日新 5.0」在大部分核心測(cè)試集指標(biāo)上都對(duì)標(biāo)甚至超過(guò)GPT-4 Turbo
在實(shí)際使用中,「日日新 5.0」具體表現(xiàn)怎么樣?下面,分別從自然語(yǔ)言能力、文生圖能力、多模態(tài)和數(shù)據(jù)分析能力幾個(gè)方面對(duì)比一下。
▎自然語(yǔ)言能力 「日日新 5.0」的自然語(yǔ)言能力得益于對(duì)大量中文語(yǔ)料的構(gòu)建。
創(chuàng)意寫(xiě)作、推理以及總結(jié)能力均大幅提升,相同的中文知識(shí)注入后,可以獲得更好的理解總結(jié)及問(wèn)答,為教育、內(nèi)容產(chǎn)業(yè)等垂直應(yīng)用場(chǎng)景提供有力輔助。
例如,在創(chuàng)意寫(xiě)作方面,「日日新 5.0」可以打破傳統(tǒng)作文的“八股式”寫(xiě)法,將通用知識(shí)、新知識(shí)融會(huì)貫通,實(shí)現(xiàn)更開(kāi)放式的創(chuàng)作。
以《紅樓夢(mèng)》里亭子的題名來(lái)寫(xiě)一篇關(guān)于文化、關(guān)于創(chuàng)新的作文:GPT-4寫(xiě)作分別從學(xué)習(xí)、工作、生活維度討論傳統(tǒng)與創(chuàng)新,套路痕跡較為明顯,淺嘗輒止,難免不讓人覺(jué)得枯燥乏味;
「日日新 5.0」寫(xiě)作頗為生動(dòng)形象,節(jié)奏不一,引經(jīng)據(jù)典。從《詩(shī)經(jīng)》《楚詞》到《漢賦》,從“兼愛(ài)非攻”到“民貴君輕”,革古鼎新,“一花獨(dú)放不是春,百花齊放春滿園”,文化交流是創(chuàng)新生生不息的源泉。從歷史宏觀到細(xì)節(jié)的生動(dòng)刻畫(huà),
「日日新 5.0」想象力豐富,似一位才華橫溢的“大才子”
數(shù)學(xué),不僅涉及到計(jì)算能力,其實(shí)也會(huì)涉及到很多對(duì)題目和問(wèn)題描述的理解能力,反映的是一個(gè)更加綜合思考、構(gòu)建邏輯的過(guò)程。
當(dāng)前的AI大模型很容易失敗的一點(diǎn)是應(yīng)對(duì)之前沒(méi)有提問(wèn)過(guò)的數(shù)學(xué)場(chǎng)景,當(dāng)背后缺少構(gòu)造完整思維鏈時(shí)就容易出錯(cuò)。問(wèn)一些小眾不常見(jiàn)的問(wèn)題實(shí)際上是驗(yàn)證其背后真正構(gòu)建思維鏈的能力。
「日日新 5.0」和GPT-4回答趣味推理問(wèn)題:“媽媽給圓圓沖了一杯咖啡,圓圓喝半杯后,將它加滿水,然后她又喝了半杯后,再加滿水,最后全部喝完。問(wèn)圓圓喝了多少咖啡,多少水?”,「日日新 5.0」回答正確
下面也是一個(gè)很簡(jiǎn)單的邏輯題目。
「日日新 5.0」和GPT-4回答邏輯問(wèn)題對(duì)比:“13個(gè)小朋友玩老鷹抓小雞,1人扮演老鷹,12個(gè)扮演小雞,已經(jīng)抓了5只小雞,還剩幾只?”。GPT-4給出答案是抓了5只還剩8只,而日日新的答案是減掉1只老鷹所以還有7只沒(méi)有被抓住。這個(gè)題目并不是一個(gè)簡(jiǎn)單算術(shù)的問(wèn)題,而是需要對(duì)中文環(huán)境有充分理解,顯然「日日新 5.0」表現(xiàn)更好
▎文生圖能力
「日日新5.0」的文生圖能力也有較大提升,下面對(duì)比了商湯「日日新?秒畫(huà)」和目前行業(yè)中幾個(gè)最好的模型,包括:Midjourney、Stable Diffution 3、GPT-4V。
人像是評(píng)估文生圖能力的關(guān)鍵場(chǎng)景之一,「日日新5.0」在人物生成上有非常大的提升。秒畫(huà)生成的人像可以看出非常好皮膚的紋理,而其他幾個(gè)大模型在皮膚上都做了磨皮
這個(gè)對(duì)比體現(xiàn)另外一個(gè)難點(diǎn),即怎樣把不同字段的理解合成在一起。秒畫(huà)給出了一個(gè)非常未來(lái)感的建筑,且對(duì)建筑下的倒影、波浪都表現(xiàn)得非常具有美感,實(shí)現(xiàn)了比較完整的指令跟隨且生成效果好。而其他幾個(gè)大模型會(huì)發(fā)現(xiàn)對(duì)于文字嵌入到圖像中,無(wú)論對(duì)文字的理解還是放置位置,都有一定缺失
▎多模態(tài)和數(shù)據(jù)分析能力
本次「日日新5.0」另一大核心指標(biāo)就是多模態(tài)能力,商湯多模態(tài)大模型的圖文感知能力達(dá)到全球領(lǐng)先水平,在權(quán)威綜合基準(zhǔn)測(cè)試MMBench中綜合得分排名首位,在多個(gè)知名多模態(tài)榜單MathVista, AI2D, ChartQA, TextVQA, DocVQA, MMMU 取得領(lǐng)先成績(jī)。
?
「日日新5.0」在應(yīng)用產(chǎn)品層面也實(shí)現(xiàn)了更卓越的多模態(tài)能力,支持高清長(zhǎng)圖的解析和理解以及文生圖交互式生成,還可以實(shí)現(xiàn)復(fù)雜的跨文檔知識(shí)抽取及總結(jié)問(wèn)答展示,還具備豐富的多模態(tài)交互能力,下面看幾個(gè)具體例子。
首先是一個(gè)很常見(jiàn)的例子,針對(duì)信息長(zhǎng)圖做核心內(nèi)容的提煉和分析。有時(shí)長(zhǎng)圖尺寸很大,很多多模態(tài)大模型支持不了很大的圖像分辨率,而「日日新5.0」提供了非常大的分辨率接口。
以商湯絕影SenseAuto的宣傳長(zhǎng)圖為例,放到「日日新5.0」大模型中可以對(duì)長(zhǎng)圖內(nèi)容進(jìn)行提問(wèn),如“請(qǐng)描述一下這張圖片的細(xì)節(jié)”。模型對(duì)長(zhǎng)圖分析后,能夠?qū)﹂L(zhǎng)圖的標(biāo)題和內(nèi)容進(jìn)行總結(jié)
大家有時(shí)會(huì)把打車軟件截圖發(fā)給等待的朋友,這里面有司機(jī)信息、車的信息、車牌信息、時(shí)間信息等等一系列文字和圖片信息,信息密度非常高。對(duì)于大模型的信息提取分析很有挑戰(zhàn)。
「日日新5.0」展現(xiàn)出了對(duì)于中文理解的優(yōu)勢(shì),特別是對(duì)文本的分析和對(duì)場(chǎng)景的理解上非常出色,識(shí)別出來(lái)有手機(jī)信號(hào)中國(guó)移動(dòng)和中國(guó)聯(lián)通雙卡雙待,GPT-4沒(méi)有識(shí)別出來(lái)的。包括對(duì)車牌、司機(jī)姓名等細(xì)節(jié)內(nèi)容的提取,GPT-4的識(shí)別也有錯(cuò)誤。
「日日新5.0」對(duì)這類多模態(tài)信息的獲取更加準(zhǔn)確
最后,再看看「日日新 5.0」對(duì)應(yīng)的數(shù)理能力。
上周,中國(guó)首位F1車手周冠宇完成了他在F1中國(guó)大獎(jiǎng)賽的比賽。用大模型統(tǒng)計(jì)下周冠宇和F1賽事的情況。
用商湯“辦公小浣熊”處理這個(gè)任務(wù),只要導(dǎo)入數(shù)據(jù)表格,通過(guò)自然語(yǔ)言和模糊的人類交互方法,分析統(tǒng)計(jì)出2022年、2023年、2024年的周冠宇參賽信息。其中包括引導(dǎo)模型將數(shù)據(jù)庫(kù)中拼音的guanyu-zhou與人類搜索的漢字周冠宇實(shí)現(xiàn)匹配,打通任務(wù)鏈。還有更復(fù)雜的任務(wù),如統(tǒng)計(jì)F1總共有多少車手,有哪些獲得過(guò)總冠軍,獲獎(jiǎng)次數(shù)從高到低排列,這涉及更大的數(shù)據(jù)表格和圈數(shù)、領(lǐng)獎(jiǎng)數(shù)等更多維度的細(xì)節(jié)信息,最終也都給出了完全正確的答案,還能自動(dòng)生成雷達(dá)圖
-
GPT
+關(guān)注
關(guān)注
0文章
368瀏覽量
16084 -
商湯科技
+關(guān)注
關(guān)注
8文章
563瀏覽量
36793 -
AI大模型
+關(guān)注
關(guān)注
0文章
375瀏覽量
612
原文標(biāo)題:中國(guó)首個(gè)GPT-4 Turbo級(jí)別的大模型登場(chǎng),6000億參數(shù),商湯「日日新5.0」發(fā)布
文章出處:【微信號(hào):SenseTime2017,微信公眾號(hào):商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
商湯日日新SenseNova融合模態(tài)大模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型
商湯科技日日新V6大模型斬獲“雙料第一” 一項(xiàng)國(guó)內(nèi)榜首,一個(gè)全球第一

評(píng)論