商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標GPT-4 Turbo
4月23日,商湯科技董事長兼CEO徐立在2024商湯技術交流日上發(fā)布了行業(yè)首個云、端、邊全棧大模型產品矩陣,能夠滿足不同規(guī)模場景應用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。
此外對于文生視頻徐立也表示商湯科技很快就會發(fā)布相關的平臺產品。
備受矚目的商湯科技“日日新SenseNova” 5.0多模態(tài)大模型獨特地采用了混合專家(MoE)架構,能夠無縫支持多達10T Tokens的中英文訓練數(shù)據,并在此基礎上,推理合成數(shù)據更是可高達數(shù)千億Token。尤為值得一提的是,該模型在進行推理計算時,其上下文窗口可以擴展至約200K Token范圍,使得其綜合能力中的知識、推理、數(shù)學、代碼等方面均能全面對標GPT-4Turbo。
商湯科技的領導團隊表示,這是業(yè)界首個真正意義上的“云、端、邊”全棧大模型產品矩陣,旨在滿足各種規(guī)模場景的應用需求。他們堅信,公司的技術領先地位將進一步加速生成式AI向產業(yè)落地的全面躍遷,從而實現(xiàn)大模型的按需所取。
商湯科技的董事長兼首席執(zhí)行官徐立先生表示,在遵循尺度定律(Scaling Law)的原則下,商湯科技始終致力于推動自身大模型的研發(fā)工作,并將持續(xù)探索大模型能力的KRE三層架構(知識-推理-執(zhí)行),不斷突破大模型能力的邊界。他充滿信心地指出,“我們深信,2024年將會是端側大模型爆發(fā)的重要年份。”
據了解,自去年4月首次亮相以來,商湯科技的“日日新SenseNova”大模型體系已經成功推出了五個重大版本迭代。而此次的更新重點則集中在提升了知識、數(shù)學、推理以及代碼能力等多個方面,全面對標GPT-4 Turbo,并在主流客觀評測中達到甚至超過了GPT-4 Turbo的水平。
-
商湯科技
+關注
關注
8文章
564瀏覽量
36803 -
大模型
+關注
關注
2文章
3147瀏覽量
4079
發(fā)布評論請先 登錄
商湯日日新SenseNova融合模態(tài)大模型 國內首家獲得最高評級的大模型
商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單
如何在邊緣端獲得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

商湯科技推出“日日新”融合大模型
商湯日日新多模態(tài)大模型權威評測第一
商湯星云發(fā)布新一代智能服務器AIS 4.0
訊飛星火大模型4.0 Turbo正式發(fā)布
Llama 3 與 GPT-4 比較
科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo
訊飛星火內容運營大師新增三大功能
商湯Sensechat向香港用戶免費開放
云知聲推出山海多模態(tài)大模型
商湯絕影在行業(yè)率先實現(xiàn)原生多模態(tài)大模型的車端部署

評論