作為當前業(yè)界唯一的基于全國產算力訓練的深度推理大模型,訊飛星火X1全新升級啦!
本次升級有這些關鍵信息
實現(xiàn)了數(shù)學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務效果顯著提升,在模型參數(shù)比業(yè)界同類模型小一個數(shù)量級的情況下,整體效果對標OpenAI o1和DeepSeek R1,再次證明了基于國產算力訓練的全棧自主可控大模型具備登頂業(yè)界最高水平的實力和持續(xù)創(chuàng)新的潛力。
融入了更多場景復雜類型數(shù)據(jù),模型的泛化性也取得了進步,多個行業(yè)任務上展現(xiàn)出了業(yè)界領先的能力,在重點行業(yè)如教育、醫(yī)療、司法等進一步擴大了領先優(yōu)勢。
首發(fā)快思考、慢思考統(tǒng)一模型,由一個模型同時支持兩種思考模式,私有化部署簡便;全新升級模型定制優(yōu)化工具鏈,支持SFT、強化學習兩種模型定制優(yōu)化方案,定制門檻低。
三大核心技術創(chuàng)新——大規(guī)模多階段強化學習訓練方法、基于快慢思考的統(tǒng)一訓練方法、工程技術系統(tǒng)創(chuàng)新保障基于國產算力的高效長穩(wěn)訓練,助力星火X1全面升級。
星火X1 API已同步上線訊飛開放平臺,面向廣大開發(fā)者和企業(yè)開放服務。
快來看看本次升級的精彩細節(jié)吧!
此次星火X1升級,在多個任務上效果繼續(xù)突破,展現(xiàn)出優(yōu)異的性能。根據(jù)最新測試集評測結果,星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,在數(shù)學、知識問答等方面表現(xiàn)突出。
測試集合來源:自建測試集主要來自真實的大模型請求任務數(shù)據(jù),來源分布包括訊飛星火APP、星火大模型API、業(yè)界主流任務數(shù)據(jù)等;公開測試集主要以數(shù)學、答題、推理、代碼等外部典型測試集為主。
升級后的星火X1表現(xiàn)怎么樣?上題,開測!
先來看一道數(shù)學題
星火X1準確識別出復雜的數(shù)學公式,不僅給出完整解題思路,輸出結果也嚴謹清晰。
再來看一道邏輯推理題
星火X1全方位思考,給出每一種可能的假設,對所有可能性清晰謹慎地探討。
接下來試試代碼題
面對復雜的代碼需求,星火X1縝密思考,代碼生成的準確率up!代碼能力up!
來考考星火X1的語言理解能力
在語言理解方面,星火X1在輸出內容、格式等方面更加符合用戶指令要求,結果既連貫又準確。
星火X1的長思維鏈能力還支持圖像輸入
星火X1接收到圖像后,立刻開始對輸入的圖像進行關聯(lián)思考,輕松“拿捏”并給出結果。
無論是數(shù)學解題,還是圖片理解,升級后的星火X1都能給出嚴謹、專業(yè)、準確的回答,展示完整、清晰的推理過程,讓大家更能直觀清楚地理解星火X1的思考過程。
星火X1除了在常見通用任務取得顯著進步之外,由于融入了更多場景復雜類型數(shù)據(jù),模型的泛化性也取得了進步,多個行業(yè)任務上展現(xiàn)出了業(yè)界領先的能力,在重點行業(yè)如教育、醫(yī)療、司法等進一步擴大了領先優(yōu)勢。
以司法行業(yè)為例
針對司法行業(yè)中的專業(yè)需求,例如根據(jù)材料總結案件事實以及判決理由,升級后的星火X1關注用戶指令需求,詳細分析案件爭議點,快速定位材料中的關鍵信息,準確輸出內容。
為了讓更多企業(yè)能夠便捷用上AI,本次升級的星火X1為企業(yè)AI落地提供了雙重支持:
首發(fā)快思考、慢思考統(tǒng)一模型,由一個模型同時支持兩種思考模式,4張卡(華為910B)即可部署滿血版星火X1,私有化部署簡便。
全新升級模型定制優(yōu)化工具鏈,支持SFT、強化學習兩種模型定制優(yōu)化方案,16張卡(華為910B)即可完成行業(yè)定制優(yōu)化,定制門檻低。
星火X1此次全新升級,背后有三大技術創(chuàng)新:
大規(guī)模多階段強化學習訓練方法:提出基于問題難度的大規(guī)模多階段強化學習方法,在復雜推理、數(shù)學、代碼、語言理解等場景全面提升模型效果及泛化性;同時提出強化學習動態(tài)更新算法,基于樣本采樣長度動態(tài)調整強化學習更新速度,進一步提升深度思考強化學習效率及效果。
基于快慢思考的統(tǒng)一訓練方法:提出統(tǒng)一模型下快慢思考混合訓練方法,充分發(fā)揮快慢思考數(shù)據(jù)相互促進作用,實現(xiàn)基于系統(tǒng)指令控制模型是否深度思考,支撐下游更高效便捷地部署使用。
工程技術系統(tǒng)創(chuàng)新保障基于國產算力的高效長穩(wěn)訓練:實現(xiàn)多項工程技術創(chuàng)新,顯存動態(tài)卸載技術大幅提升長文本推理并發(fā)、訓推共卡協(xié)同實現(xiàn)高效訓推資源轉換、推理
引擎冬眠機制實現(xiàn)快速拉起和恢復,實現(xiàn)國產算力平臺上高效和穩(wěn)定的強化學習訓練全流程。
現(xiàn)在,打開訊飛星火網(wǎng)頁端或訊飛星火APP,即可體驗在通用任務上深度推理和聯(lián)網(wǎng)搜索的全新效果。
同時,星火X1 API也已同步上線訊飛開放平臺,面向廣大開發(fā)者和企業(yè)開放服務。
星火X1作為首個支持全國產算力的推理大模型,目前微調服務已上線訊飛星辰MaaS平臺。
即刻體驗星火X1 API,快來試試吧!
星火X1本次升級后的更多用法,等你探索與分享。
-
科大訊飛
+關注
關注
19文章
833瀏覽量
62049 -
大模型
+關注
關注
2文章
2941瀏覽量
3683 -
DeepSeek
+關注
關注
1文章
755瀏覽量
1045
原文標題:來了!訊飛星火X1全新升級
文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論