作為業(yè)界唯一的基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型,訊飛星火X1迎來(lái)全新升級(jí)!
數(shù)學(xué)、代碼、邏輯推理、文本生成、語(yǔ)言理解、知識(shí)問(wèn)答等通用任務(wù)效果顯著提升,在模型參數(shù)比業(yè)界同類模型小一個(gè)數(shù)量級(jí)的情況下,整體效果對(duì)標(biāo)OpenAI o1和DeepSeek R1,再次證明了基于國(guó)產(chǎn)算力訓(xùn)練的全棧自主可控大模型具備登頂業(yè)界最高水平的實(shí)力和持續(xù)創(chuàng)新的潛力。
全新的訊飛星火X1還有哪些升級(jí)?
融入了更多場(chǎng)景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進(jìn)步,多個(gè)行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力,在重點(diǎn)行業(yè)如教育、醫(yī)療、司法等進(jìn)一步擴(kuò)大了領(lǐng)先優(yōu)勢(shì);
首發(fā)快思考、慢思考統(tǒng)一模型,由一個(gè)模型同時(shí)支持兩種思考模式,私有化部署簡(jiǎn)便;全新升級(jí)模型定制優(yōu)化工具鏈,支持SFT、強(qiáng)化學(xué)習(xí)兩種模型定制優(yōu)化方案,定制門檻低;
三大核心技術(shù)創(chuàng)新——大規(guī)模多階段強(qiáng)化學(xué)習(xí)訓(xùn)練方法、基于快慢思考的統(tǒng)一訓(xùn)練方法、工程技術(shù)系統(tǒng)創(chuàng)新保障基于國(guó)產(chǎn)算力的高效長(zhǎng)穩(wěn)訓(xùn)練,助力星火X1全面升級(jí)。
01首發(fā)快思考、慢思考統(tǒng)一模型
開放API與微調(diào)服務(wù)
本次升級(jí),首發(fā)快思考、慢思考統(tǒng)一模型,由一個(gè)模型同時(shí)支持兩種思考模式。同時(shí)在通用任務(wù)效果,星火X1實(shí)現(xiàn)顯著提升,整體效果對(duì)標(biāo)OpenAI o1和DeepSeek R1,在數(shù)學(xué)、知識(shí)問(wèn)答等方面表現(xiàn)突出。
測(cè)試集合來(lái)源:自建測(cè)試集主要來(lái)自真實(shí)的大模型請(qǐng)求任務(wù)數(shù)據(jù),來(lái)源分布包括訊飛星火APP、星火大模型API、業(yè)界主流任務(wù)數(shù)據(jù)等;公開測(cè)試集主要以數(shù)學(xué)、答題、推理、代碼等外部典型測(cè)試集為主。
從技術(shù)創(chuàng)新到應(yīng)用落地,滿血版星火X1僅需4張卡(華為910B)即可部署,實(shí)現(xiàn)簡(jiǎn)便與低成本的私有化部署。同時(shí),星火X1 API服務(wù)與模型微調(diào)服務(wù)也已全面開放,賦能廣大開發(fā)者和企業(yè):
API服務(wù)同步開放
星火APP升級(jí)X1深度推理大模型的同時(shí),星火X1 API同步全面開放,開發(fā)者伙伴可以無(wú)門檻快速集成星火APP同款X1深度推理大模型。
限時(shí)免費(fèi)一個(gè)月
為了讓廣大開發(fā)者伙伴能夠更加從容地探索深度推理大模型的創(chuàng)新應(yīng)用場(chǎng)景,星火X1 API限時(shí)免費(fèi)一個(gè)月(截止到5月21日24:00),即刻前往星火官網(wǎng)(https://xinghuo.xfyun.cn/sparkapi)調(diào)用API服務(wù)。
首發(fā)即支持模型微調(diào)
為滿足開發(fā)者和企業(yè)客戶多元的業(yè)務(wù)需求場(chǎng)景,星辰MaaS平臺(tái)(https://training.xfyun.cn/modelSquare)首發(fā)“星火X1微調(diào)服務(wù)”,讓開發(fā)者聚焦業(yè)務(wù)場(chǎng)景的價(jià)值創(chuàng)造,自由定制專屬深度推理模型。
02從專業(yè)難題到通用任務(wù)
星火X1都能從容應(yīng)答
語(yǔ)言理解能力提升:結(jié)合語(yǔ)境準(zhǔn)確理解文字語(yǔ)義
首先我們用博大精深的中國(guó)話,考驗(yàn)一下X1:
Prompt:如何理解“但丁真不會(huì)說(shuō)中國(guó)話,但丁真會(huì)說(shuō)中國(guó)話”
在思考過(guò)程中,我們能看到X1一眼識(shí)破這個(gè)“文字游戲”,然后進(jìn)行了準(zhǔn)確的人物拆分,最后在總結(jié)中還能精準(zhǔn)分析這個(gè)網(wǎng)絡(luò)梗的幽默之處。
文本生成能力提升:輸出內(nèi)容、格式更加符合用戶指令要求
文字游戲根本難不倒X1,再來(lái)試試對(duì)文字能力要求很高的駢文寫作:
Prompt:模仿《滕王閣序》寫篇駢文,描寫內(nèi)容是登上安徽黃山看到雄奇壯美的景色之后,表達(dá)對(duì)安徽這片熱土的熱愛以及對(duì)祖國(guó)的驕傲自豪
X1不僅嚴(yán)格按照駢文的文體瞬間模仿成文,且對(duì)安徽的人文歷史、科技發(fā)展等描述言之有物。從中可以看到,X1在風(fēng)格化遷移、創(chuàng)意寫作上已經(jīng)具備了相當(dāng)出色的水準(zhǔn)。
數(shù)學(xué)答題能力提升:可完成復(fù)雜的數(shù)理邏輯推理
上傳一道大學(xué)數(shù)學(xué)競(jìng)賽水平的四棱錐隨機(jī)游走概率問(wèn)題,X1準(zhǔn)確識(shí)別,并給出了嚴(yán)謹(jǐn)清晰的解題步驟和正確答案。
代碼能力提升:代碼生成準(zhǔn)確率提升顯著,復(fù)雜邏輯處理能力同步增強(qiáng)
Prompt:用Python幫我畫一個(gè)小球在正方形里不斷運(yùn)動(dòng),小球每撞一次正方形的四邊,小球的顏色就會(huì)變化并且速度加快10%,如此反復(fù)下去
根據(jù)用戶游戲規(guī)則的需求描述,X1快速且準(zhǔn)確地通過(guò)Pygame庫(kù)編寫功能代碼,并且將代碼復(fù)制到IDE可直接運(yùn)行,最終實(shí)現(xiàn)效果精準(zhǔn)滿足用戶要求。同理,我們可以讓X1一鍵生成代碼,實(shí)現(xiàn)簡(jiǎn)單的登錄界面、動(dòng)態(tài)卡片、小游戲等交互效果,提升開發(fā)效率。
支持多模推理能力:可針對(duì)圖片、音視頻進(jìn)行深度推理問(wèn)答,以及多張圖像的關(guān)聯(lián)思考
Prompt:把圖上這些不同的蔬菜按照切法進(jìn)行分類,并且告訴我每一類的蔬菜怎么切是最方便和適合烹飪的
X1不僅準(zhǔn)確識(shí)別出了蔬菜名稱,還條理分明地按照塊狀、片狀、絲狀、丁狀、段狀等給出了切法和烹飪建議,眼力和實(shí)用性拉滿。
行業(yè)任務(wù)表現(xiàn)取得進(jìn)步:在教育、醫(yī)療、司法等重點(diǎn)行業(yè)進(jìn)一步擴(kuò)大領(lǐng)先優(yōu)勢(shì)
星火X1除了在常見通用任務(wù)取得顯著進(jìn)步之外,由于融入了更多場(chǎng)景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進(jìn)步,多個(gè)行業(yè)任務(wù)上展現(xiàn)出了業(yè)界領(lǐng)先的能力,在重點(diǎn)行業(yè)如教育、醫(yī)療、司法等進(jìn)一步擴(kuò)大了領(lǐng)先優(yōu)勢(shì)。
03星火APP極簡(jiǎn)版發(fā)布
沉浸式「深度推理」
依托全新的X1深度推理大模型,星火App正式推出極簡(jiǎn)版本,并完成功能升級(jí)——支持深度推理、聯(lián)網(wǎng)搜索。在煥新的極簡(jiǎn)交互界面,打造沉浸式的“解題”過(guò)程,完整展示大模型的所思所想,生成更全面的回答。
正如X1的升級(jí)統(tǒng)一了快思考和慢思考,本次升級(jí)兼容了極簡(jiǎn)深邃與精專多能兩種風(fēng)格。對(duì)于“追求功能全面”的用戶,支持一鍵切換至專業(yè)版,解鎖智能體、語(yǔ)音暢聊、個(gè)人知識(shí)管理等豐富功能,實(shí)現(xiàn)快速信息獲取與慢思考深度創(chuàng)作無(wú)縫切換。
在訊飛星火網(wǎng)頁(yè)端,同樣可以體驗(yàn)深度推理和聯(lián)網(wǎng)搜索在通用任務(wù)上的全新效果。也歡迎大家登錄星火APP/網(wǎng)頁(yè)端,一起探索星火X1的更多充滿想象力的用法和玩法。
04三大技術(shù)創(chuàng)新
X1突破全國(guó)產(chǎn)算力模型天花板
用戶體驗(yàn)升級(jí)的背后,根植于星火X1的三大技術(shù)創(chuàng)新:
大規(guī)模多階段強(qiáng)化學(xué)習(xí)訓(xùn)練方法:
提出基于問(wèn)題難度的大規(guī)模多階段強(qiáng)化學(xué)習(xí)方法,在復(fù)雜推理、數(shù)學(xué)、代碼、語(yǔ)言理解等場(chǎng)景全面提升模型效果及泛化性;同時(shí)提出強(qiáng)化學(xué)習(xí)動(dòng)態(tài)更新算法,基于樣本采樣長(zhǎng)度動(dòng)態(tài)調(diào)整強(qiáng)化學(xué)習(xí)更新速度,進(jìn)一步提升深度思考強(qiáng)化學(xué)習(xí)效率及效果。
基于快慢思考的統(tǒng)一訓(xùn)練方法:
提出統(tǒng)一模型下快慢思考混合訓(xùn)練方法,充分發(fā)揮快慢思考數(shù)據(jù)相互促進(jìn)作用,實(shí)現(xiàn)基于系統(tǒng)指令控制模型是否深度思考,支撐下游更高效便捷的部署使用。
工程技術(shù)系統(tǒng)創(chuàng)新保障基于國(guó)產(chǎn)算力的高效長(zhǎng)穩(wěn)訓(xùn)練:
實(shí)現(xiàn)多項(xiàng)工程技術(shù)創(chuàng)新,顯存動(dòng)態(tài)卸載技術(shù)大幅提升長(zhǎng)文本推理并發(fā)、訓(xùn)推共卡協(xié)同實(shí)現(xiàn)高效訓(xùn)推資源轉(zhuǎn)換、推理引擎冬眠機(jī)制實(shí)現(xiàn)快速拉起和恢復(fù),實(shí)現(xiàn)國(guó)產(chǎn)算力平臺(tái)上高效和穩(wěn)定的強(qiáng)化學(xué)習(xí)訓(xùn)練全流程。
堅(jiān)持自主可控的算力底座,訊飛星火X1持續(xù)升級(jí)
以規(guī)模化應(yīng)用落地,助力千行百業(yè)共享智能紅利
-
科大訊飛
+關(guān)注
關(guān)注
19文章
833瀏覽量
62049 -
算力
+關(guān)注
關(guān)注
1文章
1103瀏覽量
15355 -
大模型
+關(guān)注
關(guān)注
2文章
2941瀏覽量
3683
原文標(biāo)題:星火X1全新升級(jí)!首個(gè)全國(guó)產(chǎn)通用深度推理大模型
文章出處:【微信號(hào):訊飛開放平臺(tái),微信公眾號(hào):訊飛開放平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論