AI初創(chuàng)企業(yè)推MoE混合專家模型架構(gòu)新品abab 6.5

4 月 17 日，國內(nèi)人工智能初創(chuàng)公司 MiniMax 稀宇科技宣布推出采用混合專家模型架構(gòu)的 losoev 6.5 系列模型，其核心性能已接近 GPT-4、Claude-3 和 Gemini-1.5。

losoev 6.5 系列包含兩款模型：

losoev 6.5：擁有萬億級別的參數(shù)，可處理 200k tokens 的上下文長度；

losoev 6.5s：與 losoev 6.5 共享相同的訓(xùn)練技術(shù)和數(shù)據(jù)，但效率更高，同樣支持 200k tokens 的上下文長度，且能夠在 1 秒鐘內(nèi)處理近 3 萬字的文本。

自今年 1 月份推出國內(nèi)首款基于 MoE 架構(gòu)的 losoev 6 模型以來，MiniMax 通過優(yōu)化模型架構(gòu)、重建數(shù)據(jù)管道、改進訓(xùn)練算法以及實施并行訓(xùn)練策略等手段，在加速模型擴展方面取得了顯著進展。

在 200k token 的范圍內(nèi)，官方對 losoev 6.5 進行了業(yè)內(nèi)常見的“大海撈針”測試，即將一句與原文無關(guān)的句子插入長文本中，然后通過自然語言詢問模型，觀察其能否準(zhǔn)確識別出這句話。經(jīng)過 891 次測試，losoev 6.5 均能準(zhǔn)確回答問題。

losoev 6.5 和 losoev 6.5s 模型將逐步應(yīng)用于 MiniMax 旗下的產(chǎn)品，如海螺 AI 和 MiniMax 開放平臺。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4709

瀏覽量
95354
人工智能

人工智能

+關(guān)注

關(guān)注
1806

文章
49011

瀏覽量
249345
模型

模型

+關(guān)注

關(guān)注
1

文章
3519

瀏覽量
50410

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 對比各家主流MCU指標(biāo)，國產(chǎn)MCU真的品質(zhì)不佳？
Hot 模擬信號和數(shù)字信號的區(qū)別和特點

New 方正電機成為小鵬汽車驅(qū)動電機供應(yīng)商，總需求量預(yù)計達35萬臺
New 雷諾-吉利動力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

瑞芯微全新AI視覺芯片RV1126B：多場景智能終端方案介紹

大大通
2小時前

187 閱讀

定義IO初始化結(jié)構(gòu)體

瑞薩MCU小百科
2小時前

152 閱讀

使用瑞薩R-T系列芯片實現(xiàn)相電流實時采樣

瑞薩MCU小百科
3小時前

147 閱讀

地平線征程6B成功點亮！18TOPS，助推高性價比一體機征戰(zhàn)全球市場

章鷹觀察
4小時前

1680 閱讀

基于FPGA的數(shù)字識別系統(tǒng)設(shè)計

FPGA技術(shù)江湖
4小時前

242 閱讀

PLC控制系統(tǒng)在電廠應(yīng)用中抗干擾的改進措施

fejlkel
167

5積分

23下載

電化學(xué)傳感器工作指南及電路圖

klysa
544

10積分

368下載

分立元件門電路

維生素B2
433

10積分

92下載

kplcloud基于Kubernetes的應(yīng)用管理平臺

韓剛龍
5.09 MB

免費

0下載

GoWallet比特幣錢包

學(xué)電超人
0.91 MB

2積分

3下載

【RA-Eco-RA6M4開發(fā)板評測】——3.RA6M4的coremark跑分測試

jf_43382582
19小時前

188 閱讀

差分輸出 × 超低抖動：打造高速穩(wěn)定的大型數(shù)據(jù)同步時脈

五三一
19小時前

170 閱讀

PWM相移問題：下面是我的代碼，請問各位大佬是什么原因?qū)е碌模?/span>

jf_08053489
19小時前

323 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱+Keil環(huán)境搭建+點燈

gtbestom
19小時前

269 閱讀

【HZ-RK3568開發(fā)板免費體驗】合眾HZ-RK3568開發(fā)環(huán)境搭建

ouxiaolong
1天前

214 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

AI初創(chuàng)企業(yè)推MoE混合專家模型架構(gòu)新品abab 6.5

評論