富士通使用富岳超級計算機訓(xùn)練LLM

盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器，但它仍然是一個非常強大的系統(tǒng)，A64FX處理器的多功能性允許將其用于各種工作負載，例如AI。本周，富士通發(fā)布了Fugaku-LLM，這是一個具有高級日語處理能力的大型語言模型，專為研究和商業(yè)應(yīng)用而設(shè)計。

富士通的Fugaku-LLM在富岳超級計算機的13,824個節(jié)點上使用3800億個符記進行訓(xùn)練，該超級計算機基于A64FX處理器，支持FP64、FP32、FP16和INT8模式，適用于各種AI和傳統(tǒng)超級計算機應(yīng)用。Fugaku-LLM的訓(xùn)練利用了針對超級計算機架構(gòu)和互連優(yōu)化的分布式并行學(xué)習(xí)技術(shù)。

Fugaku-LLM 有 130 億個參數(shù)，與 GPT-4 的 1750 億個參數(shù)相比顯得蒼白無力，不過，F(xiàn)ugaku-LLM是日本有史以來訓(xùn)練量的最大 LLM。富士通表示，其130億參數(shù)的LLM不需要大量的計算資源來推理，這對日本的企業(yè)和研究人員來說是最佳選擇。大約 60% 的訓(xùn)練數(shù)據(jù)是日語，40% 的數(shù)據(jù)是英語、數(shù)學(xué)和代碼數(shù)據(jù)。

這種廣泛的以日語為中心的訓(xùn)練使其有別于其它主要在英語數(shù)據(jù)集上訓(xùn)練的日語模型。因此，F(xiàn)ugaku-LLM擁有卓越的日語水平，在日語MT-Bench上獲得了5.5的平均分，這是使用日本原始數(shù)據(jù)訓(xùn)練的公開可用模型中的最高分。根據(jù)富士通的數(shù)據(jù)，它在人文和社會科學(xué)方面尤其出色，取得了令人印象深刻的 9.18 分的基準分數(shù)。

Fugaku-LLM計劃是由東京工業(yè)大學(xué)、東北大學(xué)、富士通株式會社、RIKEN、名古屋大學(xué)、CyberAgent和Kotoba Technologies等日本領(lǐng)先機構(gòu)之間的合作推動的。他們合作的原因之一是通常用于訓(xùn)練和推理 AI 模型的 GPU 短缺。另一個原因是，該模型可以與富士通的下一代 150 核 Monaka 數(shù)據(jù)中心 CPU 一起使用，該 CPU 針對 AI 和 HPC 工作負載進行了優(yōu)化。

Fugaku-LLM現(xiàn)在可以在GitHub和Hugging Face的指定許可條款下用于學(xué)術(shù)和商業(yè)目的（盡管富士通沒有提供任何鏈接）。此外，它從2024年5月10日起通過富士通研究門戶網(wǎng)站提供。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19896

瀏覽量
235348
超級計算機

超級計算機

+關(guān)注

關(guān)注
2

文章
472

瀏覽量
42481
富士通

富士通

+關(guān)注

關(guān)注
2

文章
203

瀏覽量
55247
LLM

LLM

+關(guān)注

關(guān)注
1

文章
325

瀏覽量
847

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

富士通使用富岳超級計算機訓(xùn)練LLM

評論