欧洲精品无码一区二区三区在线,AV片成人免费区,日韩精品岛国

在10月29日由中國電子工業(yè)標準化技術(shù)協(xié)會舉辦的數(shù)據(jù)存儲專業(yè)委員會（簡稱“數(shù)據(jù)存儲專委會”）成立大會上，匯聚了產(chǎn)業(yè)界代表、專委會成員及多位院士專家，共逾百人，共同探討了數(shù)據(jù)存儲產(chǎn)業(yè)的發(fā)展，并見證了數(shù)據(jù)存儲專業(yè)委員會的正式成立。會上，中國工程院院士、數(shù)據(jù)存儲專委會名譽會長鄭緯民發(fā)表了題為“AI存儲：人工智能大模型的基石”的主旨演講。

鄭緯民院士指出，人工智能進入大模型時代展現(xiàn)出兩大特征：一是基礎(chǔ)大模型邁入多模態(tài)時代，實現(xiàn)了從單一文本到圖片、視頻等多模態(tài)信息的綜合應(yīng)用；二是大模型已在金融、醫(yī)療、智能制造等多個領(lǐng)域得到實際應(yīng)用。

針對大模型的四個關(guān)鍵環(huán)節(jié)，鄭緯民院士詳細闡述了存儲在大模型訓(xùn)練和推理應(yīng)用中所面臨的挑戰(zhàn)及相關(guān)技術(shù)：

首先，數(shù)據(jù)獲取階段，大模型訓(xùn)練需要海量的原始數(shù)據(jù)，這些數(shù)據(jù)需被存儲設(shè)備妥善保存。隨著大模型從單模態(tài)向多模態(tài)發(fā)展，產(chǎn)生了數(shù)以百億計的小文件，這對文件系統(tǒng)的目錄擴展性、讀寫速度以及存儲的低延遲和高可擴展性提出了更高要求。

其次，數(shù)據(jù)預(yù)處理階段，由于原始數(shù)據(jù)質(zhì)量參差不齊，存在大量重復(fù)和低質(zhì)量數(shù)據(jù)，因此需要進行預(yù)處理以提升數(shù)據(jù)質(zhì)量。以ChatGPT4級別的大模型為例，其訓(xùn)練過程可能需要1萬塊A100顯卡耗時11個月，其中數(shù)據(jù)預(yù)處理可能占據(jù)一半以上的時間，這與數(shù)據(jù)存儲的性能密切相關(guān)。

再次，模型訓(xùn)練階段，大規(guī)模訓(xùn)練系統(tǒng)（如10萬塊顯卡組成的系統(tǒng)）的可靠性難以保證，頻繁出現(xiàn)故障，導(dǎo)致集群可用度低下。為了快速恢復(fù)訓(xùn)練，需要依賴高性能的存儲系統(tǒng)來快速讀取CheckPoint數(shù)據(jù)。華為與清華大學MADSys實驗室聯(lián)合開發(fā)的高性能AI存儲系統(tǒng)在此方面表現(xiàn)出色，曾在國際權(quán)威機構(gòu)MLPerf Storage基準評測中獲得第一名，性能密度是第二名的兩倍。

最后，模型推理階段，這是與AI應(yīng)用最直接相關(guān)的環(huán)節(jié)。更高效的人工智能需要處理更多數(shù)據(jù)、使用更大模型以及更長的上下文窗口，但這同時也帶來了極重的推理負載。模型參數(shù)以及推理過程中產(chǎn)生的KV-Cache需要巨大的存儲空間。為此，國內(nèi)優(yōu)秀的大模型應(yīng)用Kimi與清華大學MADSys實驗室共同推出了Mooncake分離式推理架構(gòu)，通過保存共享的KV-Cache，采用以存換算的策略大幅提升系統(tǒng)吞吐。

鄭緯民院士強調(diào)，模型推理過程是一個復(fù)雜的存儲系統(tǒng)工程，關(guān)鍵在于存儲容量大、傳輸速度快以及性價比高。清華大學MADSys實驗室聯(lián)合華為數(shù)據(jù)存儲、9#AISoft、阿里云、面壁、趨境等公司共同開發(fā)的高性能內(nèi)存型長記憶存儲系統(tǒng)即將開源發(fā)布，該系統(tǒng)能夠?qū)崿F(xiàn)大范圍全局共享與持久化KV-Cache，以存換算，共同構(gòu)建大模型時代下的高性能內(nèi)存型長記憶存儲系統(tǒng)生態(tài)。

最后，鄭緯民院士總結(jié)指出，AI存儲是人工智能大模型的基石，貫穿于大模型生命周期的每一個環(huán)節(jié)。通過以存強算、以存換算，先進的AI存儲能夠提升訓(xùn)練集群的可用度，降低推理成本，提升用戶體驗。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

存儲

存儲

+關(guān)注

關(guān)注
13

文章
4531

瀏覽量
87409
AI

AI

+關(guān)注

關(guān)注
88

文章
35065

瀏覽量
279294
人工智能

人工智能

+關(guān)注

關(guān)注
1806

文章
48996

瀏覽量
249187

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

鄭緯民院士:內(nèi)存型長記憶存儲以存換算是AI推理新趨勢

評論