來源:聚大模型前言
在 Hot Chips 2024 上,IBM 宣布了其下一代大型機(jī)技術(shù),其中包括 Telum II 處理器和 Spyre AI 加速器。這兩款產(chǎn)品將顯著提高 IBM Z 系統(tǒng)上的 AI 功能,滿足企業(yè)對(duì)高效、安全和可擴(kuò)展 AI 解決方案的需求。
IBM Telum II 處理器是 IBM z16 的核心,集成了深度學(xué)習(xí)推理能力,通過硬件直接集成了 AI 加速功能,企業(yè)在無需額外硬件的情況下,即可實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)分析和決策制定。Telum II 處理器的 AI 加速計(jì)算能力比上代 Telum 處理器提升四倍,并且通過一致性連接的處理集群,進(jìn)一步提升了性能。
Telum II 處理器通過增加 L2、L3 和 L4 緩存的大小,緩存容量較上代增加了 40%,顯著改善了芯片外帶寬和延遲性能。此外,Telum II 處理器的時(shí)鐘頻率達(dá)到 5.5 GHz ,可以提供更快的處理速度。Telum II 還增加了用于 I/O 加速的新數(shù)據(jù)處理單元 (DPU)。該單元可以提高數(shù)據(jù)處理效率,I/O 密度提高 50%。DPU 可以簡(jiǎn)化系統(tǒng)操作并提高數(shù)據(jù)密集型應(yīng)用程序和人工智能工作負(fù)載的性能。
安全性方面,Telum II 處理器支持包括量子安全加密在內(nèi)的高級(jí)加密技術(shù)。此外,Telum II 處理器在 A 和 Z 總線鏈接上提供了改進(jìn)的安全性能,進(jìn)一步保護(hù)了企業(yè)的數(shù)據(jù)安全。能效方面, Telum II 處理器通過優(yōu)化功率消耗,有效降低了 IBM z16 的能源消耗?;诩惺?IO 和 DPU 設(shè)計(jì),Telum II 降低了高達(dá) 15% 的核心功率,進(jìn)一步提高了能源效率。
與 Telum II 處理器一同推出的還有 IBM Spyre AI 加速器。Spyre 加速器擁有 32 個(gè)獨(dú)立的加速器核心,并且包含 25.6 億個(gè)晶體管,支持 int4、int8、fp8 和 fp16 數(shù)據(jù)類型,使用 5 納米工藝生產(chǎn)。每個(gè) Spyre 加速器都安裝在 PCIe 卡上,這些卡可以集群化,為單個(gè) IBM Z 系統(tǒng)增加大量的加速器核心。
Spyre 加速器支持在本地進(jìn)行生成式 AI 和模型微調(diào),使 IBM Z 系統(tǒng)能夠處理更復(fù)雜的 AI 工作負(fù)載。Spyre 加速器的架構(gòu)可以直接將數(shù)據(jù)從一個(gè)計(jì)算引擎發(fā)送到下一個(gè),從而節(jié)省了能源。此外,Spyre 加速器使用一系列較低精度的數(shù)值格式,如 int4 和 int8,這使得運(yùn)行 AI 模型更加節(jié)能且對(duì)內(nèi)存的需求更少。
Telum II 處理器和 Spyre AI 加速器的結(jié)合,企業(yè)用戶能夠直接在 Z 平臺(tái)上安全高效地運(yùn)行人工智能應(yīng)用程序。Telum II 可以處理大規(guī)模 AI 工作負(fù)載和數(shù)據(jù)密集型業(yè)務(wù)需求,而 Spyre 加速器可以處理復(fù)雜的 AI 模型和生成式 AI 用例,所有這些都不會(huì)影響 IBM Z 環(huán)境的安全性和可靠性。
Telum II處理器和Spyre加速器都將采用三星代工廠的5納米工藝技術(shù)制造。預(yù)計(jì)這些產(chǎn)品將于 2025 年向客戶提供。
【近期會(huì)議】
10月30-31日,由寬禁帶半導(dǎo)體國(guó)家工程研究中心主辦的“化合物半導(dǎo)體先進(jìn)技術(shù)及應(yīng)用大會(huì)”將首次與大家在江蘇·常州相見,邀您齊聚常州新城希爾頓酒店,解耦產(chǎn)業(yè)鏈?zhǔn)袌?chǎng)布局!https://w.lwc.cn/s/uueAru
11月28-29日,“第二屆半導(dǎo)體先進(jìn)封測(cè)產(chǎn)業(yè)技術(shù)創(chuàng)新大會(huì)”將再次與各位相見于廈門,秉承“延續(xù)去年,創(chuàng)新今年”的思想,仍將由云天半導(dǎo)體與廈門大學(xué)聯(lián)合主辦,雅時(shí)國(guó)際商訊承辦,邀您齊聚廈門·海滄融信華邑酒店共探行業(yè)發(fā)展!誠(chéng)邀您報(bào)名參會(huì):https://w.lwc.cn/s/n6FFne
聲明:本網(wǎng)站部分文章轉(zhuǎn)載自網(wǎng)絡(luò),轉(zhuǎn)發(fā)僅為更大范圍傳播。 轉(zhuǎn)載文章版權(quán)歸原作者所有,如有異議,請(qǐng)聯(lián)系我們修改或刪除。聯(lián)系郵箱:viviz@actintl.com.hk, 電話:0755-25988573
審核編輯 黃宇
-
處理器
+關(guān)注
關(guān)注
68文章
19896瀏覽量
235279 -
IBM
+關(guān)注
關(guān)注
3文章
1823瀏覽量
75833 -
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
280008 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249570
發(fā)布評(píng)論請(qǐng)先 登錄
開售RK3576 高性能人工智能主板
TPU處理器的特性和工作原理

IBM推出新一代大型主機(jī)IBM z17
支持實(shí)時(shí)物體識(shí)別的視覺人工智能微處理器RZ/V2MA數(shù)據(jù)手冊(cè)

端側(cè) AI 音頻處理器:集成音頻處理與 AI 計(jì)算能力的創(chuàng)新芯片
Banana Pi 攜手 ArmSoM 推出人工智能加速 RK3576 CM5 計(jì)算模塊
IBM與AMD攜手部署MI300X加速器,強(qiáng)化AI與HPC能力
IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器
微軟攜手英偉達(dá)與GitHub推出生成式AI加速器
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
Samtec AI 應(yīng)用詳述 | 人工智能加速器所需的連接器

評(píng)論