一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm宣布將會(huì)采用Bfloat16數(shù)據(jù)類型,這種數(shù)據(jù)類型會(huì)成為主流嗎?

倩倩 ? 來源:lq ? 作者:雷鋒網(wǎng) ? 2019-09-20 10:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了提升AI性能,AI芯片公司從多個(gè)方面進(jìn)行優(yōu)化,包括采用更先進(jìn)的工藝制程、進(jìn)行架構(gòu)創(chuàng)新,數(shù)據(jù)類型的支持也是其中之一。如今,為了加速機(jī)器學(xué)習(xí)性能,Arm宣布將會(huì)采用Bfloat16數(shù)據(jù)類型,這種數(shù)據(jù)類型會(huì)成為主流嗎?

Arm Holdings宣布其ArmV8-A架構(gòu)的下一版本將支持bfloat16,這種浮點(diǎn)格式越來越多地用于加速機(jī)器學(xué)習(xí)應(yīng)用。如今,谷歌、英特爾和少數(shù)初創(chuàng)公司的芯片都選擇了支持bfloat16。

Bfloat16,又名16位腦浮點(diǎn)(brain floating point),由Google發(fā)明,最初在其第三代Tensor處理單元(TPU)中支持。英特爾認(rèn)可以將bfloat16整合到其未來的“Cooper Lake”Xeon SP處理器,以及即將推出的“Spring Crest”神經(jīng)網(wǎng)絡(luò)處理器中。Wave Computing、Habana Labs和Flex Logix也采用了定制的AI處理器。

bfloat16的主要思想是提供16位浮點(diǎn)格式,其動(dòng)態(tài)范圍與標(biāo)準(zhǔn)IEEE-FP32相同,但精度較低。相當(dāng)于指數(shù)區(qū)和FP32保持了相同的8位,并將FP32分?jǐn)?shù)字段的小數(shù)區(qū)縮減到到了7位。

根據(jù)Arm的ISA架構(gòu)師和Fellow Nigel Stephens的說法,大多數(shù)情況下,用戶在進(jìn)行神經(jīng)網(wǎng)絡(luò)計(jì)算時(shí),bfloat16格式與FP32一樣準(zhǔn)確,但是以一半的位數(shù)完成任務(wù)。因此,與32位相比,采用bfloat16吞吐量可以翻倍,內(nèi)存需求可以減半。在大多數(shù)情況下,blfloat16可以成為這些機(jī)器學(xué)習(xí)算法中FP32的“插入式”替代品?!靶疫\(yùn)的是,神經(jīng)網(wǎng)絡(luò)由于其統(tǒng)計(jì)性質(zhì),只要數(shù)據(jù)類型具有足夠的范圍和精度,就可以很好地適應(yīng)少量噪聲,” Stephens告訴我們。

在Arm,附加支持將適用于ArmV8-A下支持的所有浮點(diǎn)指令集,即SVE(可擴(kuò)展矢量擴(kuò)展),AArch64 Neon(64位SIMD)和AArch32 Neon(32位SIMD))。附加支持旨在用于基于Arm的終端和服務(wù)器的機(jī)器學(xué)習(xí)推理和訓(xùn)練。雖然Arm服務(wù)器的規(guī)模仍然很小,但其終端市場規(guī)模巨大,這意味著未來的手持式和物聯(lián)網(wǎng)設(shè)備將很快能夠利用更緊湊的數(shù)字格式。

Stephens 8月份撰寫的一篇博客中寫到,將增加四條新指令來支持bfoat16值的乘法運(yùn)算,這是用于訓(xùn)練和推理神經(jīng)網(wǎng)絡(luò)的最常用計(jì)算。據(jù)他介紹,在大多數(shù)情況下,應(yīng)用程序開發(fā)人員不會(huì)在底層代碼中添加這些指令,因?yàn)檫@些支持很可能由Arm自己的機(jī)器學(xué)習(xí)庫提供。對(duì)于那些對(duì)細(xì)節(jié)感興趣的人來說,這四條新指令如下:

BFDOT 是BF16元素的[1×2]×[2×1]點(diǎn)積,累積到SIMD結(jié)果中的每個(gè)IEEE-FP32元素中。

BFMMLA, 包括兩個(gè)有效地 BFDOT 操作,執(zhí)行BF16元素的[2×4]×[4×2]矩陣乘法,累積到SIMD結(jié)果內(nèi)的每個(gè)[2×2]矩陣的IEEE-FP32元素中。

BFMLAL是偶數(shù)或奇數(shù)BF16元素的簡單乘積,累積到SIMD結(jié)果中的每個(gè)IEEE-FP32元素中。

BFCVT,將IEEE-FP32元素或標(biāo)量值轉(zhuǎn)換為BF16格式。

在SVE中包含對(duì)bfloat16的支持特別有趣,因?yàn)檫@些向量指令是專門為高性能計(jì)算開發(fā)的。截至目前,唯一已知的實(shí)現(xiàn)SVE是富士通的A64FX芯片,這款處理器將為即將推出的Post-K超級(jí)計(jì)算機(jī)提供動(dòng)力,該超級(jí)計(jì)算機(jī)現(xiàn)在名為Fugaku。但這還為時(shí)過早,無法獲得bfloat16的好處,但后來的那些,就像為歐洲處理器計(jì)劃(EPI)開發(fā)的Arm處理器肯定會(huì)包含它。

Stephens說,鑒于傳統(tǒng)HPC用戶對(duì)機(jī)器學(xué)習(xí)的興趣增加以及他們的高性能系統(tǒng)對(duì)訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)的適應(yīng)性,在SVE中包含bfloat16似乎是一種自然的補(bǔ)充。他還指出,有一些HPC研究人員正在調(diào)查使用新的16位格式來加速傳統(tǒng)科學(xué)應(yīng)用的混合精度計(jì)算。

“再次強(qiáng)調(diào),bfloat16的優(yōu)勢在于它具有與FP32相同的動(dòng)態(tài)范圍,這使得使用FP 32的代碼,在轉(zhuǎn)換的早期階段使用bfloat16更容易?!彼忉屨f。

并且由于SVE可以針對(duì)不同的向量長度,實(shí)現(xiàn)從128位到2048位,理論上bfloat16吞吐量應(yīng)該相應(yīng)于128位Neon實(shí)現(xiàn)進(jìn)行擴(kuò)展。但實(shí)際上,Stephens說吞吐量還取決于具體的硬件實(shí)現(xiàn)選擇,例如SVE執(zhí)行單元的數(shù)量與給定實(shí)現(xiàn)的Neon執(zhí)行單元的數(shù)量。

然而,當(dāng)轉(zhuǎn)換為具有較小范圍的數(shù)據(jù)類型(例如INT8和FP16)時(shí),基于blfoat16的網(wǎng)絡(luò)的易部署性與其最終大小和性能之間存在折衷。Stephens表示,使用blfoat16進(jìn)行推理可能對(duì)那些無法承擔(dān)額外費(fèi)用和重新訓(xùn)練網(wǎng)絡(luò)的開發(fā)人員來說是有吸引力的,因?yàn)橹挥幸环N類型可用于訓(xùn)練和推理,因此可以使用這些較小的類型(可能需要幾個(gè)月)。

另外,需要注意的是bfloat16類型沒有標(biāo)準(zhǔn),因此無法保證相同計(jì)算的結(jié)果在不同的處理器上完全相同。但正如Stephens所指出的那樣,F(xiàn)P32關(guān)于如何對(duì)點(diǎn)積進(jìn)行排序(IEEE保持開放排序),甚至存在可變性。無論如何,四舍五入的噪音幾乎總是可以接受的,因?yàn)檎缢沟俜宜顾f,機(jī)器學(xué)習(xí)是一種統(tǒng)計(jì)游戲。

Arm對(duì)bfloat16的支持,使得GPU(目前廣泛使用的機(jī)器學(xué)習(xí)引擎)包括Nvidia和AMD,成為唯一仍然不提供該格式原生支持的機(jī)器學(xué)習(xí)引擎。但作為現(xiàn)在使用最廣泛的處理器架構(gòu),GPU支持bfloat16幾乎是不可避免的,包括英特爾即將推出的X e GPU加速器。IEEE是否曾接受bfloat16并提供了一些標(biāo)準(zhǔn)?這還有待觀察。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    IEC101協(xié)議可以傳輸什么類型數(shù)據(jù)

    IEC101協(xié)議作為電力系統(tǒng)遠(yuǎn)動(dòng)通信的核心標(biāo)準(zhǔn),其核心能力在于支持多種類型數(shù)據(jù)的傳輸,滿足調(diào)度端與場站端(如變電站、發(fā)電廠)的實(shí)時(shí)監(jiān)控、控制及狀態(tài)感知需求。以下從數(shù)據(jù)類型、傳輸模式及典型應(yīng)用場景三個(gè)
    的頭像 發(fā)表于 05-21 11:37 ?239次閱讀

    labview數(shù)據(jù)類型與PLC 數(shù)據(jù)類型之間的轉(zhuǎn)換(來自于寫入浮點(diǎn)數(shù)到匯川 PLC中的數(shù)據(jù)轉(zhuǎn)換關(guān)鍵的修改)

    為32位無符號(hào)整型U32 2、將U32拆分為兩個(gè)U16,分高低位寫入PLC 3、在PLC中,將低位寄存器設(shè)置為浮點(diǎn)數(shù)數(shù)據(jù)類型 4、結(jié)果:PLC中一直無法正確轉(zhuǎn)換。 原因及解決方法: 1、labview
    發(fā)表于 02-24 19:01

    請問ADS1299使用Test Signals ,獲取到的數(shù)據(jù)類型是什么?

    請問ADS1299使用Test Signals ,獲取到的數(shù)據(jù)類型是什么?使用什么公式可以還原?據(jù)了解,外部信號(hào)轉(zhuǎn)換完成后是浮點(diǎn)型的,但是沒有看到這塊的說明。
    發(fā)表于 01-06 07:14

    西門子博途新數(shù)據(jù)類型之:SINT(8位整數(shù))

    數(shù)據(jù)類型 SINT (Short INT) 的操作數(shù)長度為 8 位,由以下兩部分組成:一部分是符號(hào),另一部分是數(shù)值。位 0 到 6 的信號(hào)狀態(tài)表示數(shù)值。位 7 的信號(hào)狀態(tài)表示符號(hào)。符號(hào)可以是“0”(正信號(hào)狀態(tài)),或“1”(負(fù)信號(hào)狀態(tài))。
    的頭像 發(fā)表于 11-09 09:52 ?4559次閱讀
    西門子博途新<b class='flag-5'>數(shù)據(jù)類型</b>之:SINT(8位整數(shù))

    AIC23采集到的數(shù)據(jù)是應(yīng)該用什么數(shù)據(jù)類型來接收?int還是unsigned int?

    )){};data = MCBSP_read16(hMcbsp);MCBSP_write16(hMcbsp,data); 也就是說,data應(yīng)該是什么數(shù)據(jù)類型?int還是unsigned int。這個(gè)數(shù)字的物理意義
    發(fā)表于 10-18 06:56

    鴻蒙原生應(yīng)用元服務(wù)開發(fā)-倉頡基礎(chǔ)數(shù)據(jù)類型整數(shù)類型

    ’\\\\u{78}’ 這種轉(zhuǎn)義形式表示類型為 UInt8,16 進(jìn)制大小為 0x78 或 10 進(jìn)制大小為 120 的字面值。需要注意的是,\\\\u 內(nèi)部最多有兩位 16 進(jìn)制數(shù),
    發(fā)表于 09-13 14:55

    鴻蒙原生應(yīng)用元服務(wù)開發(fā)-倉頡基礎(chǔ)數(shù)據(jù)類型元組類型

    元組(Tuple)可以將多個(gè)不同的類型組合在一起,成為一個(gè)新的類型。元組類型使用 (T1, T2, …, TN) 表示,其中 T1 到 TN 可以是任意
    發(fā)表于 09-12 11:02

    鴻蒙原生應(yīng)用元服務(wù)開發(fā)-倉頡基礎(chǔ)數(shù)據(jù)類型浮點(diǎn)類型

    浮點(diǎn)類型包括 Float16、 Float32 和 Float64,分別用于表示編碼長度為 16-bit、 32-bit 和 64-bit 的浮點(diǎn)數(shù)(帶小數(shù)部分的數(shù)字,如 3.14159、8.24
    發(fā)表于 09-10 10:22

    鴻蒙原生應(yīng)用元服務(wù)開發(fā)-倉頡基礎(chǔ)數(shù)據(jù)類型Unit與Nothing類型

    一、Unit 類型 對(duì)于那些只關(guān)心副作用而不關(guān)心值的表達(dá)式,它們的類型是Unit。例如,print 函數(shù)、賦值表達(dá)式、復(fù)合賦值表達(dá)式、自增和自減表達(dá)式、循環(huán)表達(dá)式,它們的類型都是 Unit
    發(fā)表于 09-06 15:43

    labview數(shù)據(jù)類型的取值范圍是多少

    LabVIEW的數(shù)據(jù)類型豐富多樣,涵蓋了整數(shù)、小數(shù)(浮點(diǎn)數(shù))、復(fù)數(shù)等多種類型,每種類型都有其特定的取值范圍。以下是對(duì)LabVIEW中常見數(shù)據(jù)類型取值范圍的說明: 整數(shù)
    的頭像 發(fā)表于 09-04 17:33 ?2611次閱讀

    常見的遙感數(shù)據(jù)類型有哪些

    遙感技術(shù)是一種通過遙感器在遠(yuǎn)離目標(biāo)的位置獲取目標(biāo)地物的電磁波信息,并進(jìn)行分析的技術(shù)。遙感數(shù)據(jù)類型繁多,涵蓋了從可見光到紅外、微波等多個(gè)波段,以及不同的數(shù)據(jù)格式和分辨率。 光學(xué)遙感數(shù)據(jù) : 全色影像
    的頭像 發(fā)表于 09-04 14:30 ?3673次閱讀

    人體紅外傳感器的數(shù)據(jù)類型及工作原理

    人體紅外傳感器是一種利用紅外技術(shù)檢測人體活動(dòng)和位置的傳感器。它廣泛應(yīng)用于安防、智能家居、醫(yī)療健康等領(lǐng)域。 人體紅外傳感器的數(shù)據(jù)類型 人體紅外傳感器的數(shù)據(jù)主要包括以下幾種類型: 1.1 溫度數(shù)據(jù)
    的頭像 發(fā)表于 08-20 09:18 ?2314次閱讀

    技術(shù)干貨驛站 ▏深入理解C語言:基本數(shù)據(jù)類型和變量

    在C語言中,數(shù)據(jù)類型和變量是編程的基礎(chǔ),也是理解更復(fù)雜概念的關(guān)鍵。數(shù)據(jù)類型決定了變量的內(nèi)存分配、存儲(chǔ)范圍和操作方式,而變量則是存儲(chǔ)數(shù)據(jù)的容器。本篇文章將從基本數(shù)據(jù)類型和變量兩個(gè)方面,帶
    的頭像 發(fā)表于 07-26 17:53 ?2747次閱讀
    技術(shù)干貨驛站 ▏深入理解C語言:基本<b class='flag-5'>數(shù)據(jù)類型</b>和變量

    如何完成編輯配置文件來采集數(shù)據(jù)

    : \'°F\'expression: values[\'Bit.00001\']desc: config-bit-00001## 這里定義了數(shù)據(jù)在平臺(tái)上的如何顯示。此處的tpye為數(shù)據(jù)以何種數(shù)據(jù)類型
    發(fā)表于 07-26 06:50

    IG網(wǎng)關(guān)如何讀取西門子smart200PLC寄存器類型V、VW 的數(shù)據(jù)?

    1、添加設(shè)備,PLC協(xié)議選擇ISO-on-TCP,設(shè)置IP地址和端口102,模式選擇TSAP??蛻舳薚SAP:02.00,服務(wù)器TSAP:02.01 2、添加變量,寄存器類型選擇V,填寫地址,選擇數(shù)據(jù)類型。 3、成功讀取寄存器V5000的
    發(fā)表于 07-25 07:12