一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TensorFlow 2.4來(lái)了 帶來(lái)了多項(xiàng)新特性和功能改進(jìn)

新機(jī)器視覺(jué) ? 來(lái)源:新機(jī)器視覺(jué) ? 作者:機(jī)器之心 ? 2020-12-26 11:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌正式發(fā)布了 TensorFlow 2.4,帶來(lái)了多項(xiàng)新特性和功能改進(jìn)。

TensorFlow 2.4 的更新包括對(duì)于分布式訓(xùn)練和混合精度的新功能支持,對(duì) NumPy API 子集的試驗(yàn)性支持以及一些用于監(jiān)測(cè)性能瓶頸的新工具。 根據(jù) TensorFlow 官方博客,本次更新的主要內(nèi)容整理如下:

tf.distribute 中的新功能

參數(shù)服務(wù)器策略 在 TensorFlow 2.4 中,tf.distribute 模塊引入了對(duì)使用 ParameterServerStrategy 和自定義訓(xùn)練循環(huán)進(jìn)行模型異步訓(xùn)練的試驗(yàn)性支持。和 MultiWorkerMirroredStrategy 類似,ParameterServerStrategy 是一種多工作器(multi-worker)數(shù)據(jù)并行策略,但梯度更新是異步的。 參數(shù)服務(wù)器訓(xùn)練集群由工作服務(wù)器和參數(shù)服務(wù)器組成。變量在參數(shù)服務(wù)器上創(chuàng)建,然后在每個(gè)步驟中由工作器讀取和更新。

變量的讀取和更新在工作器之間是獨(dú)立進(jìn)行的,不存在任何同步。由于工作器彼此不依賴,因此該策略具有工作器容錯(cuò)的優(yōu)勢(shì),如果使用可搶占 VM,該策略將很有用。 多工作器鏡像策略 MultiWorkerMirroredStrategy 已經(jīng)脫離試驗(yàn)階段,成為穩(wěn)定的 API。像單工作器的 MirroredStrategy 一樣,MultiWorkerMirroredStrategy 通過(guò)同步數(shù)據(jù)并行實(shí)現(xiàn)分布式訓(xùn)練,顧名思義,借助 MultiWorkerMirroredStrategy 可以在多臺(tái)機(jī)器上進(jìn)行訓(xùn)練,每臺(tái)機(jī)器都可能具有多個(gè) GPU。

Keras 更新

混合精度 在 TensorFlow 2.4 中,Keras 混合精度 API 已經(jīng)脫離試驗(yàn)階段,成為穩(wěn)定的 API。大多數(shù) TensorFlow 模型使用 float32 dtype,但現(xiàn)在有些低精度數(shù)據(jù)類型占用的內(nèi)存更少,比如 float16。混合精度指的是在同一模型中使用 16 位和 32 位浮點(diǎn)數(shù)以進(jìn)行更快的訓(xùn)練。這一 API 可將模型性能在 GPU 上提高到 3 倍,在 TPU 上提高 60%。

要使用混合精度 API,必須使用 Keras 層和優(yōu)化器,但不一定需要使用其他 Keras 類。 優(yōu)化器 本次更新包括重構(gòu) tf.keras.optimizers.Optimizer 類,讓 model.fit 的用戶和自定義訓(xùn)練循環(huán)的用戶能夠編寫可與任何優(yōu)化器一起使用的訓(xùn)練代碼。所有內(nèi)置 tf.keras.optimizer.Optimizer 子類都可接受 gradient_transformers 和 gradient_aggregator 參數(shù),輕松定義自定義梯度變換。 重構(gòu)之后,使用者可以在編寫自定義訓(xùn)練循環(huán)時(shí)直接將損失張量傳遞給 Optimizer.minimize:

pIYBAF_msJqARmysAABBsgUGUmE079.jpg

這些更新的目標(biāo)是讓 Model.fit 和自定義訓(xùn)練循環(huán)與優(yōu)化器細(xì)節(jié)更加不相關(guān),從而讓使用者無(wú)需修改即可編寫出與任何優(yōu)化器共同使用的訓(xùn)練代碼。 最后,TensorFlow 2.4 的更新還包括 Keras Functional API 內(nèi)部的重構(gòu),改善了函數(shù)式模型構(gòu)造所產(chǎn)生的內(nèi)存消耗并簡(jiǎn)化了觸發(fā)邏輯。這種重構(gòu)可以保證 TensorFlowOpLayers 的行為可預(yù)測(cè),并且可以使用 CompositeTensor 類型簽名(type signature)。

tf.experimental.numpy

TensorFlow 2.4 引入了對(duì) NumPy API 子集的試驗(yàn)性支持。該模塊可以運(yùn)行由 TensorFlow 加速的 NumPy 代碼,由于這一 API 是基于 TensorFlow 構(gòu)建的,因此可與 TensorFlow 無(wú)縫銜接,允許訪問(wèn)所有 TensorFlow API 并通過(guò)編譯和自動(dòng)矢量化提供優(yōu)化后的運(yùn)行。 例如,TensorFlow ND 數(shù)組可以與 NumPy 函數(shù)互通,類似地,TensorFlow NumPy 函數(shù)可以接受包括 tf.Tensor 和 np.ndarray 在內(nèi)的不同類型輸入。

o4YBAF_msK-AD0uIAABwAa2nu7U191.jpg

新的性能分析工具

TensorFlow Profiler 是度量 TensorFlow 模型的訓(xùn)練性能和資源消耗情況的工具,用來(lái)診斷性能瓶頸,最終加快訓(xùn)練速度。 此前,TensorFlow Profiler 支持多 GPU 單主機(jī)訓(xùn)練。到了 2.4 版本,使用者可以測(cè)試 MultiWorkerMirroredStrategy 的訓(xùn)練工作了,比如使用采樣模式 API 按需配置,并連接到 MultiWorkerMirroredStrategy 工作器正在使用的同一服務(wù)器。


另外,你可以通過(guò)向捕獲配置文件工具提供工作器地址來(lái)使用 TensorBoard 配置文件插件。配置之后,你可以使用新的 Pod Viewer tool 來(lái)選擇訓(xùn)練步驟,并查看所有工作器上該步驟的 step-time 的細(xì)分。 TFLite Profiler TFLite Profiler 則支持在 Android 中跟蹤 TFLite 內(nèi)部信息,以識(shí)別性能瓶頸。

GPU 支持

TensorFlow 2.4 與 CUDA 11 和 cuDNN 8 配合運(yùn)行,支持最新發(fā)布的英偉達(dá)安培架構(gòu) GPU,對(duì)于 CUDA 11 的新特性,可以參考英偉達(dá)開(kāi)發(fā)者博客: https://developer.nvidia.com/blog/cuda-11-features-revealed/ 在新版本中,默認(rèn)情況下會(huì)啟用安培 GPU 的新特性——對(duì) TensorFloat-32 的支持。TensorFloat-32 又簡(jiǎn)稱為 TF32,是英偉達(dá) Ampere GPU 的一種數(shù)學(xué)精度模式,可導(dǎo)致某些 float32 運(yùn)算(如矩陣乘法和卷積)在安培架構(gòu) GPU 上運(yùn)行得更快,但精度略有降低。 若想更深入了解,可參閱文檔: https://www.tensorflow.org/api_docs/python/tf/config/experimental/enable_tensor_float_32_execution

責(zé)任編輯:xj

原文標(biāo)題:TensorFlow 2.4來(lái)了:上線對(duì)分布式訓(xùn)練和混合精度的新功能支持

文章出處:【微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25446
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    330

    瀏覽量

    61179

原文標(biāo)題:TensorFlow 2.4來(lái)了:上線對(duì)分布式訓(xùn)練和混合精度的新功能支持

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    所以你做出來(lái)了

    所以你做出來(lái)了嗎,求
    發(fā)表于 06-16 01:43

    軟件更新 | 你期待的新功能來(lái)了!TSMaster 202502 新版本亮點(diǎn)搶先看!

    備受期待的TSMaster202502最新版終于來(lái)了!在本月更新中,我們?yōu)橛脩?b class='flag-5'>帶來(lái)了超多全新功能,旨在進(jìn)一步提升軟件的性能、靈活性與用戶體驗(yàn)。接下來(lái),我們將為您詳細(xì)介紹本次更新的亮點(diǎn)內(nèi)容,幫助
    的頭像 發(fā)表于 03-07 20:03 ?613次閱讀
    軟件更新 | 你期待的新<b class='flag-5'>功能來(lái)了</b>!TSMaster 202502 新版本亮點(diǎn)搶先看!

    為什么無(wú)法使用OpenVINO?模型優(yōu)化器轉(zhuǎn)換TensorFlow 2.4模型?

    已下載 ssd_mobilenet_v2_fpnlite_640x640_coco17_tpu-8 型號(hào)。 使用將模型轉(zhuǎn)換為中間表示 (IR) ssd_support_api_v.2.4
    發(fā)表于 03-05 09:07

    dlp4500藍(lán)色光投不出來(lái)了如何維修?

    dlp4500藍(lán)色光投不出來(lái)了,應(yīng)該是靜電導(dǎo)致的,請(qǐng)問(wèn)如何維修呢
    發(fā)表于 02-26 08:16

    新思科技LucidShape 2024.09新增功能

    LucidShape的最新版本2024.09帶來(lái)了一系列新功能與增強(qiáng)功能,旨在解決光學(xué)開(kāi)發(fā)者面臨的最常見(jiàn)和最復(fù)雜的挑戰(zhàn)。從微透鏡陣列(MLA)的自動(dòng)掩模計(jì)算,到高級(jí)分析功能
    的頭像 發(fā)表于 01-21 09:16 ?651次閱讀
    新思科技LucidShape 2024.09新增<b class='flag-5'>功能</b>

    $1999 的 RTX 5090 來(lái)了

    RTX 5090 NVIDIA GeForce RTX 5090 是有史以來(lái)最強(qiáng)大的 GeForce GPU,為游戲玩家和創(chuàng)作者帶來(lái)了改變游戲規(guī)則的功能。以前所未有的 AI 能力應(yīng)對(duì)最先進(jìn)的模型
    的頭像 發(fā)表于 01-13 10:03 ?1362次閱讀
    $1999 的 RTX 5090 <b class='flag-5'>來(lái)了</b>

    小米汽車接入VLM視覺(jué)語(yǔ)言大模型,OTA更新帶來(lái)多項(xiàng)升級(jí)

    小米汽車近日宣布,其SU7車型的1.4.5版OTA(空中升級(jí))已經(jīng)開(kāi)始推送。此次更新帶來(lái)了多項(xiàng)新增功能和體驗(yàn)優(yōu)化,旨在進(jìn)一步提升用戶的駕駛體驗(yàn)。 其中最引人注目的是,小米汽車正式接入了VLM視覺(jué)語(yǔ)言
    的頭像 發(fā)表于 12-24 09:52 ?1013次閱讀

    與帝奧微解鎖蔚來(lái)智能駕駛新體驗(yàn)

    近日,NIO蔚來(lái)走進(jìn)帝奧微,攜多款熱門車型亮相,于上海研發(fā)中心為大家帶來(lái)了一場(chǎng)專屬體驗(yàn)試駕活動(dòng)。
    的頭像 發(fā)表于 12-19 11:34 ?751次閱讀

    SOLIDWORKS 2025引入了多項(xiàng)新增工具和增強(qiáng)功能

    在工程設(shè)計(jì)領(lǐng)域,SOLIDWORKS一直以其強(qiáng)大的功能和靈活的操作性贏得了廣泛的認(rèn)可。隨著SOLIDWORKS 2025版本的發(fā)布,這款三維CAD設(shè)計(jì)軟件再次以一系列令人矚目的新增工具和增強(qiáng)功能,為全球設(shè)計(jì)師和工程師們帶來(lái)了設(shè)計(jì)
    的頭像 發(fā)表于 12-17 15:23 ?743次閱讀

    鍵盤就是電腦,樹(shù)莓派500來(lái)了

    和 Raspberry Pi Monitor 給大家提供一個(gè)完整的桌面解決方案。 Raspberry Pi 500 處理器: 2.4GHz 四核 64 位 Arm Cortex-A76 內(nèi)存: 8GB
    發(fā)表于 12-13 13:52

    Linux微信4.0.0版發(fā)布,功能再升級(jí)

    近日,備受矚目的Linux微信4.0.0版本終于迎來(lái)了正式發(fā)布。此次版本更新不僅帶來(lái)了多項(xiàng)實(shí)用功能,還實(shí)現(xiàn)與Windows、macOS公測(cè)
    的頭像 發(fā)表于 11-06 10:59 ?773次閱讀

    GUI Guider全新版本上線

    GUI Guider v1.8.1上線啦!這一版本為嵌入式HMI開(kāi)發(fā)帶來(lái)了多項(xiàng)功能改進(jìn),旨在為您提供更加高效、便捷的嵌入式HMI開(kāi)發(fā)體驗(yàn)。
    的頭像 發(fā)表于 10-14 11:37 ?2390次閱讀

    微軟推出Windows 11九月更新:增強(qiáng)體驗(yàn),添加多項(xiàng)便捷新功能

    微軟公司于9月26日正式推出了針對(duì)Windows 11系統(tǒng)的最新可選更新KB5043145,此次更新精心設(shè)計(jì)多項(xiàng)改進(jìn)與創(chuàng)新功能,旨在為用戶帶來(lái)
    的頭像 發(fā)表于 09-27 15:55 ?1546次閱讀

    Vivado 2024.1版本的新特性(1)

    Vivado 2024.1已正式發(fā)布,今天我們就來(lái)看看新版本帶來(lái)了哪些新特性。
    的頭像 發(fā)表于 09-18 10:30 ?2457次閱讀
    Vivado 2024.1版本的新<b class='flag-5'>特性</b>(1)

    云臺(tái)解決方案中的無(wú)刷驅(qū)動(dòng)技術(shù),為交通行業(yè)帶來(lái)了顯著變革

    在當(dāng)今快速發(fā)展的交通領(lǐng)域,各種先進(jìn)技術(shù)不斷涌現(xiàn),為人們的出行帶來(lái)了更高的安全性、便利性和效率。其中,云臺(tái)解決方案中的無(wú)刷驅(qū)動(dòng)技術(shù)正逐漸成為一項(xiàng)關(guān)鍵的應(yīng)用,為交通行業(yè)帶來(lái)了顯著的變革。 一、無(wú)刷驅(qū)動(dòng)
    的頭像 發(fā)表于 09-06 17:51 ?611次閱讀