一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Merlin HugeCTR V3.4.1版本新增內(nèi)容介紹

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-03-10 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個 GPU 和節(jié)點之間分配訓(xùn)練并估計點擊率(Click-through rate)。

此次v3.4更新涉及的模塊主要為:

HugeCTR 分級參數(shù)服務(wù)器

HugeCTR Python API

相關(guān)介紹:

HugeCTR 分級參數(shù)服務(wù)器介紹

V3.4.1 版本新增內(nèi)容

調(diào)整了整個代碼庫中日志消息的日志級別。

現(xiàn)已支持對具有多個標簽的數(shù)據(jù)集進行推理:

“Softmax” 層現(xiàn)在已支持 FP16,并且支持混合精度以進行多標簽推理。

支持多 GPU 離線推理:

我們通過 Python 接口支持多 GPU 離線推理,它可以利用Hierarchical Parameter Server并在多個設(shè)備上實現(xiàn)并發(fā)執(zhí)行。更多信息請參考推理 API和多 GPU 離線推理筆記本。

HPS 已構(gòu)建為獨立庫:

我們重構(gòu)了代碼庫并將分層參數(shù)服務(wù)器構(gòu)建為一個獨立的庫,以后會進一步封裝。

metadata.json 簡介:

添加了有關(guān) Parquet data 中 _metadata.json 的詳細信息。

增加了用于估計每個 GPU 的詞匯量大小的文檔和工具:

我們添加了一個工具來計算每個 GPU 的不同嵌入類型的詞匯量大小,在此基礎(chǔ)上,workspace_size_per_gpu_in_mb 可以根據(jù)嵌入向量大小和優(yōu)化器類型評估更多信息請參考腳本。

訓(xùn)練中支持 HDFS :

a. 現(xiàn)在支持從 HDFS 加載和存儲模型和優(yōu)化器狀態(tài)。

b. 增加了編譯選項使 HDFS 的支持更加靈活。

c. 添加了一個筆記本來展示如何將 HugeCTR 與 HDFS 一起使用:

增加了一個演示如何分析模型文件的 Python 腳本和筆記本

錯誤修復(fù):

修復(fù)了SOK 中的鏡像策略錯誤

修復(fù)了無法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02中導(dǎo)入稀疏操作工具包的問題。

HugeCTR 參數(shù)服務(wù)器:修復(fù)了在未配置 RocksDB 時,可能會在初始化期間發(fā)生的訪問沖突問題。

已知問題

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時,建議您通過發(fā)出以下命令(-shm-size=1g -ulimit memlock=-1) 來增加這些資源。

另見 NCCL 的 已知問題

還有 GitHub 問題

目前即使目標 Kafka broker 無響應(yīng),KafkaProducers 啟動也會成功。為了避免與來自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動、正常工作并且可以從運行 HugeCTR 的節(jié)點訪問。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 worker 將被映射到同一個文件,從而導(dǎo)致數(shù)據(jù)加載不會按預(yù)期進行。

正則化器暫不支持聯(lián)合損失訓(xùn)練。

原文標題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131265
  • 節(jié)點
    +關(guān)注

    關(guān)注

    0

    文章

    222

    瀏覽量

    24983
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9795

    瀏覽量

    88005

原文標題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    CANoe產(chǎn)品體系19版本新特性及新增Option(上)

    版本持續(xù)助力當(dāng)前車輛E/E架構(gòu)中ECU開發(fā)驗證,同時賦能后續(xù)智能網(wǎng)聯(lián)電動車型預(yù)研驗證。新版本CANoe產(chǎn)品體系新增數(shù)據(jù)驅(qū)動的DDS、車輛互聯(lián)服務(wù)和高效電機模型庫,進一步支持CANXL
    的頭像 發(fā)表于 06-11 10:03 ?1315次閱讀
    CANoe產(chǎn)品體系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    支持HPM6P00/HPM5E00系列!HPMicro Manufacturing Tool v0.6.0發(fā)布

    各位先楫的小伙伴久等了,HPMicroManufacturingTool0.6.0版本正式發(fā)布啦!該版本包含多個模塊的更新優(yōu)化,讓我們抓緊時間先睹為快!v0.6.0版本主要更新
    的頭像 發(fā)表于 06-04 08:28 ?546次閱讀
    支持HPM6P00/HPM5E00系列!HPMicro Manufacturing Tool <b class='flag-5'>v</b>0.6.0發(fā)布

    達實智能正式發(fā)布AIoT平臺V7版本

    近日,在達實智能成立30周年慶典上,達實AIoT智能物聯(lián)網(wǎng)平臺V7版本重磅發(fā)布。此版本借助國產(chǎn)AI大模型發(fā)展趨勢,展示了生成式AI在園區(qū)數(shù)字化平臺的實際應(yīng)用。以下為發(fā)布會當(dāng)天達實智能研發(fā)中心袁宜峰博士現(xiàn)場分享:
    的頭像 發(fā)表于 03-21 11:44 ?581次閱讀

    達實AIoT智能物聯(lián)網(wǎng)管控平臺V7版本發(fā)布

    近日,達實智能在公司總部發(fā)布了達實AIoT智能物聯(lián)網(wǎng)管控平臺V7版本,展示了生成式AI在園區(qū)數(shù)字化平臺的實際應(yīng)用。
    的頭像 發(fā)表于 03-19 11:39 ?622次閱讀

    芯來科技發(fā)布Nuclei Studio 2025.02版本

    Studio 2025.02版本發(fā)布了以下功能特性: 集成Nuclei RISC-V Toolchain /OpenOCD /QEMU /Xlmodel 2025.02版本。
    的頭像 發(fā)表于 03-05 17:43 ?1115次閱讀
    芯來科技發(fā)布Nuclei Studio 2025.02<b class='flag-5'>版本</b>

    Ludovic v7.2.4 新版本更新內(nèi)容

    Ludovic從v7.0.7到v7.2.4歷經(jīng)v7.1、v7.2、v7.2.3三個版本,軟件在功
    的頭像 發(fā)表于 02-19 09:24 ?670次閱讀
    Ludovic <b class='flag-5'>v</b>7.2.4 新<b class='flag-5'>版本</b>更新<b class='flag-5'>內(nèi)容</b>

    小鵬MONA M03迎來V1.6.2版本升級

    小鵬MONA M03迎來了V1.6.2版本升級,為用戶帶來了諸多實用功能和體驗優(yōu)化。 此次升級的一大亮點是新增了哨兵模式。車主可通過手機App或車機手動開啟該模式,車輛在離車鎖車后會持續(xù)監(jiān)控周圍環(huán)境
    的頭像 發(fā)表于 01-23 17:28 ?663次閱讀

    motorBench 2.45.0版本說明

    電子發(fā)燒友網(wǎng)站提供《motorBench 2.45.0版本說明.pdf》資料免費下載
    發(fā)表于 01-22 16:15 ?0次下載
    motorBench 2.45.0<b class='flag-5'>版本</b>說明

    OurBMC 24.12版本正式上線

    日前,經(jīng)過社區(qū)開發(fā)者的共同努力,OurBMC 全新升級,24.12版本正式上線。
    的頭像 發(fā)表于 01-07 13:45 ?631次閱讀

    特斯拉FSD V13.2版本正式發(fā)布

    的又一次重要突破。 FSD V13.2版本的發(fā)布對特斯拉而言具有重要意義。該版本在技術(shù)和功能上進行了全面升級,旨在提供更加穩(wěn)定、高效的自動駕駛體驗。特斯拉表示,如果新版本在初期測試中未
    的頭像 發(fā)表于 12-03 11:01 ?1210次閱讀

    馬斯克宣布FSD V13版本將很快發(fā)布

    今年9月份,特斯拉的AI團隊就曾在馬斯克的X平臺上發(fā)帖,表示目標是在10月底發(fā)布FSD V13版本。然而,這一時間點并未如愿實現(xiàn)。到了10月下旬,特斯拉AI團隊再次表示,他們的目標是在感恩節(jié)之前推出最新的FSD V13
    的頭像 發(fā)表于 11-26 11:15 ?896次閱讀

    淺談Xpedition 2409版本的新功能

    在《創(chuàng)新不止|Xpedition 2409版本新功能揭秘(上)》一文中,我們了解了Xpedition 2409版本的部分改進部分。今天,我們繼續(xù)看Xpedition 2409新版本給我們帶來了什么樣的全新用戶體驗。
    的頭像 發(fā)表于 10-31 15:33 ?3158次閱讀

    實時網(wǎng)絡(luò)的仿真和配置工具RTaW Pegase v4.6版本更新

    隨著嵌入式系統(tǒng)日益復(fù)雜,高效可靠的設(shè)計工具變得愈發(fā)重要。RTaW公司的仿真工具RTaW-Pegase最新發(fā)布的4.6版本,為用戶帶來了一系列重要更新和功能增強。本文將詳細介紹
    的頭像 發(fā)表于 09-26 08:07 ?527次閱讀
    實時網(wǎng)絡(luò)的仿真和配置工具RTaW Pegase <b class='flag-5'>v</b>4.6<b class='flag-5'>版本</b>更新

    NVIDIA Parabricks v4.3.1版本的新功能

    會(ESHG)上發(fā)布,其加入了新的體細胞數(shù)據(jù)變異檢測功能,并將業(yè)內(nèi)領(lǐng)先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發(fā)布 Parabricks v4.3 之后推出的新
    的頭像 發(fā)表于 09-10 10:22 ?821次閱讀
    NVIDIA Parabricks <b class='flag-5'>v</b>4.3.1<b class='flag-5'>版本</b>的新功能

    SOK在手機行業(yè)的應(yīng)用案例

    通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關(guān)特性和優(yōu)化加速 GPU 上的分布式 Embed
    的頭像 發(fā)表于 07-25 10:01 ?897次閱讀
    SOK在手機行業(yè)的應(yīng)用案例