一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在騰訊云上創(chuàng)建SR1云實(shí)例

安晟培半導(dǎo)體 ? 來源:安晟培半導(dǎo)體 ? 作者:安晟培半導(dǎo)體 ? 2022-06-23 10:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

騰訊 CVM 標(biāo)準(zhǔn)型 SR1 是騰訊云推出的首款搭載 ARM 架構(gòu)處理器的新一代 CVM 標(biāo)準(zhǔn)型計(jì)算實(shí)例規(guī)格。SR1 基于全核一致主頻 3.0GHz 的 Ampere Altra 處理器,實(shí)例核數(shù)從 1 核到 64 核,并支持 1: 2、1: 4 等多種處理器與內(nèi)存配比,相對 x86 架構(gòu)實(shí)例為用戶提供卓越的性價(jià)比。

Ampere 為基于 Ampere Altra 處理器的 SR1 實(shí)例提供了優(yōu)化過的 AI 框架 (Ampere AI),并通過騰訊鏡像市場提供免費(fèi)的鏡像給客戶使用。本文將介紹如何在騰訊云上創(chuàng)建 SR1 實(shí)例,并基于 TensorFlow計(jì)算機(jī)視覺分類性能進(jìn)行評測。

CPU 做推理

現(xiàn)下 AI 推理應(yīng)用的算力來源主要有三種方式,即 CPU+AI 專用芯片,CPU+GPU 和單純的 CPU 推理。根據(jù) Statista 和麥肯錫之前發(fā)布的AI硬件洞察報(bào)告,基于 CPU 的推理目前仍占 50% 以上。相比其他兩種模式,采用 CPU 推理的主要原因有幾點(diǎn):

更加靈活便利,軟件主導(dǎo),對應(yīng)用方來說對專用硬件的依賴性低。

涉及操作系統(tǒng)、驅(qū)動(dòng)程序、運(yùn)行時(shí)組件庫等的復(fù)雜性較低。

CPU 上 AI 模型算法(例如稀疏性、量化等)的持續(xù)優(yōu)化創(chuàng)新可以提供接近 GPU 的高吞吐量。

更容易實(shí)現(xiàn)橫向擴(kuò)展并與其他軟件堆棧進(jìn)行集成。

更重要的是在 CPU 上搭建推理應(yīng)用可以方便的將 AI 集成到業(yè)務(wù)邏輯模塊,融入微服務(wù)云原生體系。

本文將介紹如何在騰訊云上創(chuàng)建 SR1 云實(shí)例,基于 SR1 所搭載的 Ampere Altra CPU,以 TensorFlow 為例對計(jì)算機(jī)視覺分類性能進(jìn)行評測。

創(chuàng)建 SR1 實(shí)例

我們將創(chuàng)建一個(gè) 16vCPU 的 SR1 實(shí)例 SR1.4XLARGE32 來進(jìn)行評測,該實(shí)例配置 16 個(gè) Ampere Altra 物理核和 32GB 內(nèi)存。

首先登錄騰訊云的控制臺,在“實(shí)例”類別下選擇“新建”,將進(jìn)入實(shí)例創(chuàng)建頁面。由于 SR1 目前只在廣州六區(qū)有售,所以需要選擇“廣州”->“廣州六區(qū)”->”標(biāo)準(zhǔn)型 SR1”。

e7e5537a-f22e-11ec-ba43-dac502259ad0.png

然后將看到不同規(guī)格的 SR1 實(shí)例,這里我們選擇 SR1.4XLARGE32 規(guī)格的實(shí)例。

e7f64afe-f22e-11ec-ba43-dac502259ad0.png

鏡像選擇“鏡像市場”-> “從鏡像市場選擇”,然后搜索“Ampere”,選取“Ampere Optimized TensorFlow - Ubuntu 20.04”鏡像即可免費(fèi)使用 Ampere 針對 SR1 優(yōu)化過的 TensorFlow 2.7 以及各種示例程序。

e7ffafae-f22e-11ec-ba43-dac502259ad0.png

e810c2ee-f22e-11ec-ba43-dac502259ad0.png

設(shè)置好其它的實(shí)例配置,就可以確認(rèn)配置信息并開通實(shí)例了。

e791018a-f22e-11ec-ba43-dac502259ad0.gif

啟動(dòng)并連接到實(shí)例

e791018a-f22e-11ec-ba43-dac502259ad0.gif

實(shí)例創(chuàng)建完就可以啟動(dòng)并登錄了。實(shí)例的 IP 地址可以從控制臺獲取,取決于創(chuàng)建時(shí)設(shè)置的登錄方式,可以使用密碼或密鑰的方式登錄實(shí)例。

e83542d6-f22e-11ec-ba43-dac502259ad0.png

登錄后將看到下面的 Ampere AI 的歡迎界面。

e85287b0-f22e-11ec-ba43-dac502259ad0.png

可以看到,這個(gè)鏡像除了集成了 Ampere 優(yōu)化的 Tensorflow,也包含 aio-example 的測試代碼,該代碼也可以從 github 上獲取。

運(yùn)行 TensorFlow AIO 示例

TensorFlow 是一個(gè)端到端開源機(jī)器學(xué)習(xí)平臺。它擁有一個(gè)全面而靈活的生態(tài)系統(tǒng),其中包含各種工具、庫和社區(qū)資源,可助力研究人員推動(dòng)先進(jìn)機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,并使開發(fā)者能夠輕松地構(gòu)建和部署由機(jī)器學(xué)習(xí)提供支持的應(yīng)用。

我們創(chuàng)建實(shí)例時(shí)從鏡像市場選擇的鏡像已經(jīng)包含了針對 Ampere Altra CPU 優(yōu)化過的 Tensorflow 2.7。為了運(yùn)行 aio-example 提供的示例程序,我們需要先下載模型。aio-examples 提供了包括圖像分類和對象檢測的不同模型,有 32 位的,也有 16 位和 8 位的模型。

e87ce852-f22e-11ec-ba43-dac502259ad0.png

取決于網(wǎng)絡(luò)狀況,下載所有的模型將需要幾分鐘。

我們將用 TensorFlow resnet_50_v15 分類模型來進(jìn)行測試和評估。ResNet50 是最常用的圖像分類模型之一。

由于 Ampere Altra CPU 是單核單線程,SR1 里每一個(gè) vCPU 都對應(yīng)一個(gè) Altra 物理核,所以在用 SR1.4XLARGE32 測試時(shí),我們指定 AIO_NUM_THREADS 為 16。我們首先測試 FP32 的雙精度模型。

e88a3a0c-f22e-11ec-ba43-dac502259ad0.png

e89ad5d8-f22e-11ec-ba43-dac502259ad0.png

可以看到,使用 16 個(gè)核心,resnet_50_v15 可以每秒處理 65.36 張圖像(65.36 ips), 延時(shí)為 15ms。

下面我們再測試基于 FP16 的模型。

e8bb4052-f22e-11ec-ba43-dac502259ad0.png

e8c791cc-f22e-11ec-ba43-dac502259ad0.png

我們看到 FP16 的模型提供了高達(dá) 115.59 ips 的吞吐能力,這是因?yàn)?Ampere Altra 處理器對 FP16 提供了原生支持。相比 FP32 模型, FP16 模型可以在不影響模型的精度的前提下提供接近 2 倍的圖像處理能力。

與其他實(shí)例的性能對比

這里的 aio-example 同樣可以運(yùn)行在基于 Intel CPU 和 AMD CPU 的騰訊 CVM 實(shí)例上。我們同樣創(chuàng)建 16vCPU 的實(shí)例 S6.4XLARGE32 和 SA3.4XLARGE32。其中 S6.4XLARGE32 是基于 Intel Xeon Ice Lake 處理器的 16vCPU 實(shí)例,SA3.4XLARGE32 是基于 AMD EPYC Milan 處理器的 16vCPU 實(shí)例。與 SR1.4XLARGE32 不同的是,這里的 16vCPU 是 16 個(gè)線程,而非物理核,實(shí)際的物理核為 8。

我們在 S6.4XLARGE32 上運(yùn)行 intel-tensorflow, 這是 Intel 優(yōu)化過的 TensorFlow 以充分發(fā)揮 AVX-512 指令集的性能。

AMD 也提供了針對 AMD CPU 優(yōu)化的 ZenDNN,但在騰訊 CVM 里測試的結(jié)果并不比 native 的 Tensorflow 更好,所以以下 SA3.4XLARGE32 的數(shù)據(jù)采用的是 native TensorFlow。

“resnet_50_v15”模型在 3 個(gè)平臺上的性能表現(xiàn)如下表。

e906ddc8-f22e-11ec-ba43-dac502259ad0.png

我們可以看到,每秒處理的圖像數(shù)量(ips),SR1.4xLARGE32 分別比同規(guī)格的 S6 和 SA3 實(shí)例高出 40% 和 50%;如果再考慮單個(gè)實(shí)例的價(jià)格差異,以相同的價(jià)格,SR1.4xLARGE32 可以獲得比同規(guī)格的 S6 和 SA3 高出 70% 和 40% 的性能。

于此同時(shí),SR1 實(shí)例還提供了對 FP16 的支持,可以獲得更高的吞吐能力,以及更低的延時(shí)特性。

Jupiter Notebook 的可視化示例

aio-example 也提供了 Jupiter Notebook 腳本,方式編輯,調(diào)試和實(shí)現(xiàn)可視化。

下面將以對象檢測模型 SSD Inception v2 為例。首先在 CVM 里啟動(dòng) Jupiter Notebook。

e93791d4-f22e-11ec-ba43-dac502259ad0.png

在另外一臺有瀏覽器的機(jī)器上,執(zhí)行以下命令,輸入實(shí)例的密碼,開啟 ssh 隧道;然后打開瀏覽器,輸入上面最后一行的地址,就可以看到 AIO 的 Jupiter Notebook 了。

e94eb512-f22e-11ec-ba43-dac502259ad0.png

e95bc004-f22e-11ec-ba43-dac502259ad0.png

進(jìn)入“object_detection”,點(diǎn)擊“examples.ipynb”,將會看到 Object Detection Examples 的頁面。

e96d185e-f22e-11ec-ba43-dac502259ad0.png

點(diǎn)擊“Cell” -> “Run All”運(yùn)行。

e9858498-f22e-11ec-ba43-dac502259ad0.png

查看運(yùn)行結(jié)果。

e9a0a12e-f22e-11ec-ba43-dac502259ad0.png

e9b5281a-f22e-11ec-ba43-dac502259ad0.png

e9e1cd5c-f22e-11ec-ba43-dac502259ad0.png

ea022912-f22e-11ec-ba43-dac502259ad0.png

ea2fb38c-f22e-11ec-ba43-dac502259ad0.png

ea3f099a-f22e-11ec-ba43-dac502259ad0.png

也可以通過同樣的方法運(yùn)行 aio-examples 里面其它的示例。

結(jié) 論

采用 Ampere Altra 處理器的騰訊 SR1 實(shí)例,充分發(fā)揮了單核單線程的性能優(yōu)勢,同時(shí) Ampere AI 優(yōu)化軟件棧將 SR1 在 AI 推理應(yīng)用中,相對 x86 架構(gòu)的性價(jià)比優(yōu)勢提升到了 70%。

除了騰訊云市場的免費(fèi)鏡像,用戶也可以從 Ampere 解決方案網(wǎng)站獲取即用型 Docker 映像,包括代碼和文檔,在接受最終用戶許可協(xié)議后的進(jìn)行下載。Docker 映像包含一個(gè)標(biāo)準(zhǔn)的 ML 框架(TensorFlow,PyTorch, ONNX等),預(yù)裝了優(yōu)化的軟件,可以在騰訊 CVM SR1 無需更改即可運(yùn)行推理腳本。鏡像中也提供了圖像分類和對象檢測等示例模型。

原文標(biāo)題:安博士講堂 | 騰訊 Arm 云實(shí)例評測系列 - AI 推理

文章出處:【微信公眾號:安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235365
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217155
  • 騰訊云
    +關(guān)注

    關(guān)注

    0

    文章

    221

    瀏覽量

    17119
  • Ampere
    +關(guān)注

    關(guān)注

    1

    文章

    81

    瀏覽量

    4712

原文標(biāo)題:安博士講堂 | 騰訊 Arm 云實(shí)例評測系列 - AI 推理

文章出處:【微信號:AmpereComputing,微信公眾號:安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    HarmonyOS5服務(wù)技術(shù)分享--函數(shù)創(chuàng)建配置指南

    大家好!今天咱們來一起探索如何在華為HarmonyOS的AGC函數(shù)服務(wù)中創(chuàng)建和配置函數(shù),手把手教你用HTTP觸發(fā)器玩轉(zhuǎn)函數(shù)。無論你是剛?cè)腴T還是想優(yōu)化現(xiàn)有功能,這篇指南都會給你清晰的
    發(fā)表于 05-22 17:08

    華為 Flexus X 實(shí)例服務(wù)器部署即時(shí)通訊 IM 項(xiàng)目

    @TOC ? 寫在前面 手里拿到了一臺 華為 Flexus X 實(shí)例服務(wù)器,部署部署項(xiàng)目試試看看性能怎么樣。正當(dāng)華為 828
    的頭像 發(fā)表于 02-07 10:15 ?409次閱讀
    華為<b class='flag-5'>云</b> Flexus X <b class='flag-5'>實(shí)例</b><b class='flag-5'>云</b>服務(wù)器部署即時(shí)通訊 IM 項(xiàng)目

    華為 Flexus 服務(wù)器 X 實(shí)例 - 選購到創(chuàng)建寶塔

    1.華為 Flexus 服務(wù)器 X 實(shí)例介紹 華為 Flexus 服務(wù)器 X
    的頭像 發(fā)表于 01-08 11:51 ?434次閱讀
    華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X <b class='flag-5'>實(shí)例</b> - 選購到<b class='flag-5'>創(chuàng)建</b>寶塔

    華為 X 實(shí)例的鏡像管理詳解

    部署和遷移業(yè)務(wù)的重要工具。本文將深入探討華為 X 實(shí)例的鏡像管理,介紹鏡像的類型、創(chuàng)建與使用、以及如何進(jìn)行最佳實(shí)踐管理。 1. 什么是
    的頭像 發(fā)表于 01-07 17:01 ?803次閱讀
    華為<b class='flag-5'>云</b> X <b class='flag-5'>實(shí)例</b>的鏡像管理詳解

    深入解析華為 X 實(shí)例保障業(yè)務(wù)安全的關(guān)鍵策略

    前言 在計(jì)算快速發(fā)展的背景下,安全問題一直是企業(yè)過程中關(guān)注的焦點(diǎn)。隨著數(shù)據(jù)遷移至云端,企業(yè)對計(jì)算平臺的安全性能提出了更高要求,特別是如何防止數(shù)據(jù)泄露、網(wǎng)絡(luò)攻擊、以及確保合規(guī)性等
    的頭像 發(fā)表于 01-03 09:25 ?606次閱讀
    深入解析華為<b class='flag-5'>云</b> X <b class='flag-5'>實(shí)例</b>保障<b class='flag-5'>云</b><b class='flag-5'>上</b>業(yè)務(wù)安全的關(guān)鍵策略

    華為 Flexus 服務(wù)器 X 實(shí)例之 openEuler 系統(tǒng)下玩轉(zhuǎn) iSulad 容器技術(shù)

    的靈活性與性能。結(jié)合華為自研的 iSulad 容器技術(shù),用戶能夠在 openEuler 系統(tǒng)享受到更輕量級、更安全的應(yīng)用程序部署體驗(yàn)。本文將帶領(lǐng)讀者深入了解如何在華為 Flexus
    的頭像 發(fā)表于 12-30 14:53 ?541次閱讀
    華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X <b class='flag-5'>實(shí)例</b>之 openEuler 系統(tǒng)下玩轉(zhuǎn) iSulad 容器技術(shù)

    華為 Flexus 服務(wù)器 X 實(shí)例的使用教程

    引言 選擇一款性價(jià)比高、性能強(qiáng)勁的服務(wù)器是 IT 技術(shù)人員常面臨的問題。華為的 Flexus 服務(wù)器 X 實(shí)例是一個(gè)出色的選擇,專為中小企業(yè)和開發(fā)者設(shè)計(jì)。它具備智能感知業(yè)務(wù)負(fù)載的
    的頭像 發(fā)表于 12-30 09:16 ?746次閱讀
    華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X <b class='flag-5'>實(shí)例</b>的使用教程

    華為 Flexus 服務(wù)器 X 實(shí)例之 openEuler 系統(tǒng)下部署 Discuz 論壇網(wǎng)站

    與支持。該實(shí)例不僅提供了靈活可擴(kuò)展的計(jì)算資源,還特別優(yōu)化了對于 openEuler 等開源操作系統(tǒng)的支持,確保用戶能夠享受到更加高效、安全且易于管理的服務(wù)體驗(yàn)。在本文中,我們將探索如何在華為
    的頭像 發(fā)表于 12-30 09:12 ?599次閱讀
    華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X <b class='flag-5'>實(shí)例</b>之 openEuler 系統(tǒng)下部署 Discuz 論壇網(wǎng)站

    華為 Flexus 服務(wù)器 X 實(shí)例:在 openEuler 系統(tǒng)下搭建 MySQL 主從復(fù)制

    前言 本文將介紹如何在華為 Flexus 服務(wù)器 X 實(shí)例,基于 openEuler 系統(tǒng)部署 MySQL 主從復(fù)制。MySQL 作為
    的頭像 發(fā)表于 12-30 09:11 ?501次閱讀
    華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X <b class='flag-5'>實(shí)例</b>:在 openEuler 系統(tǒng)下搭建 MySQL 主從復(fù)制

    基于華為 Flexus 服務(wù)器 X 實(shí)例部搭建 Halo 博客平臺

    前言 在數(shù)字化轉(zhuǎn)型的大潮中,華為 Flexus 服務(wù)器 X 實(shí)例憑借其強(qiáng)勁的性能和高性價(jià)比,成為中小企業(yè)和開發(fā)者理想的選擇。本文將詳細(xì)介紹如何在華為
    的頭像 發(fā)表于 12-26 09:40 ?516次閱讀
    基于華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X <b class='flag-5'>實(shí)例</b>部搭建 Halo 博客平臺

    華為 Flexus 服務(wù)器 X 實(shí)例的購買及使用體驗(yàn)

    價(jià)比服務(wù)。其中,華為 Flexus 服務(wù)器 X 實(shí)例是一款性能強(qiáng)勁的服務(wù)器產(chǎn)品,能夠滿足各種場景的需求。它是一款非常出色的
    的頭像 發(fā)表于 12-24 17:26 ?581次閱讀
    華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X <b class='flag-5'>實(shí)例</b>的購買及使用體驗(yàn)

    GoTo攜手騰訊、阿里推動(dòng)印尼基建與人才培養(yǎng)

    近日,印尼知名科技公司正式宣布與騰訊云和阿里達(dá)成了重要合作協(xié)議,旨在共同推動(dòng)印尼的基礎(chǔ)設(shè)施建設(shè)和數(shù)字人才培養(yǎng)。 根據(jù)此次合作協(xié)議,騰訊
    的頭像 發(fā)表于 11-12 10:45 ?632次閱讀

    印尼GOTO、騰訊與阿里簽署合作協(xié)議

    近日,印尼知名科技公司GOTO與中國的騰訊、阿里正式簽署了合作協(xié)議。此次攜手合作,旨在共同推動(dòng)印尼數(shù)字經(jīng)濟(jì)的發(fā)展,為當(dāng)?shù)仄髽I(yè)提供更加全面、高效的數(shù)字化解決方案。
    的頭像 發(fā)表于 11-11 14:32 ?846次閱讀

    優(yōu)易通無線DTU騰訊通信實(shí)例

    優(yōu)易通無線DTU騰訊通信實(shí)例(基于MQTT)優(yōu)——產(chǎn)品優(yōu),服務(wù)優(yōu),價(jià)格優(yōu)易——安裝易,使用易,維護(hù)易通——通訊技術(shù)專家,精于通訊,萬物互通一、例程環(huán)境1.操作系統(tǒng)Windows10,
    的頭像 發(fā)表于 08-30 11:45 ?699次閱讀
    優(yōu)易通無線DTU<b class='flag-5'>騰訊</b><b class='flag-5'>云</b>通信<b class='flag-5'>實(shí)例</b>

    重塑服務(wù),華為 Flexus X 實(shí)例破解服務(wù)傳統(tǒng)難題

    在數(shù)字化轉(zhuǎn)型的大潮中,計(jì)算不僅是企業(yè)加速變革的引擎,更是其增強(qiáng)競爭力的關(guān)鍵。企業(yè)通過“”能夠迅速響應(yīng)市場變化,從而在激烈的商業(yè)競爭中占據(jù)有利地位。然而,隨著企業(yè)對服務(wù)的依賴日益
    的頭像 發(fā)表于 08-12 09:54 ?850次閱讀
    重塑<b class='flag-5'>云</b>服務(wù),華為<b class='flag-5'>云</b> Flexus X <b class='flag-5'>實(shí)例</b>破解<b class='flag-5'>云</b>服務(wù)傳統(tǒng)難題