一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

加速AI應(yīng)用落地 英特爾AI2.0的進(jìn)階之道

WpOh_rgznai100 ? 來源:yxw ? 2019-07-06 11:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能模型的復(fù)雜度不斷增加,對內(nèi)存的需求也越來越大。深度學(xué)習(xí)的進(jìn)一步發(fā)展需要解決內(nèi)存限制問題,而當(dāng)前的解決方案無法利用所有可用計(jì)算,業(yè)內(nèi)人士逐漸意識(shí)到需要專用芯片來支持深度學(xué)習(xí)訓(xùn)練和推理。

英特爾則在人工智能方面提供優(yōu)越的硬件選擇,并通過軟件來最大化釋放硬件的性能,從而幫助客戶無論是數(shù)據(jù)多么復(fù)雜或位于哪里都可以自如運(yùn)行AI應(yīng)用。

7月3日-4日,在百度AI開發(fā)者大會(huì)上,英特爾公司副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理Naveen Rao宣布,英特爾正與百度合作開發(fā)英特爾? Nervana?神經(jīng)網(wǎng)絡(luò)訓(xùn)練處理器(NNP-T)。這一合作包括全新定制化加速器,以實(shí)現(xiàn)極速訓(xùn)練深度學(xué)習(xí)模型的目的。

此次NNP-T是一類全新開發(fā)的高效深度學(xué)習(xí)系統(tǒng)硬件,能夠加速大規(guī)模的分散訓(xùn)練。與百度的密切合作能夠確保英特爾開發(fā)部門始終緊跟客戶對訓(xùn)練硬件的最新需求。

從2016年起,英特爾便一直針對英特爾?至強(qiáng)?可擴(kuò)展處理器優(yōu)化百度飛槳(PaddlePaddle*)深度學(xué)習(xí)框架。如今,通過為百度飛槳優(yōu)化NNP-T,雙方能夠?yàn)閿?shù)據(jù)科學(xué)家提供更多的硬件選擇。

與此同時(shí),英特爾還通過更多技術(shù)來進(jìn)一步增強(qiáng)這些AI解決方案的性能。例如,憑借英特爾傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存所提供的更高內(nèi)存性能,百度能夠通過其Feed Stream*(信息流)服務(wù)向數(shù)百萬用戶提供個(gè)性化移動(dòng)內(nèi)容,并通過百度AI推薦引擎獲得更高效的客戶體驗(yàn)。

此外,鑒于數(shù)據(jù)安全對于用戶極其重要,英特爾還與百度共同致力于打造基于英特爾軟件保護(hù)擴(kuò)展(SGX)技術(shù)的MesaTEE*——內(nèi)存安全功能即服務(wù)(FaaS)計(jì)算框架。

Naveen Rao表示:“未來幾年,AI模型的復(fù)雜性以及對大規(guī)模深度學(xué)習(xí)計(jì)算的需求將爆發(fā)式增長。英特爾和百度將延續(xù)雙方十多年的合作并聚焦于聯(lián)合設(shè)計(jì)和開發(fā)全新的硬件以及配套軟件,從而向‘AI 2.0’的新疆界不斷邁進(jìn)?!?/p>

而在英特爾分論壇上,英特爾及其合作伙伴分別就邊緣計(jì)算、百度超級(jí)計(jì)算平臺(tái)的軟硬件優(yōu)化、英特爾 DL Boost、百度海洋引擎與英特爾SGX的合作、愛奇藝在OpenVINO?上的AI實(shí)踐以及英特爾AEP的分布式系統(tǒng)在AI訓(xùn)練和數(shù)據(jù)處理上的實(shí)踐等方面的技術(shù)細(xì)節(jié)進(jìn)行了探討。我們將從以下四個(gè)演講中闡釋英特爾取得的主要進(jìn)展。

英特爾DL Boost的至強(qiáng)云端深度學(xué)習(xí)推理優(yōu)化實(shí)踐

英特爾DL Boost是一套旨在加快人工智能深度學(xué)習(xí)速度的處理器技術(shù)。英特爾人工智能資深架構(gòu)師姚偉峰講述了利用英特爾DL Boost的至強(qiáng)云端深度學(xué)習(xí)推理優(yōu)化實(shí)踐。

DL Boost基于AVX-512擴(kuò)展新的矢量神經(jīng)網(wǎng)絡(luò)指令集,性能提升是數(shù)量級(jí)的,具有更好的TCO,為終端用戶提供更一致性的體驗(yàn)。他指出,英特爾 DL Boost VNNI就是為加速深度學(xué)習(xí)推理任務(wù)而生。他還從圖優(yōu)化、量化、算子優(yōu)化三方面詳細(xì)講解了XEON深度學(xué)習(xí)推理優(yōu)化。

英特爾MKL-DNN優(yōu)化的深度學(xué)習(xí)框架和OpenVINO?

英特爾軟件產(chǎn)品開發(fā)部、資深A(yù)I 技術(shù)咨詢工程師胡英以英特爾MKL-DNN優(yōu)化的深度學(xué)習(xí)框架為主講述了如何利用英特爾AI軟件工具加速深度學(xué)習(xí)。

英特爾MKL-DNN是一個(gè)開源的、性能強(qiáng)化的函數(shù)庫,用于加速在CPU上的深度學(xué)習(xí)框架,包含高度矢量化和線程化的構(gòu)建模塊,支持利用C和C++接口實(shí)施卷積神經(jīng)網(wǎng)絡(luò)。

英特爾MKL-DNN主要在以下對象上運(yùn)行:基元、引擎和流。庫文檔對這些對象的定義如下所示:

基元——任何操作,包括卷積、數(shù)據(jù)格式重新排序和內(nèi)存。基元可以以其他基元為輸入,但是智能輸出內(nèi)存基元。

引擎——一種執(zhí)行設(shè)備,如CPU。每個(gè)基元都映射為特定的引擎。

流——一種執(zhí)行環(huán)境,將基元提交至流后等待完成。提交至流的基元可能有不同的引擎。流對象也可以跟蹤基元間的相關(guān)性。

OpenVINO是英特爾基于自身現(xiàn)有的硬件平臺(tái)開發(fā)的一種可以加快高性能計(jì)算機(jī)視覺和深度學(xué)習(xí)視覺應(yīng)用開發(fā)速度工具套件,支持各種英特爾平臺(tái)的硬件加速器上進(jìn)行深度學(xué)習(xí),并且允許直接異構(gòu)執(zhí)行。 支持在Windows與Linux系統(tǒng),使用Python/C++語言。

OpenVINO工具包主要包括兩個(gè)核心組件,模型優(yōu)化器和推理引擎。

OpenVINO的主要特點(diǎn)有:

在英特爾平臺(tái)上提升計(jì)算機(jī)視覺相關(guān)深度學(xué)習(xí)性能達(dá)19倍以上

解除CNN-based的網(wǎng)絡(luò)在邊緣設(shè)備的性能瓶頸

對OpenCV,OpenXV*視覺庫的傳統(tǒng)API實(shí)現(xiàn)加速與優(yōu)化

基于通用API接口在CPU、GPU、FPGA等設(shè)備上運(yùn)行加上

愛奇藝在OpenVINO?上的AI實(shí)踐

軟件工具包OpenVINO,專為在邊緣部署深度神經(jīng)網(wǎng)絡(luò)而設(shè)計(jì),廣泛支持各種框架,只需編寫一次,可擴(kuò)展到不同加速器上使用,使邊緣AI實(shí)現(xiàn)高性能、高效率。

借助英特爾OpenVINO工具包,能夠幫助開發(fā)人員加快深度神經(jīng)網(wǎng)絡(luò)推理應(yīng)用的開發(fā),支持深度神經(jīng)網(wǎng)絡(luò)測試、調(diào)整和原型制作,可以幫助開發(fā)者進(jìn)入實(shí)際應(yīng)用的量產(chǎn)階段。

愛奇藝助理研究員虞科華分享了他們在OpenVINO上的AI應(yīng)用開發(fā)的相關(guān)實(shí)踐 。首先是應(yīng)用開發(fā)方法主要包括三點(diǎn):

訓(xùn)練模型:固化模型

模型優(yōu)化:圖分割、客制化層、 客制化子圖

推理引擎:模型級(jí)聯(lián)計(jì)算、多輸入尺寸設(shè)計(jì)、自動(dòng)評估CPU端執(zhí)行特征

另外,虞科華指出OpenVINO FPGA后端實(shí)踐主要包括兩方面:1推理引擎: 異構(gòu)Plugin、 異構(gòu)執(zhí)行分析;性能分析:Bitstream精度、異構(gòu)Affinity設(shè)置、流水線化。

OpenVINO目前在愛奇藝的落地服務(wù)主要有AI雷達(dá)、圖文審核、視頻標(biāo)簽、圖片審核等。

百度計(jì)算平臺(tái)的軟硬件優(yōu)化

作為英特爾重要的合作方,百度AI系統(tǒng)架構(gòu)師丁瑞全介紹了在百度大規(guī)模分布式訓(xùn)練系統(tǒng)中與英特爾在軟硬件優(yōu)化方面的合作。

在系統(tǒng)設(shè)計(jì)上,百度超級(jí)AI計(jì)算平臺(tái)X-MAN與英特爾進(jìn)行合作共同推動(dòng)OAI & OAM全球標(biāo)準(zhǔn)定義。

軟硬件聯(lián)合優(yōu)化方面主要包括四個(gè)方面。IO優(yōu)化,百度Fast-F共享并行文件系統(tǒng),同時(shí)基于英特爾 SPDK,為AI場景海量小文件而優(yōu)化;預(yù)處理優(yōu)化,通過預(yù)取 + 硬件Offload + 均衡CPU與AI加速卡配比的方式進(jìn)行合作;數(shù)據(jù)下發(fā)優(yōu)化,增加下行鏈路 + 避免沖突;前后向計(jì)算優(yōu)化,自動(dòng)混合精度 (AMP) +大顯存增大batch size 英特爾 AI芯片可支持bfloat16*, 其動(dòng)態(tài)范圍相比float16 的更大液冷+48V供電 支持計(jì)算性能更強(qiáng)的芯片;通信優(yōu)化,軟件算法優(yōu)化以及英特爾 SCR* ICL支持多機(jī)互聯(lián)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19893

    瀏覽量

    235181
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10196

    瀏覽量

    174679
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35137

    瀏覽量

    279798
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122794

原文標(biāo)題:加速AI應(yīng)用落地,英特爾AI 2.0的進(jìn)階之道

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    2025年3月,英偉達(dá)發(fā)布了DGX B300 AI加速計(jì)算平臺(tái)。2025年5月,英特爾發(fā)布了三款全新英特爾至強(qiáng)6性能核處理器,其中一款6776P被用作是DGX B300的主控CPU,這
    的頭像 發(fā)表于 06-27 11:44 ?180次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強(qiáng)6助力<b class='flag-5'>AI</b>系統(tǒng)高效運(yùn)轉(zhuǎn)

    英特爾發(fā)布邊緣AI控制器與邊緣智算一體機(jī),創(chuàng)造“AI新視界”

    處理器的邊緣 AI 控制器 和 基于英特爾銳炫 ? 顯卡的邊緣智算一體機(jī) ,為工業(yè)AI的規(guī)模化落地注入強(qiáng)勁動(dòng)力。 英特爾與諾達(dá)佳聯(lián)合發(fā)布邊緣
    發(fā)表于 06-24 17:50 ?958次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布邊緣<b class='flag-5'>AI</b>控制器與邊緣智算一體機(jī),創(chuàng)造“<b class='flag-5'>AI</b>新視界”

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    CTO、高級(jí)首席AI工程師張宇博士 英特爾客戶端計(jì)算事業(yè)部邊緣計(jì)算CTO、高級(jí)首席AI工程師張宇博士在MWC AI終端峰會(huì)上指出,邊緣將崛起為AI
    的頭像 發(fā)表于 06-20 17:32 ?337次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——
    的頭像 發(fā)表于 05-21 00:57 ?5934次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——
    的頭像 發(fā)表于 05-20 12:27 ?4455次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準(zhǔn)專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1514次閱讀

    英特爾借助開放生態(tài)系統(tǒng),加速邊緣AI創(chuàng)新

    的集成,這些解決方案精簡并加速AI在邊緣的應(yīng)用,包括在零售、制造、智慧城市、媒體和娛樂等行業(yè)的部署。 英特爾公司副總裁兼邊緣計(jì)算事業(yè)部總經(jīng)理Dan Rodriguez表示:“我們的客戶希望在現(xiàn)有邊緣基礎(chǔ)設(shè)施和工作流程中擴(kuò)展
    發(fā)表于 03-21 11:31 ?168次閱讀
    <b class='flag-5'>英特爾</b>借助開放生態(tài)系統(tǒng),<b class='flag-5'>加速</b>邊緣<b class='flag-5'>AI</b>創(chuàng)新

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理器和英特爾Gaudi 2D AI
    的頭像 發(fā)表于 12-03 11:20 ?594次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    加速器等先進(jìn)硬件。此外,它還結(jié)合了OPEA開放軟件平臺(tái),確保了方案的靈活性和兼容性。 作為該方案的首個(gè)落地實(shí)踐,英特爾攜手新華三共同發(fā)布了新華三AIGC靈犀一體機(jī)。這款一體機(jī)充分利用了英特爾
    的頭像 發(fā)表于 12-02 10:48 ?919次閱讀

    英特爾計(jì)劃明年AI PC出貨一億臺(tái)

    英特爾設(shè)定明年AI PC出貨目標(biāo)為一億臺(tái),較2024年原定計(jì)劃激增150%   英特爾銷售與營銷部總監(jiān)Jack Huang于10月28日透露,公司計(jì)劃在明年實(shí)現(xiàn)一億臺(tái)AI PC的
    的頭像 發(fā)表于 10-31 14:26 ?887次閱讀

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨(dú)立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當(dāng)前消費(fèi)者對汽車內(nèi)部配備更多屏幕、獲得更高清晰度等AI座艙體驗(yàn)需求。 英特爾副總裁、汽車事業(yè)部總經(jīng)理
    的頭像 發(fā)表于 10-30 16:26 ?437次閱讀

    英特爾攜手百度智能云加速AI落地

    在2024年9月25日-26日舉辦的2024百度云智大會(huì)上,作為大會(huì)的聯(lián)合主辦方,英特爾帶來了AI全棧軟硬件方案,深入講解了如何基于英特爾 至強(qiáng) 處理器和新一代極具性價(jià)比的加速卡高效地
    的頭像 發(fā)表于 10-12 10:08 ?854次閱讀

    Inflection AI攜手英特爾推出企業(yè)級(jí)AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項(xiàng)重大合作——推出基于英特爾Gaudi 3 AI
    的頭像 發(fā)表于 10-09 16:40 ?753次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計(jì)的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門型號(hào)H100與H200 GPU,但英特爾巧妙地將競爭優(yōu)勢聚焦于其更為親民的價(jià)格與總擁有成
    的頭像 發(fā)表于 09-26 16:16 ?1188次閱讀

    從運(yùn)動(dòng)員到開發(fā)者: 英特爾以開放式AI系統(tǒng)應(yīng)對多重挑戰(zhàn)

    打造的生成式AI(GenAI)檢索增強(qiáng)生成(RAG)解決方案。該成果深度展示了英特爾如何通過基于英特爾?至強(qiáng)?處理器和英特爾??Gaudi AI
    的頭像 發(fā)表于 07-25 09:28 ?538次閱讀
    從運(yùn)動(dòng)員到開發(fā)者: <b class='flag-5'>英特爾</b>以開放式<b class='flag-5'>AI</b>系統(tǒng)應(yīng)對多重挑戰(zhàn)