一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT的核心算法為何如此強(qiáng)大?

新思科技 ? 來源:未知 ? 2023-03-17 18:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT近期成為了全球話題中心。短短兩個(gè)月,ChatGPT注冊用戶數(shù)已經(jīng)破億,成為史上用戶破億速度最快的軟件之一。它不但可以回答問題,還能寫詩,寫代碼,提供旅游攻略…而ChatGPT的核心結(jié)構(gòu)正是Transformer模型。

Transformer是一種能夠同時(shí)處理所有輸入數(shù)據(jù)的深度學(xué)習(xí)模型,最初是為翻譯和自動問答等自然語言處理應(yīng)用開發(fā)的。計(jì)算機(jī)視覺應(yīng)用領(lǐng)域過去主要采用卷積神經(jīng)網(wǎng)絡(luò)(CNN),現(xiàn)在Transformer模型則更為流行,但它不會取代CNN,而是與之配合來提高視覺處理應(yīng)用的準(zhǔn)確度。

比如,當(dāng)自動駕駛汽車在行駛過程中遇到障礙物,它是如何判斷馬路中間的是人,而不是電線桿呢?自動駕駛汽車的物體檢測和防撞系統(tǒng)必須正確識別前方路況并給車輛發(fā)出相應(yīng)的指令。在現(xiàn)代汽車的計(jì)算機(jī)視覺處理應(yīng)用中,深度學(xué)習(xí)模型就發(fā)揮著重要作用。

除了汽車會采用AI驅(qū)動的計(jì)算機(jī)視覺技術(shù)外,攝像頭如今已經(jīng)在很多系統(tǒng)中都普及開了,手機(jī)和安防系統(tǒng)等大量基于攝像頭的設(shè)備都已經(jīng)在使用神經(jīng)網(wǎng)絡(luò)來提高圖像質(zhì)量和準(zhǔn)確性了。

為何Transformer是嵌入式計(jì)算機(jī)視覺的理想選擇呢?Transformer又將如何改變深度學(xué)習(xí)架構(gòu)的發(fā)展方向?哪些技術(shù)可以優(yōu)化這些模型來獲得更出色的結(jié)果?本文將帶著這些問題與大家共同探討。

更專注的注意力機(jī)制

更好的情景感知

10多年來,CNN一直是視覺處理的首選深度學(xué)習(xí)模型。隨著技術(shù)的不斷發(fā)展,CNN現(xiàn)已能夠準(zhǔn)確地完成圖像分類、物體檢測、語義分割(對圖像中的每個(gè)像素進(jìn)行分組或標(biāo)記)和全景分割(識別物體位置以及對每個(gè)物體中的每個(gè)像素進(jìn)行分組和標(biāo)記)。

但Transformer除了需要將語言塊替換為圖像塊外,不需要任何其他修改就可以在準(zhǔn)確性方面超越CNN。

2017年,Google Research將Transformer定義為一種基于自注意力機(jī)制的新型神經(jīng)網(wǎng)絡(luò)架構(gòu),特別適合用于語言理解。到2020年,Google Research的科學(xué)家們發(fā)表了一篇關(guān)于Vision Transformer(ViT)的文章,ViT是一個(gè)基于原始Transformer架構(gòu)的模型。據(jù)該文章表示,當(dāng)有足夠的數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),ViT表現(xiàn)出了優(yōu)異的性能,超過了先進(jìn)的CNN,而所需的計(jì)算資源卻只有CNN的四分之一。這些Transformer雖然需要龐大的數(shù)據(jù)集進(jìn)行訓(xùn)練,但確實(shí)非常擅于處理圖像分類和物體檢測等視覺任務(wù)。

Transformer之所以能夠在視覺應(yīng)用中游刃有余,其專有的注意力機(jī)制是關(guān)鍵,該機(jī)制讓模型能夠?qū)μ囟ㄇ榫秤懈钊氲睦斫狻ransformer和CNN一樣都可以檢測到前方道路上的物體是行人,而不是電線桿或者一棵樹,但不同的是,Transformer并不會同等處理所有像素,它更多關(guān)注的是數(shù)據(jù)中微小但重要的部分,比如那個(gè)行人,而不太會去過多關(guān)注代表道路其余部分的那些不重要像素。

在處理每幀數(shù)據(jù)時(shí),CNN通常并不會考慮該幀之前和之后的數(shù)據(jù)。而相比CNN,Transformer更擅于學(xué)習(xí)較為復(fù)雜的模式,因此所需的計(jì)算也就更多,所以在速度方面Transformer沒有CNN快,但它也在努力的奮起直追了。

GPU目前可以支持這二種模型,但如果在實(shí)際應(yīng)用中需要以更小的尺寸和更低的功耗來實(shí)現(xiàn)更高的性能,那么NPU或神經(jīng)處理單元等專用AI加速器將會是更好的選擇。

為了提高推理效率,視覺處理應(yīng)用可同時(shí)使用CNN和Transformer。要想實(shí)現(xiàn)全方位視覺感知,僅靠純視覺模型可能無法輕松獲得所需的信息,而多模態(tài)學(xué)習(xí)可以提供更詳盡的視覺信息。此外,Transformer等基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)非常適合像汽車應(yīng)用這種集成了多個(gè)傳感器的應(yīng)用。

利用NPUIP優(yōu)化

Transformer和CNN的性能

Transformer包括以下幾種運(yùn)算:

  • 矩陣乘法

  • 逐元素加法

  • Softmax數(shù)學(xué)函數(shù)

  • L2歸一化

  • 激活函數(shù)

目前大多數(shù)AI加速器都針對CNN進(jìn)行了優(yōu)化,但它們并非全都適合Transformer。Transformer需要龐大的計(jì)算能力來執(zhí)行大量計(jì)算并支持其注意力機(jī)制。

新思科技的ARC NPX6 NPU IP就是一款能夠同時(shí)處理CNN和Transformer的AI加速器。ARC NPX6 NPU IP的計(jì)算單元包括一個(gè)用于矩陣乘法(對這兩種深度學(xué)習(xí)模型都非常重要)的卷積加速器,以及一個(gè)用于處理Transformer運(yùn)算和激活函數(shù)的張量加速器。該IP提供高達(dá)3,500 TOPS的性能和高達(dá)30 TOPS/瓦的出色能效。

設(shè)計(jì)團(tuán)隊(duì)還可以使用新思科技的MetaWare MX開發(fā)工具包來加速其應(yīng)用軟件開發(fā)。該工具包提供了一個(gè)綜合的軟件編程環(huán)境,其中包括神經(jīng)網(wǎng)絡(luò)軟件開發(fā)工具包和對各種虛擬模型的支持。

ChatGPT安全嗎?

在ChatGPT爆火的背后,我們也要知道,ChatGPT或者其他AI軟件所產(chǎn)出的內(nèi)容或做出的決策并不是無懈可擊的。這些工具提供的結(jié)果往往會和現(xiàn)實(shí)有所偏差,而只有人類才能基于現(xiàn)實(shí)去對結(jié)果進(jìn)行檢查和驗(yàn)證。

而且是否會有人利用ChatGPT編寫惡意代碼來進(jìn)行網(wǎng)絡(luò)攻擊呢?自從人類開始編寫代碼以來,開發(fā)人員一直都在無意或者有意地編寫出可被利用的代碼。幸運(yùn)的是,有很多安全測試工具可以幫助開發(fā)者們進(jìn)行安全防護(hù)。無論編碼者是誰,都應(yīng)該使用安全工具掃描源代碼發(fā)現(xiàn)漏洞。

總結(jié)

Transformer擁有強(qiáng)大的計(jì)算能力,且一直在自然語言處理應(yīng)用中被廣泛采用。現(xiàn)在,因Transformer模型基于其注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)擁有更出色的情感感知能力,智能手機(jī)、安防系統(tǒng)、自動駕駛汽車等實(shí)時(shí)視覺處理應(yīng)用也開始采用此模型。以后,各種基于攝像頭的產(chǎn)品會越來越先進(jìn),提供的圖像質(zhì)量也越來越高。在深度學(xué)習(xí)中加入Transformer后,嵌入式視覺攝像頭系統(tǒng)勢必能夠提供更清晰的圖像和更準(zhǔn)確的物體檢測。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 新思科技
    +關(guān)注

    關(guān)注

    5

    文章

    865

    瀏覽量

    51482

原文標(biāo)題:ChatGPT的核心算法為何如此強(qiáng)大?

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    shimetapi:開源RGB+EVS視覺融合相機(jī)事件相機(jī)工具鏈與算法

    的接口控制和算法處理。 一、shimetapi_Hybrid_vision_algo (算法層 SDK) 定位: 這是 SDK 的核心算法處理層,位于架構(gòu)的中間層(黃色部分)。 核心
    的頭像 發(fā)表于 06-26 13:52 ?138次閱讀

    FLIR Si2x系列聲學(xué)成像儀的五大優(yōu)勢

    在防爆行業(yè),安全與效率是企業(yè)運(yùn)營的重中之重,F(xiàn)LIR Si2x系列聲學(xué)成像儀,憑借其卓越的性能和廣泛的應(yīng)用場景,成為了眾多用戶的佳選,那么它為何如此受歡迎呢?
    的頭像 發(fā)表于 06-13 11:29 ?389次閱讀

    交流電機(jī)EMC整改:電磁兼容問題為何成為核心挑戰(zhàn)

    深圳南柯電子|交流電機(jī)EMC整改:電磁兼容問題為何成為核心挑戰(zhàn)
    的頭像 發(fā)表于 05-28 11:19 ?257次閱讀
    交流電機(jī)EMC整改:電磁兼容問題<b class='flag-5'>為何</b>成為<b class='flag-5'>核心</b>挑戰(zhàn)

    電網(wǎng)波動測試為何如此重要?

    電網(wǎng)中常會因雷擊、短路故障、大功率設(shè)備啟動、電網(wǎng)切換或負(fù)載突變等原因,可能會導(dǎo)致如設(shè)備停機(jī)、異常重啟、醫(yī)療設(shè)備斷電危及患者等嚴(yán)重后果,那么該如何避免呢?電網(wǎng)中常會因雷擊、短路故障、大功率設(shè)備啟動、電網(wǎng)切換或負(fù)載突變等原因,出現(xiàn)電壓暫降(Dip)、短時(shí)中斷(Interruption)或電壓波動(Variation),可能會導(dǎo)致如設(shè)備停機(jī)、異常重啟、醫(yī)療設(shè)備斷電
    的頭像 發(fā)表于 03-31 11:40 ?242次閱讀
    電網(wǎng)波動測試<b class='flag-5'>為何如此</b>重要?

    和安信可Ai-M61模組對話?手搓一個(gè)ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    ChatGPT Plus 2025新功能搶先看:如何訂閱與使用全攻略

    您是否想了解2025年ChatGPT Plus的強(qiáng)大功能以及如何輕松訂閱?本文將為您深度剖析ChatGPT Plus的核心功能、獨(dú)特優(yōu)勢,并提供詳細(xì)的訂閱教程。 一、基礎(chǔ)功能再進(jìn)化:更
    的頭像 發(fā)表于 02-13 19:59 ?922次閱讀

    ChatGPT新增實(shí)時(shí)搜索與高級語音功能

    。OpenAI對搜索算法進(jìn)行了深度優(yōu)化,使得ChatGPT能夠在用戶提出問題后,迅速獲取到分鐘級別的最新信息,包括股票、新聞等。這一功能的加入,極大地滿足了用戶對即時(shí)數(shù)據(jù)的需求,使得ChatGPT在各類應(yīng)用場景中更加得心應(yīng)手。
    的頭像 發(fā)表于 12-17 14:08 ?638次閱讀

    OpenAI發(fā)布滿血版ChatGPT Pro

    科技巨頭OpenAI近期宣布了一項(xiàng)重大更新,正式推出了其備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1,旨在為用戶提供更為強(qiáng)大的處理能力和更高質(zhì)量的回答。 據(jù)了解
    的頭像 發(fā)表于 12-06 11:10 ?809次閱讀

    OpenAI推出Windows桌面版ChatGPT應(yīng)用

    Embiricos介紹,這款桌面版ChatGPT應(yīng)用不僅繼承了原有版本的強(qiáng)大功能,還新增了多項(xiàng)實(shí)用特性,旨在讓用戶在不中斷當(dāng)前工作流程的情況下,輕松啟動新的對話或繼續(xù)之前的討論。 該應(yīng)用支持語音交互和圖像識別功能,用戶只需通過簡單的“Alt+空格”組合鍵,即可快速調(diào)用
    的頭像 發(fā)表于 11-18 14:04 ?689次閱讀

    解鎖 GPT-4o!2024 ChatGPT Plus 代升級全攻略(附國內(nèi)支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承諾 Plus 用戶享有更快的響應(yīng)速度、優(yōu)先使用新功能及最新模型,包括強(qiáng)大的 GPT-4o。本文將分享 2024 年 ChatGPT
    的頭像 發(fā)表于 10-29 18:17 ?2453次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建一個(gè)基于ChatGPT的聊天系統(tǒng)是一個(gè)涉及多個(gè)步驟的過程,包括理解ChatGPT的API、設(shè)計(jì)用戶界面、處理數(shù)據(jù)和集成ChatGPT模型。以下是一個(gè)簡化的指南,用于創(chuàng)建一個(gè)基本的聊天系統(tǒng)。 1.
    的頭像 發(fā)表于 10-25 16:23 ?1013次閱讀

    ChatGPT 適合哪些行業(yè)

    ChatGPT 是一種基于人工智能的自然語言處理技術(shù),它能夠理解和生成人類語言。這種技術(shù)在多個(gè)行業(yè)中都有廣泛的應(yīng)用潛力。以下是一些ChatGPT特別適合的行業(yè),以及它在這些行業(yè)中可能的應(yīng)用方式
    的頭像 發(fā)表于 10-25 16:11 ?982次閱讀

    電網(wǎng)中防逆流為何如此重要?

    、可再生能源的廣泛接入,電力逆流現(xiàn)象愈發(fā)頻繁,防逆流裝置的重要性也愈發(fā)凸顯。本文將從防逆流裝置的工作原理、使用場景及其實(shí)際應(yīng)用效果等方面進(jìn)行詳細(xì)闡述。 一、防逆流裝置的工作原理 防逆流裝置的核心在于其內(nèi)置的電力電子元件和控制邏輯
    的頭像 發(fā)表于 09-23 15:31 ?900次閱讀
    電網(wǎng)中防逆流<b class='flag-5'>為何如此</b>重要?

    跨阻放大器的的增益單位是dbΩ,如何如何換算成db?

    跨阻放大器的的增益單位是dbΩ,如何如何換算成db?
    發(fā)表于 08-19 06:28

    空載時(shí)為何OPA454如此發(fā)燙,這個(gè)發(fā)燙是正?,F(xiàn)象嗎?

    Supply voltage, VS = (V+) – (V–) 120 V,是不是意味著我使用(V-)=-12V,(V+)=95V供電是在其允許范圍內(nèi)的?在空載時(shí)為何OPA454如此發(fā)燙,這個(gè)發(fā)燙是正常現(xiàn)象么?
    發(fā)表于 08-02 10:08