多模態(tài)數(shù)據(jù)融合深度學習模型的典型深度架構研究

1 介紹

我們對世界的體驗是多模態(tài)的 —— 我們看到物體，聽到聲音，感覺到質地，聞到氣味，嘗到味道。模態(tài)是指某件事發(fā)生或經歷的方式，當一個研究問題包含多個模態(tài)時，它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進展，它需要能夠同時解釋這些多模態(tài)的信號。

例如，圖像通常與標簽和文本解釋相關聯(lián)，文本包含圖像，以更清楚地表達文章的中心思想。不同的模態(tài)具有非常不同的統(tǒng)計特性。這些數(shù)據(jù)被稱為多模態(tài)大數(shù)據(jù)，包含豐富的多模態(tài)和跨模態(tài)信息，對傳統(tǒng)的數(shù)據(jù)融合方法提出了巨大的挑戰(zhàn)。

在這篇綜述中，我們會介紹一些開創(chuàng)性的深度學習模型來融合這些多模態(tài)大數(shù)據(jù)。隨著對多模態(tài)大數(shù)據(jù)的探索越來越多，仍有一些挑戰(zhàn)需要解決。因此，本文對多模態(tài)數(shù)據(jù)融合的深度學習進行了綜述，旨在為讀者（無論其原始社區(qū)如何）提供多模態(tài)深度學習融合方法的基本原理，并激發(fā)深度學習的新型多模態(tài)數(shù)據(jù)融合技術。

通過多模態(tài)深度學習，結合不同的模態(tài)或信息類型來提高效果，從直觀上看是一項很有吸引力的任務，但在實踐中，如何結合不同的噪聲水平和模態(tài)之間的沖突是一個挑戰(zhàn)。此外，模型對預測結果有不同的定量影響。在實踐中最常見的方法是將不同輸入的高級嵌入連接起來，然后應用softmax。

這種方法的問題是，它將給予所有子網絡/模式同等的重要性，這在現(xiàn)實情況中是非常不可能的。這里需要采用子網絡的加權組合，以便每個輸入模態(tài)可以對輸出預測有一個學習貢獻(Theta)。

2 具有代表性的深度學習架構? ?

在本節(jié)中，我們將介紹多模態(tài)數(shù)據(jù)融合深度學習模型的代表性深度學習架構。具體而言，給出了深度架構的定義、前饋計算和反向傳播計算，以及典型的變體。表1總結了代表性模型。

表1：代表性深度學習模型摘要。

2.1 深度信念網絡（DBN） ?

受限玻爾茲曼機（RBM）是深度信念網的基本塊（Zhang， Ding， Zhang， & Xue， 2018;Bengio，2009 年）。RBM是玻爾茲曼機的特殊變體（見圖1）。它由可見層和隱藏層組成;可見層的單元與隱藏層的單元之間存在全連接連接，但同一層中的單元之間沒有連接。RBM 也是一個生成圖形模型，它使用能量函數(shù)以捕獲可見單元和隱藏單元之間的概率分布.

最近，有人提出了一些先進的RBM來提高性能。例如，為了避免網絡過度擬合，Chen， Zhang， Yeung， and Chen （2017）設計了稀疏玻爾茲曼機，該機基于分層潛在樹學習網絡結構。Ning， Pittman， and Shen （2018）將快速對比發(fā)散算法引入 RBM，其中基于邊界的濾波和 delta 積用于減少計算中的冗余點積計算。為了保護多維數(shù)據(jù)的內部結構，Ju et al. （ 2019）提出了張量 RBM，學習隱藏在多維數(shù)據(jù)中的高級分布，其中使用張量分解來避免維災難。

DBM是一種典型的深度架構，由多個RBM堆疊而成（Hinton&Salakhutdinov，2006）。它是一種基于預訓練和微調訓練策略，可以利用能量來捕捉可見物體與相應標簽之間的關節(jié)分布的生成模型。在預訓練中，每個隱藏層都被貪婪地建模為在無監(jiān)督策略中訓練的 RBM。之后，通過監(jiān)督策略中訓練標簽的判別信息進一步訓練每個隱藏層。DBN 已被用于解決許多領域的問題，例如數(shù)據(jù)降維、表示學習和語義哈希。具有代表性的 DBM 如圖 1 所示。

圖 1：

2.2 堆疊式自動編碼器（SAE） ?

堆疊式自動編碼器（SAE）是編碼器-解碼器架構的典型深度學習模型（Michael，Olivier和Mario，2018;翁，盧，譚，和周，2016）。它可以通過以無監(jiān)督-監(jiān)督方式將原始輸入轉換為中間表示來捕獲輸入的簡潔特征。SAE已廣泛應用于許多領域，包括降維（Wang，Yao，&Zhao，2016），圖像識別（Jia，Shao，Li，Zhao，&Fu，2018）和文本分類（Chen&Zaki，2017）。圖 2 展示了具有代表性的 SAE。 ? ?

圖2：

2.3 卷積神經網絡（CNN） ?

DBN 和 SAE 是完全連接的神經網絡。在這兩個網絡中，隱藏層中的每個神經元都連接到前一層的每個神經元，這種拓撲結構會產生大量連接。為了訓練這些連接的權重，全連接的神經網絡需要大量的訓練對象來避免過度擬合和欠擬合，這是計算密集型的。此外，全連接拓撲不考慮神經元之間所包含的特征的位置信息。因此，完全連接的深度神經網絡（DBN、SAE及其變體）無法處理高維數(shù)據(jù)，尤其是大圖像和大音頻數(shù)據(jù)。

卷積神經網絡是一種特殊的深度網絡，它考慮了數(shù)據(jù)的局部拓撲結構（Li， Xia， Du， Lin， & Samat， 2017;Sze，Chen，Yang和Emer，2017）。卷積神經網絡包括全連接網絡和包含卷積層和池化層的約束網絡。約束網絡使用卷積和池化運算來實現(xiàn)局部感受野和參數(shù)約簡。與 DBN 和 SAE 一樣，卷積神經網絡也通過隨機梯度下降算法進行訓練。它在醫(yī)學圖像識別（Maggiori，Tarabalka，Charpiat和Alliez，2017）和語義分析（胡，Lu，Li，&Chen，2014）方面取得了很大進展。具有代表性的 CNN 如圖 3 所示。

圖 3： ? ?

2.4 循環(huán)神經網絡（RNN） ?

遞歸神經網絡是一種處理串行數(shù)據(jù)的神經計算架構（Martens & Sutskever， 2011;Sutskever，Martens和Hinton，2011）。與深度前向架構（即DBN，SAE和CNN）不同，它不僅將輸入模式映射到輸出結果，而且還通過利用隱藏單元之間的連接將隱藏狀態(tài)傳輸?shù)捷敵觯℅raves&Schmidhuber，2008）。通過使用這些隱藏的連接，RNN 對時間依賴性進行建模，從而在時間維度上共享對象之間的參數(shù)。它已被應用于各個領域，如語音分析（Mulder，Bethard和Moens，2015），圖像標題（Xu等人，2015）和語言翻譯（Graves&Jaitly，2014），取得了出色的性能。與深度前向架構類似，其計算也包括前向傳遞和反向傳播階段。在前向傳遞計算中，RNN 同時獲取輸入和隱藏狀態(tài)。在反向傳播計算中，它使用時間反向傳播算法來反向傳播時間步長的損耗。圖 4 顯示了具有代表性的 RNN。 ? ?

圖 4：

3 面向多模態(tài)數(shù)據(jù)融合的深度學習? ?

在本節(jié)中，我們從模型任務、模型框架和評估數(shù)據(jù)集的角度回顧了最具代表性的多模態(tài)數(shù)據(jù)融合深度學習模型。根據(jù)所使用的深度學習架構，它們分為四類。表2總結了具有代表性的多模態(tài)深度學習模型。

表2：

代表性多模態(tài)深度學習模型摘要.

3.1 基于網絡的深度信念多模態(tài)數(shù)據(jù)融合 ?

3.1.1 示例1 ?

Srivastava 和 Salakhutdinov （2012）提出了一種基于深度玻爾茲曼學習模型的多模態(tài)生成模型，通過擬合多模態(tài)數(shù)據(jù)在各種模態(tài)（如圖像、文本和音頻）上的聯(lián)合分布來學習多模態(tài)表示。

所提出的多模態(tài)DBN的每個模塊均采用無監(jiān)督逐層方式進行初始化，并采用基于MCMC的近似方法進行模型訓練。 ? ?

為了評估學習到的多模態(tài)表示，執(zhí)行了大量的任務，例如生成缺失模態(tài)任務、推斷聯(lián)合表示任務和判別任務。實驗驗證了學習到的多模態(tài)表示是否滿足所需的屬性。

3.1.2 示例2 ?

為了在早期有效診斷阿爾茨海默病，Suk、Lee、Shen和阿爾茨海默病神經影像學計劃（2014）提出了一種多模態(tài)玻爾茲曼模型，該模型可以融合多模態(tài)數(shù)據(jù)中的互補知識。具體來說，為了解決淺層特征學習方法造成的局限性，DBN用于通過將特定領域的表示轉移到分層抽象表示來學習每個模態(tài)的深度表示。然后，在串聯(lián)向量上構建單層 RBM，該向量是來自每個模態(tài)的分層抽象表示的線性組合。它用于通過構建不同多模態(tài)特征的聯(lián)合分布來學習多模態(tài)表示。最后，根據(jù)三種典型診斷對ADNI數(shù)據(jù)集對所提出的模型進行了廣泛的評估，實現(xiàn)了最先進的診斷準確性。

3.1.3 示例3 ?

為了準確估計人類姿勢，Ouyang， Chu， and Wang （2014）設計了一個多源深度學習模型，該模型通過提取高階空間中身體模式的聯(lián)合分布，從混合類型、外觀得分和變形模態(tài)中學習多模態(tài)表示。在人-姿態(tài)多源深度模型中，從圖像結構模型中提取了三種廣泛使用的模態(tài)，這些模型基于條件隨機場理論組合了身體的各個部位。為了獲得多模態(tài)數(shù)據(jù)，通過線性支持向量機對圖形結構模型進行訓練。之后，這三個特征中的每一個都被輸入到一個兩層受限玻爾茲曼模型中，以從特定于特征的表示中捕獲高階姿態(tài)空間的抽象表示。通過無監(jiān)督初始化，每個特定模態(tài)的受限玻爾茲曼模型都會捕獲全局空間的固有表示。然后，使用RBM進一步學習基于高級混合類型、外觀得分和變形表示的串聯(lián)向量的人體姿態(tài)表示。為了訓練所提出的多源深度學習模型，設計了一個同時考慮身體位置和人體檢測的任務特定目標函數(shù)。所提出的模型在LSP、PARSE和UIUC上進行了驗證，并產生了高達8.6%的改進。 ? ?

最近，人們提出了一些新的基于DBN的多模態(tài)特征學習模型。例如，Amer、Shields、Siddiquie 和 Tamrakar （ 2018）提出了一種用于序列事件檢測的混合方法，其中采用條件 RBM 來提取具有附加判別標簽信息的模態(tài)和跨模態(tài)特征。Al-Waisy、Qahwaji、Ipson 和 Al-Fahdawi （ 2018）引入了一種識別人臉的多模態(tài)方法。在這種方法中，使用基于DBN的模型對Curvelet變換捕獲的局部手工特征的多模態(tài)分布進行建模，可以合并局部特征和深度特征的優(yōu)勢（Al-Waisy等人，2018）。

3.1.4 小結 ?

這些基于DBN的多模態(tài)模型使用概率圖形網絡將特定于模態(tài)的表示轉換為共享空間中的語義特征。然后，根據(jù)共享空間的特征對模態(tài)上的聯(lián)合分布進行建模。這些基于DBN的多模態(tài)模型在無監(jiān)督、半監(jiān)督和監(jiān)督學習策略中更加靈活和穩(wěn)健。它們非常適合捕獲輸入數(shù)據(jù)的信息特征。然而，他們忽略了多模態(tài)數(shù)據(jù)的空間和時間拓撲結構。

3.2 基于堆疊自編碼器的多模態(tài)數(shù)據(jù)融合 ?

3.2.1 示例4 ? ?

Ngiam et al. （2011）提出的多模態(tài)深度學習是基于堆疊自編碼器（SAE）的多模態(tài)數(shù)據(jù)融合最具代表性的深度學習模型。這種深度學習模型旨在解決兩個數(shù)據(jù)融合問題：跨模態(tài)和共享模態(tài)表征學習。前者旨在利用來自其他模態(tài)的知識來捕捉更好的單模態(tài)表示，而后者則在中級學習模態(tài)之間的復雜相關性。為了實現(xiàn)這些目標，設計了三種學習場景——多模態(tài)、跨模態(tài)和共享模態(tài)學習，如表 3 和圖 6 所示。

圖 6：

多模態(tài)、跨模態(tài)和共享模態(tài)學習的架構。

表3：? ?多模態(tài)學習的設置。

在多模態(tài)學習場景中，音頻頻譜圖和視頻幀以線性方式連接成向量。將串聯(lián)向量饋入稀疏受限玻爾茲曼機（SRBM），以學習音頻和視頻之間的相關性。該模型只能學習多個模態(tài)的陰影聯(lián)合表示，因為相關性隱含在原始級別的高維表示中，而單層 SRBM 無法對它們進行建模。受此啟發(fā)，中級表示的串聯(lián)向量被輸入到 SRBM 中，以模擬多個模態(tài)的相關性，從而顯示出更好的性能。

在跨模態(tài)學習場景中，提出了一種深度堆疊多模態(tài)自編碼器來顯式學習模態(tài)之間的相關性。具體來說，音頻和視頻都作為特征學習中的輸入呈現(xiàn)，在監(jiān)督訓練和測試中，只有其中一個被輸入到模型中。該模型以多模態(tài)學習的方式進行初始化，能夠很好地模擬跨模態(tài)關系。

在共享模態(tài)表示中，在去噪自編碼器的激勵下，引入了特定于模態(tài)的深度堆疊多模態(tài)自編碼器，以探索模態(tài)之間的聯(lián)合表示，尤其是在缺少一個模態(tài)時。通過將其中一個模態(tài)替換為零而擴大的訓練數(shù)據(jù)集被輸入到特征學習的模型中。 ? ?

最后，在CUAVE和AVLetters數(shù)據(jù)集上進行了詳細的實驗，以評估多模態(tài)深度學習在特定任務特征學習中的性能。

3.2.2 示例5 ?

為了從一系列圖像（尤其是視頻）中生成視覺和語義上有效的人體骨骼，Hong，Yu，Wan，Tao和Wang（2015）提出了一種多模態(tài)深度自動編碼器來捕獲圖像和姿勢之間的融合關系。特別是，所提出的多模態(tài)深度自編碼器通過三階段策略進行訓練，以構建二維圖像和三維姿態(tài)之間的非線性映射。在特征融合階段，利用多視圖超圖低秩表示，基于流形學習，從一系列圖像特征（如定向梯度直方圖和形狀上下文）構建內部二維表示。在第二階段，訓練單層自動編碼器來學習抽象表示，該抽象表示用于通過重建二維圖像間特征來恢復三維姿態(tài)。同時，以類似的方式訓練單層自動編碼器，以學習三維姿勢的抽象表示。在獲得每個單一模態(tài)的抽象表示后，使用神經網絡通過最小化兩個模態(tài)互表示之間的平方歐幾里得距離來學習二維圖像和三維姿態(tài)之間的多模態(tài)相關性。所提出的多模態(tài)深度自編碼器的學習由初始化和微調階段組成。在初始化中，從相應的自編碼器和神經網絡復制多模態(tài)深度自編碼器每個子部分的參數(shù)。然后，通過隨機梯度下降算法對整個模型的參數(shù)進行進一步微調，從相應的二維圖像中構造出三維姿態(tài)。

3.2.3 小結 ?

基于SAE的多模態(tài)模型采用編碼器-解碼器架構，通過無監(jiān)督方式通過重構方法提取內在的模態(tài)特征和跨模態(tài)特征。由于它們基于SAE，這是一個完全連接的模型，因此需要訓練許多參數(shù)。此外，他們忽略了多模態(tài)數(shù)據(jù)中的空間和時間拓撲結構。

3.3 基于卷積神經網絡的多模態(tài)數(shù)據(jù)融合 ?

3.3.1 示例 6 ?

為了模擬圖像和句子之間的語義映射分布，馬，Lu，Shang和Li（2015）提出了一個多模態(tài)卷積神經網絡。為了充分捕捉語義相關性，在端到端架構中設計了三級融合策略——詞級、階段級和句子級。該架構由影像子網、匹配子網和多模態(tài)子網組成。圖像子網是一個具有代表性的深度卷積神經網絡，例如Alexnet和Inception，它有效地將圖像輸入編碼為簡潔的表示。匹配子網對將圖像內容與語義空間中句子的單詞片段相關聯(lián)的聯(lián)合表示進行建模。 ? ?

3.3.2 示例 7 ?

為了將視覺識別系統(tǒng)擴展到無限數(shù)量的離散類別，F(xiàn)rome等人（2013）通過利用文本數(shù)據(jù)中的語義信息提出了一種多模態(tài)卷積神經網絡。該網絡由語言子模型和視覺子模型組成。語言子模型基于skip-gram模型，該模型可以將文本信息傳輸?shù)秸Z義空間的密集表示中。視覺子模型是一個具有代表性的卷積神經網絡，例如 Alexnet，它在 1000 類 ImageNet 數(shù)據(jù)集上進行預訓練以捕獲視覺特征。為了對圖像和文本之間的語義關系進行建模，語言和視覺子模型通過線性投影層進行組合。每個子模型都由每個模態(tài)的參數(shù)初始化。之后，為了訓練這種視覺語義多模態(tài)模型，提出了一種新的損失函數(shù)，通過結合點積相似度和鉸鏈秩損失，可以為正確的圖像和標簽對提供高相似性分數(shù)。該模型可以在 ImageNet 數(shù)據(jù)集上產生最先進的性能，避免語義上不合理的結果。 ? ?

3.3.3 小結 ?

基于CNN的多模態(tài)模型可以通過局部字段和池化操作來學習模態(tài)之間的局部多模態(tài)特征。它們顯式地對多模態(tài)數(shù)據(jù)的空間拓撲進行建模。而且它們不是參數(shù)數(shù)量大大減少的完全連接模型。

3.4 基于遞歸神經網絡的多模態(tài)數(shù)據(jù)融合 ?

3.4.1 示例 8 ?

為了生成圖像的標題，毛等人（2014）提出了一種多模態(tài)遞歸神經架構。這種多模態(tài)遞歸神經網絡可以彌合圖像和句子之間的概率相關性。它解決了以前工作無法生成新圖像標題的局限性，因為以前的工作根據(jù)學習的圖像-文本映射在句子數(shù)據(jù)庫中檢索相應的標題。與以前的工作不同，多模態(tài)遞歸神經模型（MRNN）根據(jù)給定的單詞和圖像學習語義空間上的聯(lián)合分布。當圖像出現(xiàn)時，它會根據(jù)捕獲的聯(lián)合分布逐字生成句子。具體來說，多模態(tài)遞歸神經網絡由語言子網、視覺子網和多模態(tài)子網組成，如圖 7 所示。語言子網由兩層詞嵌入部分和單層循環(huán)神經部分組成，前者捕獲有效的特定任務表示，后者對句子的時間依賴性進行建模。視覺子網本質上是一個深度卷積神經網絡，如Alexnet、Resnet或Inception，它將高維圖像編碼為緊湊的表示。最后，多模態(tài)子網是一個隱藏網絡，它對學習語言和視覺表示的聯(lián)合語義分布進行建模。

圖 7：

3.4.2 示例 9 ?

為了解決當前視覺識別系統(tǒng)無法一目了然地生成圖像豐富描述的局限性，通過橋接視覺和文本數(shù)據(jù)之間的模態(tài)間關系，提出了一種多模態(tài)對齊模型（Karpathy&Li，2017）。為了實現(xiàn)這一點，提出了一個雙重方案。首先，設計了一個可視化語義嵌入模型來生成多模態(tài)訓練數(shù)據(jù)集。然后，在此數(shù)據(jù)集上訓練多模態(tài) RNN，以生成圖像的豐富描述。

在視覺語義嵌入模型中，區(qū)域卷積神經網絡用于獲取豐富的圖像表示，這些圖像表示包含與句子相對應的內容的足夠信息。然后使用雙向 RNN 將每個句子編碼為具有圖像表示的相同維度的密集向量。此外，還給出了一個多模態(tài)評分函數(shù)來衡量圖像和句子之間的語義相似性。最后，利用馬爾可夫隨機場方法生成多模態(tài)數(shù)據(jù)集。

在多模態(tài)RNN中，提出了一種基于文本內容和圖像輸入的更有效的擴展模型。該多模態(tài)模型由對圖像輸入進行編碼的卷積神經網絡和對圖像特征和句子進行編碼的 RNN 組成。該模型還通過隨機梯度下降算法進行訓練。這兩種多模態(tài)模型都在 Flickr 和 Mscoco 數(shù)據(jù)集上進行了廣泛的評估，并實現(xiàn)了最先進的性能。

3.4.3 小結 ?

基于RNN的多模態(tài)模型能夠借助隱藏單元計算中的顯式狀態(tài)傳遞來分析隱藏在多模態(tài)數(shù)據(jù)中的時間依賴性。他們使用時間反向傳播算法來訓練參數(shù)。由于在隱藏狀態(tài)傳輸中進行計算，因此很難在高性能設備上并行化。

4 總結與展望? ?

我們將模型總結為基于DBN、SAE、CNN和RNN的四組多模態(tài)數(shù)據(jù)深度學習模型。這些開創(chuàng)性的模式已經取得了一些進展。然而，這些模型仍處于初步階段，因此仍然存在挑戰(zhàn)。? ??

首先，多模態(tài)數(shù)據(jù)融合深度學習模型中存在大量的自由權重，特別是對目標任務影響不大的冗余參數(shù)。為了訓練這些捕獲數(shù)據(jù)特征結構的參數(shù)，將大量數(shù)據(jù)輸入到基于反向傳播算法的多模態(tài)數(shù)據(jù)融合深度學習模型中，該算法計算密集且耗時。因此，如何結合現(xiàn)有的壓縮策略設計新的多模態(tài)深度學習壓縮方法也是一個潛在的研究方向。

其次，多模態(tài)數(shù)據(jù)不僅包含跨模態(tài)信息，而且包含豐富的跨模態(tài)信息。因此，深度學習和語義融合策略的結合可能是解決探索多模態(tài)數(shù)據(jù)所帶來的挑戰(zhàn)的一種方式。 ? ?

第三，從動態(tài)環(huán)境中收集多模態(tài)數(shù)據(jù)，表明數(shù)據(jù)是不確定的。因此，隨著動態(tài)多模態(tài)數(shù)據(jù)的爆炸式增長，必須解決用于數(shù)據(jù)融合的在線和增量多模態(tài)深度學習模型的設計問題。

審核編輯：黃飛

閱讀全文

編碼器(131274) 編碼器(131274)
神經網絡(98470) 神經網絡(98470)
人工智能(230213) 人工智能(230213)
深度學習(119815) 深度學習(119815)
卷積神經網絡(11664) 卷積神經網絡(11664)

深度學習的硬件架構解析

深度學習在這十年，甚至是未來幾十年內都有可能是最熱門的話題。雖然深度學習已是廣為人知了，但它并不僅僅包含數(shù)學、建模、學習和優(yōu)化。算法必須在優(yōu)化后的硬件上運行，因為學習成千上萬的數(shù)據(jù)可能需要長達幾周的時間。因此，深度學習網絡亟需更快、更高效的硬件。接下來，讓我們重點來看深度學習的硬件架構。

2016-11-18 16:00:37

5550

2017全國深度學習技術應用大會

自然語言處理領域的最新研究進展，然后重點介紹深度學習方法在彈幕語義表示，詩歌生成，實體蘊含關系識別，試題難度預測的相關應用?！　?、報告題目：基于大規(guī)模弱標注數(shù)據(jù)的深度學習　　報告人：楊奎元微軟研究

2017-03-22 17:16:00

深度學習模型是如何創(chuàng)建的？

具有深度學習模型的嵌入式系統(tǒng)應用程序帶來了巨大的好處。深度學習嵌入式系統(tǒng)已經改變了各個行業(yè)的企業(yè)和組織。深度學習模型可以幫助實現(xiàn)工業(yè)流程自動化，進行實時分析以做出決策，甚至可以預測預警。這些AI

2021-10-27 06:34:15

深度學習DeepLearning實戰(zhàn)

測試)三、主講內容1:課程一、強化學習簡介課程二、強化學習基礎課程三、深度強化學習基礎課程四、多智能體深度強化學習課程五、多任務深度強化學習課程六、強化學習應用課程七、仿真實驗課程八、輔助課程四、主講

2021-01-09 17:01:54

深度學習與數(shù)據(jù)挖掘的關系

深度學習的概念源于人工神經網絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。晦澀難懂的概念，略微有些難以

2018-07-04 16:07:53

深度學習中過擬合/欠擬合的問題及解決方案

的數(shù)據(jù)可以對未來的數(shù)據(jù)進行推測與模擬，因此都是使用歷史數(shù)據(jù)建立模型，即使用已經產生的數(shù)據(jù)去訓練，然后使用該模型去擬合未來的數(shù)據(jù)。在我們機器學習和深度學習的訓練過程中，經常會出現(xiàn)過擬合和欠擬合的現(xiàn)象。訓練一開始，模型通常會欠擬合，所以會對模型進行優(yōu)化，然而等到訓練到一定程度的時候，就需要解決過擬合的問題了。

2021-01-28 06:57:47

深度學習介紹

汽車安全系統(tǒng)的發(fā)展進步中發(fā)揮重要的作用。而這些系統(tǒng)遠不止僅供典型消費者群體掌握和使用。深度學習這一概念在幾十年前就已提出，但如今它與特定的應用程序、技術以及通用計算平臺上的可用性能更密切相關。深度學習

2022-11-11 07:55:50

深度學習在預測和健康管理中的應用

方法方面的最新進展，目的是發(fā)現(xiàn)研究差距并提出進一步的改進建議。在簡要介紹了幾種深度學習模型之后，我們回顧并分析了使用深度學習進行故障檢測，診斷和預后的應用。該調查驗證了深度學習對PHM中各種類型的輸入

2021-07-12 06:46:47

深度學習存在哪些問題？

深度學習常用模型有哪些？深度學習常用軟件工具及平臺有哪些？深度學習存在哪些問題？

2021-10-14 08:20:47

深度學習技術的開發(fā)與應用

時間安排大綱具體內容實操案例三天關鍵點1.強化學習的發(fā)展歷程2.馬爾可夫決策過程3.動態(tài)規(guī)劃4.無模型預測學習5.無模型控制學習6.價值函數(shù)逼近7.策略梯度方法8.深度強化學習-DQN算法系列9.

2022-04-21 14:57:39

深度學習是什么

創(chuàng)客們的最酷“玩具”　　智能無人機、自主機器人、智能攝像機、自動駕駛……今年最令硬件創(chuàng)客們著迷的詞匯，想必就是這些一線“網紅”了。而這些網紅的背后，幾乎都和計算機視覺與深度學習密切相關?！　?b class="flag-6" style="color: red">深度學習

2021-07-19 06:17:28

深度學習框架只為GPU?

CPU優(yōu)化深度學習框架和函數(shù)庫機器學***器

2021-02-22 06:01:02

深度融合模型的特點

深度融合模型的特點，背景深度學習模型在訓練完成之后，部署并應用在生產環(huán)境的這一步至關重要，畢竟訓練出來的模型不能只接受一些公開數(shù)據(jù)集和榜單的檢驗，還需要在真正的業(yè)務場景下創(chuàng)造價值，不能只是為了PR而

2021-07-16 06:08:20

深度強化學習實戰(zhàn)

2021-01-10 13:42:26

AUTOSAR架構深度解析精選資料分享

AUTOSAR架構深度解析本文轉載于：AUTOSAR架構深度解析AUTOSAR的分層式設計，用于支持完整的軟件和硬件模塊的獨立性(Independence)，中間RTE(Runtime Environment)作為虛擬功能...

2021-07-28 07:02:13

AUTOSAR架構深度解析精選資料推薦

AUTOSAR架構深度解析本文轉載于：AUTOSAR架構深度解析目錄AUTOSAR架構深度解析AUTOSAR分層結構及應用軟件層功能應用軟件層虛擬功能總線VFB及運行環(huán)境RTE基礎軟件層(BSW)層

2021-07-28 07:40:15

FPGA在深度學習應用中或將取代GPU

將 AI 框架模型映射到硬件架構。 Larzul 的公司 Mipsology 希望通過 Zebra 來彌合這一差距。Zebra 是一種軟件平臺，開發(fā)者可以輕松地將深度學習代碼移植到 FPGA 硬件上

2024-03-21 15:19:45

Mali GPU支持tensorflow或者caffe等深度學習模型嗎

Mali GPU 支持tensorflow或者caffe等深度學習模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運行？我希望把訓練

2022-09-16 14:13:01

Nanopi深度學習之路(1)深度學習框架分析

著手，使用Nanopi2部署已訓練好的檢測模型，例如硅谷電視劇的 Not Hotdog 檢測器應用，會在復雜的深度學習歷程中有些成就感。目前已有幾十種流行的深度學習算法庫，參考網址：https

2018-06-04 22:32:12

TDA4對深度學習的重要性

，這比較類似于人腦的運行方式，獲得更多數(shù)據(jù)后，準確度也會越來越高。TIDL（TI Deep LearningLibrary）是TI平臺基于深度學習算法的軟件生態(tài)系統(tǒng)，可以將一些常見的深度學習算法模型

2022-11-03 06:53:11

labview+yolov4+tensorflow+openvion深度學習

的網絡結構。當然，深度學習的方法用來檢測，也有自己的很多缺點。例如：數(shù)據(jù)量要求大，工業(yè)數(shù)據(jù)收集成本高。但是隨著數(shù)據(jù)增強技術，無監(jiān)督學習的不斷進步，在某些應用場景上，這些缺點漸漸被隱藏了。例如學術界正在研究

2021-05-10 22:33:46

labview測試tensorflow深度學習SSD模型識別物體

安裝labview2019 vision，自帶深度學習推理工具，支持tensorflow模型。配置好python下tensorflow環(huán)境配置好object_detection API下載SSD模型

2020-08-16 17:21:38

labview調用深度學習tensorflow模型非常簡單，附上源碼和模型

本帖最后由 wcl86 于 2021-9-9 10:39 編輯 `labview調用深度學習tensorflow模型非常簡單，效果如下，附上源碼和訓練過的模型：[hide][/hide

2021-06-03 16:38:25

　　華為云深度學習服務，讓企業(yè)智能從此不求人

深度學習訓練的第一個困難是技術難度高。企業(yè)要進行深度學習的模型訓練，有很高的技術門檻。比如要自己搭建深度學習平臺，要有懂得編程的技術人員，還要有海量的訓練數(shù)據(jù)等等。而華為云深度學習服務，可以提供深度

2018-08-02 20:44:09

【NanoPi K1 Plus試用體驗】搭建深度學習框架

，非線性回歸，手寫數(shù)字分類模型開始講起。逐步講到一些深度學習網絡的應用如CNN，LSTM。最后會帶著大家完成一些實際的應用案例如圖像識別，圖片風格轉換，seq2seq模型的應用，情感分類，生成對抗網絡等。下面

2018-07-17 11:40:31

【詳解】FPGA：深度學習的未來？

（FPGA）提供了另一個值得探究的解決方案。日漸流行的FPGA設計工具使其對深度學習領域經常使用的上層軟件兼容性更強，使得FPGA更容易為模型搭建和部署者所用。FPGA架構靈活，使得研究者能夠在諸如GPU

2018-08-13 09:33:30

為什么說FPGA是機器深度學習的未來？

都出現(xiàn)了重大突破。深度學習是這些領域中所最常使用的技術，也被業(yè)界大為關注。然而，深度學習模型需要極為大量的數(shù)據(jù)和計算能力，只有更好的硬件加速條件，才能滿足現(xiàn)有數(shù)據(jù)和模型規(guī)模繼續(xù)擴大的需求。　　 FPGA

2019-10-10 06:45:41

人工智能、數(shù)據(jù)挖掘、機器學習和深度學習的關系

人工智能、數(shù)據(jù)挖掘、機器學習和深度學習之間，主要有什么關系？

2020-03-16 11:35:54

什么是深度學習？

深度學習是什么意思

2020-11-11 06:58:03

什么是深度學習？使用FPGA進行深度學習的好處？

，即使使用具有一定低位寬的數(shù)據(jù)，深度學習推理也不會降低最終精度。目前據(jù)說8位左右可以提供穩(wěn)定的準確率，但最新的研究表明，已經出現(xiàn)了即使降低到4位或2位也能獲得很好準確率的模型和學習方法，越來越多的正在

2023-02-17 16:56:59

從手淘搜索到優(yōu)酷短視頻，阿里巴巴是如何在搜索推薦領域下應用深度學習的？

，進而通過多樣性來提升最終轉化的目標。多模態(tài)和在線學習在實現(xiàn)手淘主搜索場景業(yè)務的同時還引入了多模態(tài)和在線學習，這兩個技術更多地是為了應對淘寶的大促場景。眾所周知，“雙11”就是一個非常典型的大促場景，用戶

2018-05-08 16:28:04

全網唯一一套labview深度學習教程：tensorflow+目標檢測：龍哥教你學視覺—LabVIEW深度學習教程

繁多且具有強烈的針對性，魯棒性差；多種算法計算量驚人且無法精確的檢測缺陷的大小和形狀。而深度學習可以直接通過學習數(shù)據(jù)更新參數(shù)，避免了人工設計復雜的算法流程，并且有著極高的魯棒性和精度。三、深度學習目前

2020-08-10 10:38:12

剛開始進行深度學習的同學怎么選擇合適的機器配置

最大需要多少塊GPU，如果你經常進行機器學習研究，那你可能需要更多 GPU，這可以幫助你并行運行多個任務，你可以同時嘗試不同的模型結構、數(shù)據(jù)規(guī)范化、超參數(shù)等等。建議：如果你是一個普通研究員/學生

2018-09-19 13:56:36

動態(tài)分配多任務資源的移動端深度學習框架

第一個挑戰(zhàn)，NestDNN 部署了一個新的模型剪枝和復原方案（recovery scheme），將深度學習模型轉換為緊湊的多容量模型（multi-capacity model）。這一多容量模型由一組

2018-10-31 16:32:24

基于深度學習的異常檢測的研究方法

ABSTRACT1.基于深度學習的異常檢測的研究方法進行結構化和全面的概述2.回顧這些方法在各個領域這個中的應用情況，并評估他們的有效性。3.根據(jù)基本假設和采用的方法將最先進的深度異常檢測技術分為

2021-07-12 06:36:22

基于深度學習的異常檢測的研究方法

異常檢測的深度學習研究綜述原文：arXiv:1901.03407摘要異常檢測是一個重要的問題，在不同的研究領域和應用領域都得到了很好的研究。本文的研究目的有兩個：首先，我們對基于深度學習的異常檢測

2021-07-12 07:10:19

如何使用MATLAB幫助相關人員執(zhí)行深度學習任務

MATLAB支持的模型有哪些呢？如何使用MATLAB幫助相關人員執(zhí)行深度學習任務呢？

2021-11-22 07:48:19

如何在交通領域構建基于圖的深度學習架構

學習架構因為這篇文獻對于交通領域中的各種問題、方法做了一個比較清楚的綜述，所以是一篇很有價值的文獻，很適合剛進入這個方向的同學。

2021-08-31 08:05:01

探討一下深度學習在嵌入式設備上的應用

下面來探討一下深度學習在嵌入式設備上的應用，具體如下：1、深度學習的概念源于人工神經網絡的研究，包含多個隱層的多層感知器(MLP) 是一種原始的深度學習結構。深度學習通過組合低層特征形成更加抽象

2021-10-27 08:02:31

探討機器學習與深度學習的差異

平坦化，並接到最基本的神經網絡。透過上述所介紹的主要的三個層，即可完成一個CNN架構，如下圖所示為最典型的CNN架構。透過深度學習的方式，簡單的將提取到有效的特徵。盡而逼近最佳模型。因此近年來有許多

2019-09-20 09:05:05

松靈新品丨全球首款多模態(tài)?ROS開發(fā)平臺LIMO來了，將聯(lián)合古月居打造精品課程精選資料分享

多地形通過性和多場景的適應性一直是無人駕駛、機器人等場景化所需要突破的難題。通過多模態(tài)運動融合，提高跨維度運動的柔性適應能力是一種理想的解決方式，這決定了機器人和移動平臺未來應用場景開拓的深度和廣度

2021-08-30 08:39:33

淺談深度學習之TensorFlow

可以輕松快速地進行原型設計。它支持各種 DNN，如RNN、CNN，甚至是兩者的組合。任何深度學習網絡都由四個重要部分組成：數(shù)據(jù)集、定義模型（網絡結構）、訓練/學習和預測/評估?？梢栽?/div>

2020-07-28 14:34:04

計算機視覺應用深度學習

怎樣從傳統(tǒng)機器學習方法過渡到深度學習？

2021-10-14 06:51:23

討論紋理分析在圖像分類中的重要性及其在深度學習中使用紋理分析

1、如何在深度學習結構中使用紋理特征　　如果圖像數(shù)據(jù)集具有豐富的基于紋理的特征，如果將額外的紋理特征提取技術作為端到端體系結構的一部分，則深度學習技術會更有效。　　預訓練模型的問題是，由于模型

2022-10-26 16:57:26

請問一下什么是深度學習？

2021-08-30 07:35:21

超越英偉達Pascal五倍？揭秘英特爾深度學習芯片架構精選資料推薦

在被英特爾收購兩年之后，深度學習芯片公司 Nervana 終于準備將代號為「Lake Crest」的架構轉化為實際的產品了。對于英特爾來說，現(xiàn)在入局或許有些遲到，英偉達已經占據(jù)深度學習芯片市場很長一段時間了，后者有充分的時間通過新...

2021-07-26 07:04:35

新芯片架構瞄準深度學習和視覺處理

深度學習本質上是以一組算法為基礎，透過具有多個處理層、由線性與非線性交易組成的深度繪圖，嘗試在數(shù)據(jù)中建模高層級抽象。ThinCI架構的獨特之處似乎就在于其處理深度繪圖的方式。

2016-11-03 15:17:55

1787

模型驅動深度學習的標準流程與學習方法解析

模型驅動的深度學習方法近年來，深度學習在人工智能領域一系列困難問題上取得了突破性成功應用。

2018-01-24 11:30:13

4617

根據(jù)美團“猜你喜歡”來深度學習排序模型實踐

本文將主要介紹深度學習模型在美團平臺推薦排序場景下的應用和探索。

2018-04-02 09:35:24

6079

一文詳解深度學習的5 種架構

深度學習由不同拓撲結構的深度網絡組成。神經網絡已存在很長一段時間，但多層網絡（每個層提供一定的功能，比如特征提?。┑拈_發(fā)讓它們變得更加實用。增加層數(shù)意味著各層之間和層內有更多相互聯(lián)系和更多

2018-05-28 16:49:00

9701

深度學習是什么？了解深度學習難嗎?讓你快速了解深度學習的視頻講解

本深度學習是什么？了解深度學習難嗎?讓你快速了解深度學習的視頻講解本文檔視頻讓你4分鐘快速了解深度學習深度學習的概念源于人工智能的人工神經網絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

2018-08-23 14:36:16

淺論學習深度學習的四個步驟

深度學習的概念源于人工神經網絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

2018-10-07 15:19:00

11926

基于深度學習模型的點云目標檢測及ROS實現(xiàn)

近年來，隨著深度學習在圖像視覺領域的發(fā)展，一類基于單純的深度學習模型的點云目標檢測方法被提出和應用，本文將詳細介紹其中一種模型——SqueezeSeg，并且使用ROS實現(xiàn)該模型的實時目標檢測。

2018-11-05 16:47:29

17193

針對線性回歸模型和深度學習模型，介紹了確定訓練數(shù)據(jù)集規(guī)模的方法

具體來看，對于傳統(tǒng)的機器學習算法，模型的表現(xiàn)先是遵循冪定律（power law），之后趨于平緩；而對于深度學習，該問題還在持續(xù)不斷地研究中，不過圖一為目前較為一致的結論，即隨著數(shù)據(jù)規(guī)模的增長，深度

2019-05-05 11:03:31

5766

深度學習模型壓縮與加速綜述

目前在深度學習領域分類兩個派別，一派為學院派，研究強大、復雜的模型網絡和實驗方法，為了追求更高的性能；另一派為工程派，旨在將算法更穩(wěn)定、高效的落地在硬件平臺上，效率是其追求的目標。復雜的模型固然具有

2019-06-08 17:26:00

4852

回顧3年來的所有主流深度學習CTR模型

微軟于2016年提出的Deep Crossing可以說是深度學習CTR模型的最典型和基礎性的模型。如圖2的模型結構圖所示，它涵蓋了深度CTR模型最典型的要素，即通過加入embedding層將稀疏特征轉化為低維稠密特征，用stacking layer

2019-07-18 14:33:16

5888

如何使用MATLAB實現(xiàn)深度學習的方法研究分析

訓練 CNN 需要相當大量的數(shù)據(jù)，因為對于典型的圖像分類問題，其需要學習幾百萬個權值。從頭開始訓練 CNN 的另一個常見做法是使用預先訓練好的模型自動從新的數(shù)據(jù)集提取特征。這種方法稱為遷移學習，是一種應用深度學習的便捷方式，其無需龐大的數(shù)據(jù)集以及長時間的訓練。

2019-09-16 15:11:20

5444

深度學習模型小型化處理的五種方法

現(xiàn)在深度學習模型開始走向應用，因此我們需要把深度學習網絡和模型部署到一些硬件上，而現(xiàn)有一些模型的參數(shù)量由于過大，會導致在一些硬件上的運行速度很慢，所以我們需要對深度學習模型進行小型化處理。

2020-01-28 17:40:00

3690

晶心科技和Deeplite攜手合作高度優(yōu)化深度學習模型解決方案

晶心科技今日宣布將攜手合作，在基于AndeStar? V5架構的晶心RISC-V CPU核心上配置高度優(yōu)化的深度學習模型，使AI深度學習模型變得更輕巧、快速和節(jié)能。

2019-12-31 16:30:11

1004

如何讓深度學習變得簡單

在Cortex，用戶推出了基于深度學習的新一代產品，與以前不同的是，這些產品并非都是使用獨一無二的模型架構構建的。

2020-03-19 20:08:58

618

如何使用深度學習實現(xiàn)語音聲學模型的研究

的分析識別更是研究的重中之重。近年來深 10 度學習模型的廣泛發(fā)展和計算能力的大幅提升對語音識別技術的提升起到了關鍵作用。本文立足于語音識別與深度學習理論緊密結合，針對如何利用深度學習模型搭建區(qū)分能力更強魯棒性更

2020-05-09 08:00:00

什么是深度學習，深度學習能解決什么問題

深度學習是機器學習與神經網絡、人工智能、圖形化建模、優(yōu)化、模式識別和信號處理等技術融合后產生的一個領域。

2020-11-05 09:31:19

4720

深度主動學習的相關工作全面概述

Abstract 主動學習試圖通過標記最少量的樣本使得模型的性能收益最大化。而深度學習則對數(shù)據(jù)比較貪婪，需要大量的數(shù)據(jù)供給來優(yōu)化海量的參數(shù)，從而使得模型學會如何提取高質量的特征。近年來，由于互聯(lián)網

2021-02-17 11:55:00

3141

基于深度學習的視頻質量評價方法及模型研究

模型自主學習即可進行評估，對視頻質量的監(jiān)控和評價有重要意義，已成為計算機視覺領域的研究熱點首先對視頻質量評價的研究背景和主要研究方法進行介紹;其次從全參考型和無參考型兩方面介紹基于深度學習的客觀質量評價方法，并且

2021-03-29 15:46:40

綜述深度學習的卷積神經網絡模型應用及發(fā)展

上逐步提高。由于可以自動學習樣本數(shù)據(jù)的特征表示，卷積神經網絡已經廣泛應用于圖像分類、目標檢測、語乂分割以及自然語言處理等領域。首先分析了典型卷積神經網絡模型為提髙其性能増加網絡深度以及寬度的模型結構，分析了采用注

2021-04-02 15:29:04

深度模型中的優(yōu)化與學習課件下載

2021-04-07 16:21:01

基于深度學習的圖像修復模型及實驗對比

深度學習技術在解決¨大面積缺失圖像修復”問題時具有重要作用并帶來了深遠影響，文中在簡要介紹傳統(tǒng)圖像修復方法的基礎上，重點介紹了基于深度學習的修復模型，主要包括模型分類、優(yōu)缺點對比、適用范圍和在常用數(shù)據(jù)集上的

2021-04-08 09:38:00

如何理解泛化是深度學習領域尚未解決的基礎問題

如何理解泛化是深度學習領域尚未解決的基礎問題之一。為什么使用有限訓練數(shù)據(jù)集優(yōu)化模型能使模型在預留測試集上取得良好表現(xiàn)？這一問題距今已有 50 多年的豐富歷史，并在機器學習中得到廣泛研究。

2021-04-08 17:56:17

2383

探究對深度學習模型VAE的時序性解耦

現(xiàn)代深度學習架構一直被描述為一個黑匣子：被輸入數(shù)據(jù)，并期望從中得到一些結果。然而，由于此類架構存在許多的復雜性，過程中發(fā)生的事情，通常難以解釋和分析。這已發(fā)展成為整個社會未能廣泛接受深度學習

2021-06-04 11:10:44

4152

什么？不用GPU也能加速你的YOLOv3深度學習模型

解決煩惱，讓你的深度學習模型效率“一節(jié)更比七節(jié)強”！ Neural Magic是專門研究深度學習的稀疏方法的公司，這次他們發(fā)布了教程：用recipe稀疏化YOLOv3。聽起來有點意思啊，讓我們來看看是怎么實現(xiàn)的~ 稀疏化的YOLOv3 稀疏化的YOLOv3使用剪枝（prune）和量化（qua

2021-06-10 15:33:02

1990

基于深度學習的文本主題模型研究綜述

2021-06-24 11:49:18

簡述文本與圖像領域的多模態(tài)學習有關問題

來自：哈工大SCIR 本期導讀：近年來研究人員在計算機視覺和自然語言處理方向均取得了很大進展，因此融合了二者的多模態(tài)深度學習也越來越受到關注。本期主要討論結合文本和圖像的多模態(tài)任務，將從多模態(tài)預訓練

2021-08-26 16:29:52

6361

深度學習在嵌入式設備上的應用

2021-10-20 17:51:05

移植深度學習算法模型到海思AI芯片

本文大致介紹將深度學習算法模型移植到海思AI芯片的總體流程和一些需要注意的細節(jié)。海思芯片移植深度學習算法模型，大致分為模型轉換，...

2022-01-26 19:42:35

深度學習在軌跡數(shù)據(jù)挖掘中的應用研究綜述

深度學習在軌跡數(shù)據(jù)挖掘中的應用研究綜述來源：《?計算機科學與應用》?，作者李旭娟等摘要:? 在過去十年，深度學習已被證明在很多領域應用非常成功，如視覺圖像、自然語言處理、語音識別等，同時

2022-03-08 17:24:10

1275

什么是深度學習（Deep Learning）？深度學習的工作原理詳解

學習中的“深度”一詞表示用于識別數(shù)據(jù)模式的多層算法或神經網絡。DL 高度靈活的架構可以直接從原始數(shù)據(jù)中學習，這類似于人腦的運作方式，獲得更多數(shù)據(jù)后，其預測準確度也將隨之提升。? ? 此外，深度學習是在語音識別、語言翻譯和

2022-04-01 10:34:10

8790

百度王海峰：深度學習平臺+大模型，產業(yè)智能化基座

及應用國家工程研究中心技術委員會副主任、中國工程院丁文華院士受邀致辭，百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰發(fā)表題為《深度學習平臺加大模型，產業(yè)智能化基座》的主旨演講。（以下為發(fā)言全文）尊敬的各位專家、開發(fā)者

2022-12-01 18:03:32

827

深度學習聚類的綜述

。 1. 什么是深度聚類？經典聚類即數(shù)據(jù)通過各種表示學習技術以矢量化形式表示為特征。隨著數(shù)據(jù)變得越來越復雜和復雜，淺層（傳統(tǒng)）聚類方法已經無法處理高維數(shù)據(jù)類型。為了解決該問題，深度聚類的概念被提出，即聯(lián)合優(yōu)化表示學習

2022-12-30 11:15:08

654

讀懂深度學習，走進“深度學習+”階段

人工智能的概念在1956年就被提出，如今終于走入現(xiàn)實，離不開一種名為“深度學習”的技術。深度學習的運作模式，如同一場傳話游戲。給神經網絡輸入數(shù)據(jù)，對數(shù)據(jù)的特征進行描述，在神經網絡中層層傳遞，最終

2023-01-14 23:34:43

598

什么是深度學習中優(yōu)化算法

先大致講一下什么是深度學習中優(yōu)化算法吧，我們可以把模型比作函數(shù)，一種很復雜的函數(shù)：h(f(g(k(x))))，函數(shù)有參數(shù)，這些參數(shù)是未知的，深度學習中的“學習”就是通過訓練數(shù)據(jù)求解這些未知的參數(shù)。

2023-02-13 15:31:48

1045

大模型為什么是深度學習的未來？

與傳統(tǒng)機器學習相比，深度學習是從數(shù)據(jù)中學習，而大模型則是通過使用大量的模型來訓練數(shù)據(jù)。深度學習可以處理任何類型的數(shù)據(jù)，例如圖片、文本等等；但是這些數(shù)據(jù)很難用機器完成。大模型可以訓練更多類別、多個級別的模型，因此可以處理更廣泛的類型。另外：在使用大模型時，可能需要一個更全面或復雜的數(shù)學和數(shù)值計算的支持。

2023-02-16 11:32:37

1618

深度學習中的圖像分割

深度學習可以學習視覺輸入的模式，以預測組成圖像的對象類。用于圖像處理的主要深度學習架構是卷積神經網絡(CNN)，或者是特定的CNN框架，如AlexNet、VGG、Inception和ResNet。計算機視覺的深度學習模型通常在專門的圖形處理單元(GPU)上訓練和執(zhí)行，以減少計算時間。

2023-05-05 11:35:28

766

為什么深度學習是非參數(shù)的？

今天我想要與大家分享的是深度神經網絡的工作方式，以及深度神經與“傳統(tǒng)”機器學習模型的不同之處。

2023-05-25 15:13:54

275

自動駕駛深度多模態(tài)目標檢測和語義分割:數(shù)據(jù)集、方法和挑戰(zhàn)

了許多解決深度多模態(tài)感知問題的方法。然而，對于網絡架構的設計，并沒有通用的指導方針，關于“融合什么”、“何時融合”和“如何融合”的問題仍然沒有定論。本文系統(tǒng)地總結了自動駕駛中深度多模態(tài)目標檢測和語義分割的方法，

2023-06-06 10:37:11

深度學習基本概念

科學領域一個非常熱門的研究領域。深度學習的基本概念和原理是什么？讓我們一起來探究一下。 1. 神經網絡神經網絡是深度學習的核心，是一種由多個節(jié)點（也稱為神經元）組成的計算模型。神經網絡模擬了人類神經元的工作方式，通

2023-08-17 16:02:49

1024

深度學習算法簡介深度學習算法是什么深度學習算法有哪些

深度學習算法簡介深度學習算法是什么?深度學習算法有哪些?? 作為一種現(xiàn)代化、前沿化的技術，深度學習已經在很多領域得到了廣泛的應用，其能夠不斷地從數(shù)據(jù)中提取最基本的特征，從而對大量的信息進行機器學習

2023-08-17 16:02:56

6278

深度學習是什么領域

深度學習是什么領域? 深度學習是機器學習的一種子集，由多層神經網絡組成。它是一種自動學習技術，可以從數(shù)據(jù)中學習高層次的抽象模型，以進行推斷和預測。深度學習廣泛應用于計算機視覺、語音識別、自然語言處理

2023-08-17 16:02:59

1082

什么是深度學習算法？深度學習算法的應用

什么是深度學習算法？深度學習算法的應用深度學習算法被認為是人工智能的核心，它是一種模仿人類大腦神經元的計算模型。深度學習是機器學習的一種變體，主要通過變換各種架構來對大量數(shù)據(jù)進行學習以及分類處理

2023-08-17 16:03:04

1360

深度學習框架是什么？深度學習框架有哪些？

高模型的精度和性能。隨著人工智能和機器學習的迅猛發(fā)展，深度學習框架已成為了研究和開發(fā)人員們必備的工具之一。目前，市場上存在許多深度學習框架可供選擇。本文將為您介紹一些較為常見的深度學習框架，并探究它們的特點

2023-08-17 16:03:09

1621

深度學習框架和深度學習算法教程

了基于神經網絡的機器學習方法。深度學習算法可以分為兩大類：監(jiān)督學習和無監(jiān)督學習。監(jiān)督學習的基本任務是訓練模型去學習輸入數(shù)據(jù)的特征和其對應的標簽，然后用于新數(shù)據(jù)的預測。而無監(jiān)督學習通常用于聚類、降維和生成模型等任務中

2023-08-17 16:11:26

668