一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

deepwalk算法核心的步驟

智能生物識(shí)別說 ? 來源:快商通AI ? 作者:快商通AI ? 2021-10-14 09:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在數(shù)據(jù)量越來越大的今天,word2vec是通過字詞的共現(xiàn)關(guān)系來學(xué)習(xí)字詞的向量表示,Graph Embeding的思想類似于word2vec,通過圖中節(jié)點(diǎn)與節(jié)點(diǎn)的共現(xiàn)關(guān)系來學(xué)習(xí)節(jié)點(diǎn)的向量表示,構(gòu)成文本序列從而計(jì)算相互關(guān)聯(lián)出現(xiàn)的詞的概率,從而計(jì)算詞向量表示文本。那么在圖模型中的關(guān)鍵的問題就是如何來描述節(jié)點(diǎn)與節(jié)點(diǎn)的共現(xiàn)關(guān)系,于是方法是利用DeepWalk來采樣這樣的文本序列,通過隨機(jī)游走(RandomWalk)的方式在圖中進(jìn)行節(jié)點(diǎn)采樣,從而就能夠輸入序列計(jì)算圖的向量表示。所以deepwalk算法核心的步驟就是兩步:

RandomWalk

Skip-Gram

RandomWalk是一種可重復(fù)訪問已訪問節(jié)點(diǎn)的深度優(yōu)先遍歷算法。給定當(dāng)前訪問起始節(jié)點(diǎn),從其鄰居中隨機(jī)采樣節(jié)點(diǎn)作為下一個(gè)訪問節(jié)點(diǎn),重復(fù)此過程,直到訪問序列長(zhǎng)度滿足預(yù)設(shè)條件。

spacer.gif算法過程就是輸入一個(gè)圖,輸出節(jié)點(diǎn)表示的矩陣,簡(jiǎn)單對(duì)步驟進(jìn)行解析:

初始化:從 $\mathcal{U}^{|V| \times d}$ 樣本空間中采樣,embedding的大小為 $d$

構(gòu)建一棵二叉樹Hierarchical Softmax

開始做 $\gamma$ 步的隨機(jī)游走,這里的 $\gamma$ 是初始化好的超參數(shù)

打亂采樣得到的節(jié)點(diǎn)

這個(gè)循環(huán)是開始以每個(gè)節(jié)點(diǎn)為根節(jié)點(diǎn)開始做長(zhǎng)度為 $t$ 的隨機(jī)游走,這里的 $t$ 為初始化的超參數(shù)。然后按窗口 $w$ 進(jìn)行SkipGram學(xué)習(xí)文本序列

SkipGram

一般提到word2vec有兩種主要的算法,Cbow和Skip-Gram,都是在統(tǒng)計(jì)語言模型的基礎(chǔ)上計(jì)算一個(gè)詞在文本中出現(xiàn)的概率用來作為這個(gè)詞的表示向量,于是優(yōu)化目標(biāo)就是最大化$Pr(w_n|w_0,w_1,...,w_{n-1})$ 。 $w$ 表示的就是詞。

SkipGram就是用當(dāng)前詞來預(yù)測(cè)上下文。丟掉了詞序并且不考慮與當(dāng)前詞的距離。優(yōu)化目標(biāo)是最大化同一個(gè)句子中同時(shí)出現(xiàn)的詞的共現(xiàn)概率:

預(yù)測(cè)給到的詞從整個(gè)詞表vocabulary中選擇,因此在輸出的時(shí)候會(huì)計(jì)算softmax進(jìn)行選擇,維度為 $|V|$ ,計(jì)算的維度會(huì)非常大,因此采用Hierarchical Softmax來構(gòu)建二叉樹進(jìn)行選擇,每個(gè)詞就只需要計(jì)算 $log_2^{|V|}$ 次。

Node2Vec

node2vec依然采用的是隨機(jī)游走的方式獲取頂點(diǎn)的臨近頂點(diǎn)序列,但不同的是node2vec采用的是一種有偏的隨機(jī)游走。給定當(dāng)前頂點(diǎn) $v$,訪問下一個(gè)頂點(diǎn)的概率是:

$\pi{vx}$ 是頂點(diǎn) $v$ 到頂點(diǎn) $x$ 之間的轉(zhuǎn)移概率, $Z$ 是歸一化參數(shù)。 node2vec引入兩個(gè)超參數(shù) $p$ 和 $q$ 來控制隨機(jī)游走的策略,假設(shè)當(dāng)前隨機(jī)游走經(jīng)過邊 $(v, x) $ 到達(dá)頂點(diǎn) $t$ ,設(shè) $\pi{vx}=\alpha{pq}(t, x)\cdot w{vx}$ , $w_{vx}$ 是頂點(diǎn) $v$ 和 $x$ 之間的邊權(quán)。

$d{tx}$ 為頂點(diǎn) $t$ 和頂點(diǎn) $x$ 之間的最短路徑距離。參數(shù)$p$和參數(shù)$q$的意義:控制重復(fù)訪問剛剛訪問過的頂點(diǎn)的概率。$p$作用于$d{tx}=0$,表達(dá)的意義就是頂點(diǎn)$x$就是訪問當(dāng)前頂點(diǎn)$v$之前剛剛訪問過的頂點(diǎn)。如果$p$較高,則訪問剛剛訪問過的頂點(diǎn)的概率會(huì)變低,反之變高。$q$控制著游走是向外還是向內(nèi),如果$q>1$,隨機(jī)游走傾向于訪問和節(jié)點(diǎn)$t$相接近的頂點(diǎn)(類似于$BFS$)。如果$q<1$,則傾向于訪問遠(yuǎn)離$t$的頂點(diǎn)(類似于$DFS$)。

Graph Convolutional Network

Graph Embedding的意義就在于能夠利用圖結(jié)構(gòu)處理非結(jié)構(gòu)化數(shù)據(jù),因此在cv和nlp領(lǐng)域能夠更進(jìn)一步結(jié)合先驗(yàn)知識(shí)進(jìn)行特征學(xué)習(xí),因此是深度學(xué)習(xí)領(lǐng)域的重要發(fā)展方向。定義圖$G=(V,E)$,$V$為節(jié)點(diǎn)的集合,$E$為邊的集合,對(duì)于每個(gè)節(jié)點(diǎn)$i$, 均有其特征$x_i$,特征矩陣可以用$X_{N*D}$來表示,其中$N$表示節(jié)點(diǎn)數(shù),$D$表示每個(gè)節(jié)點(diǎn)的特征編碼尺寸,在nlp應(yīng)用中就是embedding_size。對(duì)于圖的理解有一個(gè)經(jīng)典的思想:

圖中的每個(gè)結(jié)點(diǎn)無時(shí)無刻不因?yàn)猷従雍透h(yuǎn)的點(diǎn)的影響而在改變著自己的狀態(tài)直到最終的平衡,關(guān)系越親近的鄰居影響越大。

實(shí)際上從鄰居節(jié)點(diǎn)獲取信息的思想在很多領(lǐng)域都有應(yīng)用,例如:word2vec和pagerank。很多參考的理解描述了更加細(xì)節(jié)的數(shù)學(xué)原理:從傅立葉變換到拉普拉斯算子到拉普拉斯矩陣。很難理解。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95393
  • 節(jié)點(diǎn)
    +關(guān)注

    關(guān)注

    0

    文章

    222

    瀏覽量

    24975
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    openstack搭建詳細(xì)步驟

    openstack搭建詳細(xì)步驟
    的頭像 發(fā)表于 05-07 14:05 ?1003次閱讀

    網(wǎng)關(guān)基本配置操作步驟-ModbusRTU

    電子發(fā)燒友網(wǎng)站提供《網(wǎng)關(guān)基本配置操作步驟-ModbusRTU.pdf》資料免費(fèi)下載
    發(fā)表于 03-27 17:59 ?1次下載

    封裝基板設(shè)計(jì)的詳細(xì)步驟

    封裝基板設(shè)計(jì)是集成電路封裝工程中的核心步驟之一,涉及將芯片與外部電路連接的基板(substrate)設(shè)計(jì)工作?;逶O(shè)計(jì)不僅決定了芯片與外部電路之間的電氣連接,還影響著封裝的可靠性、性能、成本及生產(chǎn)可行性。
    的頭像 發(fā)表于 03-12 17:30 ?852次閱讀

    FOC 算法實(shí)現(xiàn)永磁同步電機(jī)調(diào)整指南

    本文檔介紹了使用 FOC 算法實(shí)現(xiàn)永磁同步電機(jī) (Permanent Magnet SynchronousMotor,PMSM)調(diào)整所需的步驟和設(shè)置,該算法如 AN1078《PMSM 電機(jī)的無傳感器
    發(fā)表于 03-03 01:53

    PID控制算法的C語言實(shí)現(xiàn):PID算法原理

    在工業(yè)應(yīng)用中 PID 及其衍生算法是應(yīng)用最廣泛的算法之一,是當(dāng)之無愧的萬能算法,如果能夠熟練掌握 PID 算法的設(shè)計(jì)與實(shí)現(xiàn)過程,對(duì)于一般的研發(fā)人員來講,應(yīng)該是足夠應(yīng)對(duì)一般研發(fā)問題了,而
    發(fā)表于 02-26 15:24

    深度解析:PCBA設(shè)計(jì)打樣的核心步驟有哪些?

    一站式PCBA智造廠家今天為大家講講PCBA設(shè)計(jì)打樣的步驟有哪些?PCBA設(shè)計(jì)打樣的主要步驟。PCBA設(shè)計(jì)打樣是電子產(chǎn)品開發(fā)中的關(guān)鍵環(huán)節(jié),確保電路板的功能和性能符合設(shè)計(jì)要求。打樣過程包括設(shè)計(jì)、采購
    的頭像 發(fā)表于 02-19 09:12 ?372次閱讀

    什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法

    神經(jīng)網(wǎng)絡(luò)(即反向傳播神經(jīng)網(wǎng)絡(luò))的核心,它建立在梯度下降法的基礎(chǔ)上,是一種適合于多層神經(jīng)元網(wǎng)絡(luò)的學(xué)習(xí)算法。該算法通過計(jì)算每層網(wǎng)絡(luò)的誤差,并將這些誤差反向傳播到前一層,從而調(diào)整權(quán)重,使得網(wǎng)絡(luò)的預(yù)測(cè)更接近真實(shí)值。 二、
    的頭像 發(fā)表于 02-12 15:18 ?768次閱讀

    人臉識(shí)別技術(shù)的算法原理解析

    在數(shù)字化時(shí)代,人臉識(shí)別技術(shù)已經(jīng)成為身份驗(yàn)證和安全監(jiān)控的重要手段。這項(xiàng)技術(shù)的核心在于算法,它們能夠從圖像中提取關(guān)鍵信息,并與數(shù)據(jù)庫中的信息進(jìn)行匹配,以識(shí)別個(gè)體。 1. 人臉識(shí)別技術(shù)概述 人臉識(shí)別技術(shù)
    的頭像 發(fā)表于 02-06 17:50 ?1763次閱讀

    IGBT雙脈沖測(cè)試原理和步驟

    IGBT(Insulated Gate Bipolar Transistor,絕緣柵雙極型晶體管)作為電力電子裝置中的核心器件,其性能的穩(wěn)定性和可靠性對(duì)整個(gè)系統(tǒng)的運(yùn)行至關(guān)重要。為了驗(yàn)證IGBT的性能
    的頭像 發(fā)表于 02-02 13:59 ?1513次閱讀

    濕法刻蝕步驟有哪些

    說到濕法刻蝕了,這個(gè)是專業(yè)的技術(shù)。我們也得用專業(yè)的內(nèi)容才能給大家講解。聽到這個(gè)工藝的話,最專業(yè)的一定就是講述濕法刻蝕步驟。你知道其中都有哪些步驟嗎?如果想要了解,今天是一個(gè)不錯(cuò)的機(jī)會(huì),我們一起學(xué)習(xí)
    的頭像 發(fā)表于 12-13 14:08 ?816次閱讀

    【「從算法到電路—數(shù)字芯片算法的電路實(shí)現(xiàn)」閱讀體驗(yàn)】+介紹基礎(chǔ)硬件算法模塊

    作為嵌入式開發(fā)者往往比較關(guān)注硬件和軟件的協(xié)調(diào)。本書介紹了除法器,信號(hào)發(fā)生器,濾波器,分頻器等基本算法的電路實(shí)現(xiàn),雖然都是基礎(chǔ)內(nèi)容,但是也是最常用到的基本模塊。 隨著逆全球化趨勢(shì)的出現(xiàn),過去的研發(fā)
    發(fā)表于 11-21 17:05

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)等機(jī)器學(xué)習(xí)任務(wù)設(shè)計(jì)的處理器,其與機(jī)器學(xué)習(xí)算法
    的頭像 發(fā)表于 11-15 09:19 ?1222次閱讀

    AIGC算法解析及其發(fā)展趨勢(shì)

    、AIGC算法解析 核心基礎(chǔ) 人工智能算法 :AIGC技術(shù)的基礎(chǔ)和靈魂,如深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等算法,使機(jī)器能夠模擬人類的思考和行為過程,從而自主地完成各種任務(wù)。這些
    的頭像 發(fā)表于 10-25 15:35 ?1564次閱讀

    Turbo模式1.0設(shè)置步驟

    電子發(fā)燒友網(wǎng)站提供《Turbo模式1.0設(shè)置步驟.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 10:11 ?0次下載
    Turbo模式1.0設(shè)置<b class='flag-5'>步驟</b>

    如何創(chuàng)建TestStand自定義步驟

    在之前的課程中簡(jiǎn)單地介紹過TestStand自帶的一些步驟類型,如測(cè)試、消息彈窗、賦值、標(biāo)簽等等,這些簡(jiǎn)單的步驟從TestStand的插入選版中就可以添加到序列中。那么在使用中如果碰到需要實(shí)現(xiàn)更加靈活、復(fù)雜的功能,使用自帶的一些步驟
    的頭像 發(fā)表于 09-11 14:46 ?2531次閱讀
    如何創(chuàng)建TestStand自定義<b class='flag-5'>步驟</b>