一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

100天搞定機器學習:day54 聚類系列:層次聚類原理及案例

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-10 21:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

幾張GIF理解K-均值聚類原理
k均值聚類數(shù)學推導與python實現(xiàn)
前文說了k均值聚類,他是基于中心的聚類方法,通過迭代將樣本分到k個類中,使每個樣本與其所屬類的中心或均值最近。

今天我們看一下無監(jiān)督學習之聚類方法的另一種算法,層次聚類:

層次聚類前提假設類別直接存在層次關系,通過計算不同類別數(shù)據(jù)點間的相似度來創(chuàng)建一棵有層次的嵌套聚類樹。在聚類樹中,不同類別的原始數(shù)據(jù)點是樹的最低層,樹的頂層是一個聚類的根節(jié)點。創(chuàng)建聚類樹有聚合聚類(自下而上合并)和分裂聚類(自上而下分裂)兩種方法,分裂聚類一般很少使用,不做介紹。

聚合聚類

聚合聚類具體過程

對于給定的樣本集合,開始將每個樣本分到一個類,然后再按照一定的規(guī)則(比如類間距最?。?,將滿足規(guī)則的類進行合并,反復進行,直到滿足停止條件。聚合聚類三要素有:

①距離或相似度(閔可夫斯基距離,相關系數(shù)、夾角余弦)

②合并規(guī)則(最長/短距離,中心距離,平均距離)

③停止條件(類個數(shù)或類直徑達到或超過閾值)

聚合聚類算法

輸入:n個樣本組成的樣本集合及樣本間距離

輸出:樣本集合的層次化聚類

(1)計算n個樣本兩兩之間歐氏距離{dij}

(2)構造n個類,每個類只包含一個樣本

(3)合并類間距最小的兩個類,構造一個新類

(4)計算新類與其他各類的距離,若類的個數(shù)為1,終止計算,否則回到(3)

動畫表示:

python實現(xiàn)及案例

import queue
import math
import copy
import numpy as np
import matplotlib.pyplot as plt

class clusterNode:

def __init__(self, value, id=[],left=None, right=None, distance=-1,  count=-1, check = 0):
    '''
    value: 該節(jié)點的數(shù)值,合并節(jié)點時等于原來節(jié)點值的平均值
    id:節(jié)點的id,包含該節(jié)點下的所有單個元素
    left和right:合并得到該節(jié)點的兩個子節(jié)點
    distance:兩個子節(jié)點的距離
    count:該節(jié)點所包含的單個元素個數(shù)
    check:標識符,用于遍歷時記錄該節(jié)點是否被遍歷過
    '''
    self.value = value
    self.id = id
    self.left = left
    self.right = right
    self.distance = distance
    self.count = count
    self.check = check

def show(self):
    #顯示節(jié)點相關屬性
    print(self.value,' ',self.left.id if self.left!=None else None,' ',/
        self.right.id if self.right!=None else None,' ',self.distance,' ',self.count)

class hcluster:

def distance(self,x,y):
    #計算兩個節(jié)點的距離,可以換成別的距離
    return math.sqrt(pow((x.value-y.value),2))

def minDist(self,dataset):
    #計算所有節(jié)點中距離最小的節(jié)點對
    mindist = 1000
    for i in range(len(dataset)-1):
        if dataset[i].check == 1:
            #略過合并過的節(jié)點
            continue
        for j in range(i+1,len(dataset)):
            if dataset[j].check == 1:
                continue
            dist = self.distance(dataset[i],dataset[j])
            if dist < mindist:
                mindist = dist
                x, y = i, j
    return mindist, x, y
    #返回最小距離、距離最小的兩個節(jié)點的索引

def fit(self,data):
    dataset = [clusterNode(value=item,id=[(chr(ord('a')+i))],count=1) for i,item in enumerate(data)]
    #將輸入的數(shù)據(jù)元素轉化成節(jié)點,并存入節(jié)點的列表
    length = len(dataset)
    Backup = copy.deepcopy(dataset)
    #備份數(shù)據(jù)
    while(True):
        mindist, x, y = self.minDist(dataset)
        dataset[x].check = 1
        dataset[y].check = 1
        tmpid = copy.deepcopy(dataset[x].id)
        tmpid.extend(dataset[y].id)
        dataset.append(clusterNode(value=(dataset[x].value+dataset[y].value)/2,id=tmpid,/
            left=dataset[x],right=dataset[y],distance=mindist,count=dataset[x].count+dataset[y].count))
        #生成新節(jié)點
        if len(tmpid) == length:
            #當新生成的節(jié)點已經(jīng)包含所有元素時,退出循環(huán),完成聚類
            break
    for item in dataset:
        item.show()
    return dataset

def show(self,dataset,num):
    plt.figure(1)
    showqueue = queue.Queue()
    #存放節(jié)點信息的隊列
    showqueue.put(dataset[len(dataset) - 1])
    #存入根節(jié)點
    showqueue.put(num)
    #存入根節(jié)點的中心橫坐標
    while not showqueue.empty():
        index = showqueue.get()
        #當前繪制的節(jié)點
        i = showqueue.get()
        #當前繪制節(jié)點中心的橫坐標
        left = i - (index.count)/2
        right = i + (index.count)/2
        if index.left != None:
            x = [left,right]
            y = [index.distance,index.distance]
            plt.plot(x,y)
            x = [left,left]
            y = [index.distance,index.left.distance]
            plt.plot(x,y)
            showqueue.put(index.left)
            showqueue.put(left)
        if index.right != None:
            x = [right,right]
            y = [index.distance,index.right.distance]
            plt.plot(x,y)
            showqueue.put(index.right)
            showqueue.put(right)
    plt.show()

def setData(num):

#生成num個隨機數(shù)據(jù)
Data = list(np.random.randint(1,100,size=num))
return Data

if name == '__main__':

num = 20
dataset = setData(num)
h = hcluster()
resultset = h.fit(dataset)
h.show(resultset,num)

本文由博客一文多發(fā)平臺 OpenWrite 發(fā)布!

審核編輯 黃昊宇
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134565
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122777
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    飛光電總部大廈正式啟用

    飛光電大廈位于平湖金融與現(xiàn)代服務業(yè)基地核心商圈,占地面積4,186平方米,總建筑面積40,519平方米,樓高99米,是面向未來的企業(yè)總部,集綜合辦公、總部運營、技術研發(fā)、商業(yè)配套等功能于一身
    的頭像 發(fā)表于 06-06 15:26 ?476次閱讀

    機器人與地瓜機器人達成戰(zhàn)略合作,聯(lián)合發(fā)布Aelos Embodied具身智能

    要聞4月19日,在CCF人形機器人與人工智能技術巡回研討會(武漢站)上,樂機器人與地瓜機器人達成戰(zhàn)略合作,雙方將基于RDKX5、RDKS100
    的頭像 發(fā)表于 04-24 22:07 ?560次閱讀
    樂<b class='flag-5'>聚</b><b class='flag-5'>機器</b>人與地瓜<b class='flag-5'>機器</b>人達成戰(zhàn)略合作,聯(lián)合發(fā)布Aelos Embodied具身智能

    網(wǎng)線超6與6的區(qū)別

    網(wǎng)線超6(Cat 6a)與6(Cat 6)的主要區(qū)別如下: 1. 傳輸性能 6網(wǎng)線(Cat 6): 支持最高250 MHz的帶寬。 適用于千兆以太網(wǎng)(1 Gbps),最大傳輸距離100
    的頭像 發(fā)表于 04-16 10:04 ?3331次閱讀

    **【技術干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54
    發(fā)表于 04-01 00:00

    速騰創(chuàng)第100萬臺激光雷達下線,用于人形機器人?

    電子發(fā)燒友網(wǎng)綜合報道 數(shù)日前,RoboSense 速騰創(chuàng)成功交付了其第 100 萬臺激光雷達,訂單接收方為人形機器人(上海)有限公司。速騰創(chuàng)由此成為全球首家實現(xiàn)百萬臺高線數(shù)激光雷達
    發(fā)表于 03-16 01:00 ?683次閱讀

    數(shù)據(jù)降維工具介紹——SpatialPCA

    現(xiàn)有常用的空間轉錄組降維方法,如主成分分析(principal component analysis,PCA)、非負矩陣分解(non-negative matrix factorization
    的頭像 發(fā)表于 02-07 11:19 ?609次閱讀
    數(shù)據(jù)降維<b class='flag-5'>聚</b><b class='flag-5'>類</b>工具介紹——SpatialPCA

    輝貿易”獲千萬天使輪融資

    近日,“輝貿易”成功完成了1000萬人民幣的天使輪融資,本輪融資由深圳市風投創(chuàng)業(yè)投資有限公司領投。這一輪融資的注入,為“輝貿易”的未來發(fā)展注入了強勁的動力。 據(jù)“輝貿易”相關負責人介紹,此次
    的頭像 發(fā)表于 01-02 11:15 ?734次閱讀

    超五網(wǎng)線與五網(wǎng)線區(qū)別

    100BASE-TX網(wǎng)絡,即支持最大傳輸速率為100Mbps的快速以太網(wǎng)。 超五網(wǎng)線(Cat 5e) : 超五網(wǎng)線是
    的頭像 發(fā)表于 12-28 11:37 ?5187次閱讀

    機器人回應華為合作傳聞

    近日,有關“華為特別選擇樂機器人作為人形機器人領域的本地生態(tài)合作伙伴,并計劃于2025年發(fā)布并實現(xiàn)一定規(guī)模量產(chǎn)”的消息在業(yè)界流傳。針對這一傳聞,樂
    的頭像 發(fā)表于 12-05 13:53 ?845次閱讀

    機器人回應與華為合作傳聞:未發(fā)布相關信息

    近期,有傳聞稱華為特別選擇了樂機器人作為其人形機器人領域的本地生態(tài)合作伙伴,并計劃于2025年發(fā)布并實現(xiàn)一定規(guī)模的量產(chǎn)。然而,對于這一傳聞,樂
    的頭像 發(fā)表于 12-04 11:21 ?1003次閱讀

    Java 枚舉與策略模式、函數(shù)式接口的結合:實現(xiàn)高內低耦合的設計

    作者:京東物流 楊唯一 一、Java 枚舉 Java 枚舉是一個特殊的,一般表示一組常量,比如一年的 4 個季節(jié),一年的 12 個月份,一個星期的 7 ,方向有東南西北等。 我們在業(yè)務需求開發(fā)
    的頭像 發(fā)表于 11-21 14:06 ?629次閱讀

    使用CUDA-Q實現(xiàn)量子算法

    量子計算機能夠利用疊加、糾纏和干涉等量子特性,從數(shù)據(jù)中歸納出知識點并獲得洞察。這些量子機器學習(QML)技術最終將在量子加速的超級計算機上運行,這種超級計算機結合了 CPU、GPU 和 QPU 的處理能力,能夠解決一些世界上最復雜的難題。
    的頭像 發(fā)表于 11-20 10:14 ?715次閱讀
    使用CUDA-Q實現(xiàn)量子<b class='flag-5'>聚</b><b class='flag-5'>類</b>算法

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關于時間序列進行大數(shù)
    發(fā)表于 08-11 17:55

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    本帖最后由 1653149838.791300 于 2024-8-12 20:18 編輯 [/td] [td]收到《時間序列與機器學習》這本書,很是欣喜,書籍內容很詳實也是自己很感興趣
    發(fā)表于 08-07 23:03

    6網(wǎng)線和5網(wǎng)線的區(qū)別

    網(wǎng)線(Cat6)和五網(wǎng)線(Cat5)是兩種不同類型的網(wǎng)絡線纜,它們在多個方面存在顯著差異。以下是它們之間的主要區(qū)別: 1. 傳輸速率與帶寬 五網(wǎng)線:傳輸速率為100Mbps,帶
    的頭像 發(fā)表于 08-05 09:50 ?6198次閱讀