一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

kNN算法是監(jiān)督學(xué)習(xí)中分類方法的一種

lviY_AI_shequ ? 來源:未知 ? 作者:李倩 ? 2018-09-19 17:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.引言

頂級(jí)數(shù)據(jù)挖掘會(huì)議ICDM于2006年12月評(píng)選出了數(shù)據(jù)挖掘領(lǐng)域的十大經(jīng)典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Na?ve Bayes與 CART。 以前看過關(guān)于這些數(shù)據(jù)挖掘算法,但對(duì)背后數(shù)學(xué)原理未做過多探究,因而借此整理以更深入地理解這些算法。

本文討論的kNN算法是監(jiān)督學(xué)習(xí)中分類方法的一種。所謂監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí),是指訓(xùn)練數(shù)據(jù)是否有標(biāo)注類別,若有則為監(jiān)督學(xué)習(xí),若否則為非監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)是根據(jù)輸入數(shù)據(jù)(訓(xùn)練數(shù)據(jù))學(xué)習(xí)一個(gè)模型,能對(duì)后來的輸入做預(yù)測(cè)。在監(jiān)督學(xué)習(xí)中,輸入變量與輸出變量可以是連續(xù)的,也可以是離散的。若輸入變量與輸出變量均為連續(xù)變量,則稱為回歸;輸出變量為有限個(gè)離散變量,則稱為分類;輸入變量與輸出變量均為變量序列,則稱為標(biāo)注[2]。

2.kNN算法

kNN算法的核心思想非常簡(jiǎn)單:在訓(xùn)練集中選取離輸入的數(shù)據(jù)點(diǎn)最近的k個(gè)鄰居,根據(jù)這個(gè)k個(gè)鄰居中出現(xiàn)次數(shù)最多的類別(最大表決規(guī)則),作為該數(shù)據(jù)點(diǎn)的類別。

算法描述

訓(xùn)練,其類別,訓(xùn)練集中樣本點(diǎn)數(shù)為N,類別數(shù)為K。輸入待預(yù)測(cè)數(shù)據(jù),則預(yù)測(cè)類別

其中,涵蓋的k鄰域記作,當(dāng)時(shí)指示函數(shù),否則。

分類決策規(guī)則

kNN學(xué)習(xí)模型:輸入,通過學(xué)習(xí)得到?jīng)Q策函數(shù):輸出類別。假設(shè)分類損失函數(shù)為0-1損失函數(shù),即分類正確時(shí)損失函數(shù)值為0,分類錯(cuò)誤時(shí)則為1。假如給預(yù)測(cè)類別為,即;同時(shí)由式子(1)可知k鄰域的樣本點(diǎn)對(duì)學(xué)習(xí)模型的貢獻(xiàn)度是均等的,則kNN學(xué)習(xí)模型誤分類率為

若要最小化誤分類率,則應(yīng)

所以,最大表決規(guī)則等價(jià)于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化。

存在問題

k值得選取對(duì)kNN學(xué)習(xí)模型有著很大的影響。若k值過小,預(yù)測(cè)結(jié)果會(huì)對(duì)噪音樣本點(diǎn)顯得異常敏感。特別地,當(dāng)k等于1時(shí),kNN退化成最近鄰算法,沒有了顯式的學(xué)習(xí)過程。若k值過大,會(huì)有較大的鄰域訓(xùn)練樣本進(jìn)行預(yù)測(cè),可以減小噪音樣本點(diǎn)的減少;但是距離較遠(yuǎn)的訓(xùn)練樣本點(diǎn)對(duì)預(yù)測(cè)結(jié)果會(huì)有貢獻(xiàn),以至于造成預(yù)測(cè)結(jié)果錯(cuò)誤。下圖給出k值的選取對(duì)于預(yù)測(cè)結(jié)果的影響:

前面提到過,k鄰域的樣本點(diǎn)對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)度是相等的;但距離更近的樣本點(diǎn)應(yīng)有更大的相似度,其貢獻(xiàn)度應(yīng)比距離更遠(yuǎn)的樣本點(diǎn)大??梢约由蠙?quán)值進(jìn)行修正,則最大表決原則變成:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4711

    瀏覽量

    95447
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    24724

原文標(biāo)題:【十大經(jīng)典數(shù)據(jù)挖掘算法】kNN

文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?700次閱讀
    使用MATLAB進(jìn)行無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機(jī)器監(jiān)督學(xué)習(xí)下面的分類問題?

    人工智能下面有哪些機(jī)器學(xué)習(xí)分支?如何用卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法去解決機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)下面的分類問題?
    發(fā)表于 06-16 08:09

    基于半監(jiān)督學(xué)習(xí)框架的識(shí)別算法

    問題,對(duì)半監(jiān)督學(xué)習(xí)中的協(xié)同訓(xùn)練算法進(jìn)行改進(jìn),提出了一種基于多學(xué)習(xí)器協(xié)同訓(xùn)練模型的人體行為識(shí)別方法.這是
    發(fā)表于 01-21 10:41 ?1次下載

    你想要的機(jī)器學(xué)習(xí)課程筆記在這:主要討論監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)

    with experience E(個(gè)程序從經(jīng)驗(yàn)E中學(xué)習(xí)解決任務(wù)T進(jìn)行某任務(wù)量度P,通過P測(cè)量在T的表現(xiàn)而提高經(jīng)驗(yàn)E(另一種定義:機(jī)器學(xué)習(xí)
    發(fā)表于 12-03 17:12 ?731次閱讀

    如何用Python進(jìn)行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)一種用于在數(shù)據(jù)中查找模式的機(jī)器學(xué)習(xí)技術(shù)。無監(jiān)督算法給出的數(shù)據(jù)不帶標(biāo)記,只給出輸入變量(X),沒有相應(yīng)的輸出變量。在無
    的頭像 發(fā)表于 01-21 17:23 ?4682次閱讀

    詳解機(jī)器學(xué)習(xí)分類算法KNN

    本文主要介紹個(gè)被廣泛使用的機(jī)器學(xué)習(xí)分類算法,K-nearest neighbors(KNN),中文叫K近鄰
    的頭像 發(fā)表于 10-31 17:18 ?6562次閱讀

    機(jī)器學(xué)習(xí)算法中有監(jiān)督和無監(jiān)督學(xué)習(xí)的區(qū)別

    監(jiān)督學(xué)習(xí)的好處之是,它不需要監(jiān)督學(xué)習(xí)必須經(jīng)歷的費(fèi)力的數(shù)據(jù)標(biāo)記過程。但是,要權(quán)衡的是,評(píng)估其性能的有效性也非常困難。相反,通過將監(jiān)督學(xué)習(xí)算法
    的頭像 發(fā)表于 07-07 10:18 ?6115次閱讀

    最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

    導(dǎo)讀 最基礎(chǔ)的半監(jiān)督學(xué)習(xí)的概念,給大家個(gè)感性的認(rèn)識(shí)。 半監(jiān)督學(xué)習(xí)(SSL)是一種機(jī)器學(xué)習(xí)技術(shù),其中任務(wù)是從
    的頭像 發(fā)表于 11-02 16:08 ?2959次閱讀

    監(jiān)督學(xué)習(xí)最基礎(chǔ)的3個(gè)概念

    導(dǎo)讀 今天給大家介紹半監(jiān)督學(xué)習(xí)中的3個(gè)最基礎(chǔ)的概念:致性正則化,熵最小化和偽標(biāo)簽,并介紹了兩個(gè)經(jīng)典的半監(jiān)督學(xué)習(xí)方法。 沒看的點(diǎn)這里哈:半監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 11-02 16:14 ?3292次閱讀
    半<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>最基礎(chǔ)的3個(gè)概念

    監(jiān)督學(xué)習(xí):比監(jiān)督學(xué)習(xí)做的更好

    監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類型。從它的概念開始,無數(shù)的算法,從簡(jiǎn)單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來提高精...
    的頭像 發(fā)表于 12-08 23:32 ?1719次閱讀

    一種基于光滑表示的半監(jiān)督分類算法

    。文中提岀了一種基于光滑表示的半監(jiān)督分類算法。具體來說,此方法通過應(yīng)用個(gè)低通濾波器來實(shí)現(xiàn)數(shù)據(jù)的
    發(fā)表于 04-08 10:47 ?17次下載
    <b class='flag-5'>一種</b>基于光滑表示的半<b class='flag-5'>監(jiān)督</b><b class='flag-5'>分類</b><b class='flag-5'>算法</b>

    一種基于DE和ELM的半監(jiān)督分類方法

    演化算法和分析方法的結(jié)合是機(jī)器學(xué)習(xí)領(lǐng)域近幾年的個(gè)研究熱點(diǎn)。研究如何將差分進(jìn)化(DE)演化算法與基于超限
    發(fā)表于 04-09 16:16 ?5次下載
    <b class='flag-5'>一種</b>基于DE和ELM的半<b class='flag-5'>監(jiān)督</b><b class='flag-5'>分類</b><b class='flag-5'>方法</b>

    機(jī)器學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)應(yīng)用在哪些領(lǐng)域

    解決數(shù)據(jù)中心、云計(jì)算、人工智能和邊緣計(jì)算等各個(gè)行業(yè)的問題,為人們帶來極大便益。 自監(jiān)督學(xué)習(xí)是什么? 自監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的關(guān)系 自我監(jiān)督
    發(fā)表于 01-20 10:52 ?5263次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>中的無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>應(yīng)用在哪些領(lǐng)域

    一種基于偽標(biāo)簽半監(jiān)督學(xué)習(xí)的小樣本調(diào)制識(shí)別算法

    一種基于偽標(biāo)簽半監(jiān)督學(xué)習(xí)的小樣本調(diào)制識(shí)別算法 來源:《西北工業(yè)大學(xué)學(xué)報(bào)》,作者史蘊(yùn)豪等 摘 要:針對(duì)有標(biāo)簽樣本較少條件下的通信信號(hào)調(diào)制識(shí)別問題,提出了一種基于偽標(biāo)簽半
    發(fā)表于 02-10 11:37 ?1163次閱讀

    KNN算法、分類回歸樹、隨機(jī)森林的優(yōu)缺點(diǎn)及應(yīng)用實(shí)例

    KNN屬于一種監(jiān)督學(xué)習(xí)分類算法,用于訓(xùn)練的數(shù)據(jù)集是完全正確且已分好類的。
    的頭像 發(fā)表于 11-11 10:11 ?6670次閱讀