一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

了解數(shù)據(jù)挖掘的概念和特點(diǎn)

如意 ? 來源:百家號 ? 作者:看數(shù)據(jù)說事兒 ? 2020-06-29 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)挖掘源自《從數(shù)據(jù)庫中發(fā)現(xiàn)知識》(縮寫為KDD)。它首次出現(xiàn)在1989年8月在底特律舉行的第十一屆國際聯(lián)合人工智能會議上。為了統(tǒng)一理解,F(xiàn)ayyad,Piatetsky-Shapiro和Smyth在權(quán)威文章集《知識發(fā)現(xiàn)與數(shù)據(jù)進(jìn)展》中給出了KDD和數(shù)據(jù)挖掘的最新定義。從中總結(jié)了1996年該領(lǐng)域的進(jìn)展,并予以區(qū)分:

KDD的定義是:KDD是從數(shù)據(jù)中識別有效,新穎,潛在有用且最終可以理解的模式的過程。

數(shù)據(jù)挖掘的定義是:數(shù)據(jù)挖掘是KDD中的一步,它使用特定算法在可接受的計(jì)算效率限制內(nèi)生成特定模式。

數(shù)據(jù)挖掘技術(shù)的特點(diǎn)

1.基于大量數(shù)據(jù):不是說無法挖掘小數(shù)據(jù)量。實(shí)際上,大多數(shù)數(shù)據(jù)挖掘算法都可以在較小的數(shù)據(jù)量上運(yùn)行并獲得結(jié)果。但是,一方面,過小的數(shù)據(jù)量可以通過手動分析來總結(jié),另一方面,小數(shù)據(jù)量通常不能反映現(xiàn)實(shí)世界的一般特征。

2.非平凡性:所謂非平凡的意思是指所挖掘的知識是不簡單的。一定不能與著名體育評論員所說的相似:“經(jīng)過我的計(jì)算,直到比賽結(jié)束我才發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象。本屆世界杯的進(jìn)球數(shù)和失球數(shù)都是相同的。非常巧合!”這種知識。這似乎沒有必要,但是許多不了解業(yè)務(wù)知識的數(shù)據(jù)挖掘新手經(jīng)常會犯此錯(cuò)誤。

3.隱含性:數(shù)據(jù)挖掘是發(fā)現(xiàn)數(shù)據(jù)深處的知識,而不是直接出現(xiàn)在數(shù)據(jù)表面的信息。常用的BI工具(例如億信BI和豌豆BI)完全可以讓用戶找到此信息。

4.新奇性:挖掘的知識以前應(yīng)該是未知的,否則僅是為了驗(yàn)證業(yè)務(wù)專家的經(jīng)驗(yàn)。只有新知識才能幫助公司獲得進(jìn)一步的洞察力。

5.價(jià)值性:挖掘的結(jié)果必須為企業(yè)帶來直接或間接的利益。有人說數(shù)據(jù)挖掘只是“殺龍技術(shù)”。它看起來牛氣哄哄,但沒有用。這只是一個(gè)錯(cuò)誤的想法。不可否認(rèn)的是,在某些數(shù)據(jù)挖掘項(xiàng)目中,由于缺乏明確的業(yè)務(wù)目標(biāo),或者由于數(shù)據(jù)質(zhì)量不足,或者由于人們抵制不斷變化的業(yè)務(wù)流程,又或者由于挖掘人員缺乏經(jīng)驗(yàn),都會導(dǎo)致結(jié)果不佳甚至根本沒有效果。但是,大量成功的案例也證明了數(shù)據(jù)挖掘確實(shí)可以成為提高效率的武器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249447
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    24710
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    解數(shù)據(jù)瓶頸:智能汽車合成數(shù)據(jù)架構(gòu)與應(yīng)用實(shí)踐

    智能汽車感知系統(tǒng)面臨數(shù)據(jù)困境,如結(jié)構(gòu)復(fù)雜、成本高昂、覆蓋受限、合規(guī)性與隱私風(fēng)險(xiǎn)突出。合成數(shù)據(jù)作為新型數(shù)據(jù)生成方式,以高度可配置性、自動化、可復(fù)現(xiàn)為特點(diǎn),有望解決這些問題。
    的頭像 發(fā)表于 07-15 11:48 ?133次閱讀
    破<b class='flag-5'>解數(shù)據(jù)</b>瓶頸:智能汽車合成<b class='flag-5'>數(shù)據(jù)</b>架構(gòu)與應(yīng)用實(shí)踐

    三一挖掘機(jī)一鍵啟動開關(guān)易壞的原因及更換注意事項(xiàng)

    三一挖掘機(jī)一鍵啟動開關(guān)易壞的原因雖然三一挖掘機(jī)的一鍵啟動系統(tǒng)設(shè)計(jì)旨在提高便利性和安全性,但在實(shí)際使用中,可能會出現(xiàn)一些問題導(dǎo)致開關(guān)易壞。這些問題可能包括:頻繁使用:挖掘機(jī)在施工過程中頻繁啟動和關(guān)閉
    發(fā)表于 03-12 09:29

    數(shù)據(jù)I/O模塊的概念特點(diǎn)以及作用

    ? 本文簡單介紹了數(shù)據(jù)I/O模塊的概念、特點(diǎn)以及作用。 一、數(shù)據(jù) I/O 模塊是什么 1. 承接內(nèi)外數(shù)據(jù)交互的“橋梁”
    的頭像 發(fā)表于 01-21 11:10 ?912次閱讀

    硬件處理模塊的概念特點(diǎn)和在系統(tǒng)中的位置

    本文介紹了硬件處理模塊的概念、特點(diǎn)和在系統(tǒng)中的位置。 一、硬件處理模塊的基本概念?專注于特定功能? 硬件處理模塊可以理解為在芯片內(nèi)部專門“定制”出來的一塊邏輯電路,用于完成某類固定的計(jì)算或操作。它不
    的頭像 發(fā)表于 01-20 13:52 ?703次閱讀
    硬件處理模塊的<b class='flag-5'>概念</b>、<b class='flag-5'>特點(diǎn)</b>和在系統(tǒng)中的位置

    了解虛擬電廠的基本概念

    虛擬電廠的基本概念: 虛擬電廠是一種基于現(xiàn)代信息技術(shù)和能源互聯(lián)網(wǎng)的能源管理模式,它將分散的、可再生能源和儲能設(shè)備通過虛擬化技術(shù)進(jìn)行集成和管理,形成一個(gè)具有集中調(diào)度、統(tǒng)一運(yùn)營和優(yōu)化控制的虛擬化電力系統(tǒng)
    的頭像 發(fā)表于 12-24 17:12 ?952次閱讀
    <b class='flag-5'>了解</b>虛擬電廠的基本<b class='flag-5'>概念</b>

    什么是大屏數(shù)據(jù)可視化?特點(diǎn)有哪些?

    介紹: 特點(diǎn) 直觀易懂:大屏數(shù)據(jù)可視化通過圖表、圖形和其他可視化元素,將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為直觀易懂的形式,使得用戶無需深入挖掘數(shù)據(jù)細(xì)節(jié)即可快速
    的頭像 發(fā)表于 12-16 16:59 ?686次閱讀

    DAC81408的建立時(shí)間為12uS,如何理解數(shù)據(jù)手冊中的12uS建立時(shí)間這個(gè)參數(shù)呢?

    中建立時(shí)間曲線,±20V輸出,如果按照數(shù)據(jù)手冊中4V/uS爬升速率計(jì)算,0到20V跳變時(shí)間為5uS,從以上兩圖頁可以看出,信號在5uS內(nèi)達(dá)到設(shè)定值20V,該時(shí)間也小于建立時(shí)間典型值12uS。 請問如何理解數(shù)據(jù)手冊中的12uS建立時(shí)間這個(gè)參數(shù)呢
    發(fā)表于 12-09 08:33

    了解無功補(bǔ)償?shù)?b class='flag-5'>概念

    關(guān)注“acrelzx”微信號,了解更多產(chǎn)品資訊,可咨詢相關(guān)案例 (具體咨詢安科瑞187021張欣11310) 無功補(bǔ)償,是一種在電力供電系統(tǒng)中起提高電網(wǎng)的功率因數(shù)的作用,降低供電變壓器及輸送線
    的頭像 發(fā)表于 11-15 09:08 ?620次閱讀
    <b class='flag-5'>了解</b>無功補(bǔ)償?shù)?b class='flag-5'>概念</b>

    精準(zhǔn)定位隧道挖掘通訊難題:虹科PCAN卡如何滿足專業(yè)通訊需求?

    在現(xiàn)代隧道挖掘行業(yè)中,電控系統(tǒng)作為設(shè)備的“大腦”,其性能優(yōu)劣直接關(guān)系到設(shè)備的整體運(yùn)作效率與安全性。本文將深入探討虹科PCAN卡在隧道挖掘機(jī)器電控系統(tǒng)中的應(yīng)用,了解它是如何提升設(shè)備性能,確保工程
    的頭像 發(fā)表于 11-14 01:01 ?540次閱讀
    精準(zhǔn)定位隧道<b class='flag-5'>挖掘</b>通訊難題:虹科PCAN卡如何滿足專業(yè)通訊需求?

    如何進(jìn)行有效的eda分析

    進(jìn)行有效的EDA(Exploratory Data Analysis,探索性數(shù)據(jù)分析)分析,是數(shù)據(jù)科學(xué)中的關(guān)鍵步驟,它能夠幫助分析人員深入了解數(shù)據(jù)、發(fā)現(xiàn)潛在的模式,并為進(jìn)一步的分析和建模提供
    的頭像 發(fā)表于 11-13 10:48 ?986次閱讀

    開關(guān)量和模擬量的基本概念特點(diǎn)及應(yīng)用

    、開關(guān)量的基本概念 開關(guān)量是一種數(shù)字信號,它只有兩種狀態(tài):高電平(通常為1)和低電平(通常為0)。這種信號的特點(diǎn)是簡單、直觀,易于處理和控制。在實(shí)際應(yīng)用中,開關(guān)量通常用于控制電路的通斷,實(shí)現(xiàn)設(shè)備的啟停、切換等功能。
    的頭像 發(fā)表于 08-30 11:10 ?2337次閱讀

    如何利用traceroute命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負(fù)載均衡

    在網(wǎng)絡(luò)管理和故障排除中,了解數(shù)據(jù)包的路徑和識別負(fù)載均衡節(jié)點(diǎn)是非常重要的。traceroute 命令是一個(gè)用于跟蹤數(shù)據(jù)包在網(wǎng)絡(luò)中經(jīng)過的路由路徑的工具。本文將詳細(xì)介紹如何利用 traceroute 命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負(fù)載均衡,并解釋相關(guān)的概念
    的頭像 發(fā)表于 08-07 15:13 ?922次閱讀
    如何利用traceroute命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負(fù)載均衡

    中科曙光受邀參加第十屆中國數(shù)據(jù)挖掘會議

    近日,國內(nèi)數(shù)據(jù)挖掘領(lǐng)域最主要的學(xué)術(shù)活動之一—第十屆中國數(shù)據(jù)挖掘會議(CCDM2024)于山東泰安舉行,中科曙光參與并分享了曙光AI構(gòu)建產(chǎn)學(xué)研用的生態(tài)實(shí)踐。
    的頭像 發(fā)表于 08-01 10:43 ?868次閱讀

    數(shù)字電路的基礎(chǔ)概念:MOS晶體管

    對于從事芯片行業(yè)的人員來說,還是有必要了解數(shù)字電路中的一些基本概念,例如用作邏輯開關(guān)的 MOS 晶體管。當(dāng)然,我們的目的是了解現(xiàn)代芯片中的行為本質(zhì),而不需要陷入半導(dǎo)體物理方程。
    的頭像 發(fā)表于 07-29 10:02 ?1666次閱讀
    數(shù)字電路的基礎(chǔ)<b class='flag-5'>概念</b>:MOS晶體管

    BP網(wǎng)絡(luò)的基本概念和訓(xùn)練原理

    )的多層前饋神經(jīng)網(wǎng)絡(luò)。BP網(wǎng)絡(luò)自1985年提出以來,因其強(qiáng)大的學(xué)習(xí)和適應(yīng)能力,在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識別等領(lǐng)域得到了廣泛應(yīng)用。以下將對BP網(wǎng)絡(luò)的基本概念、訓(xùn)練原理及其優(yōu)缺點(diǎn)進(jìn)行詳細(xì)闡述。
    的頭像 發(fā)表于 07-19 17:24 ?3194次閱讀