一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)分析過程中幾個(gè)可能常見的陷阱

數(shù)據(jù)分析與開發(fā) ? 來源:木木自由 ? 作者:木兮月寶 ? 2021-09-23 16:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言 很多的數(shù)據(jù)分析人員往往太過于去關(guān)注數(shù)據(jù)或者分析方法論等,尤其是對于剛?cè)腴T的,在解讀數(shù)據(jù)過程中,受到數(shù)據(jù)來源、采集方法、統(tǒng)計(jì)口徑、分析方法、業(yè)務(wù)經(jīng)驗(yàn)、思考方式等因素影響,就會(huì)出現(xiàn)一些容易忽視的“陷阱”,以致于得出的結(jié)果很可能出現(xiàn)偏差。所以,重視數(shù)據(jù)分析是好的,但也千萬不能掉進(jìn)數(shù)據(jù)分析的“陷阱”里。

那么,本文我們將從業(yè)務(wù)層面的視角,來探討和梳理在數(shù)據(jù)分析過程中幾個(gè)可能常見“陷阱”,目的是主要給剛?cè)腴T的、產(chǎn)品、運(yùn)營等提供一些有益經(jīng)驗(yàn)分享,幫助大家在實(shí)際工作場景中遇到這些情況的時(shí)候,可以盡量規(guī)避一些不太注意的“陷阱”。

1

不了解數(shù)據(jù)來源,不確保數(shù)據(jù)的正確性

在數(shù)據(jù)分析中更注重的是分析,而并不是數(shù)據(jù)本身,這就造成了數(shù)據(jù)分析最大的陷阱:不了解數(shù)據(jù)來源,不確保數(shù)據(jù)的正確性,就開始分析了。因此,數(shù)據(jù)分析的第一步就是了解數(shù)據(jù)來源,確保數(shù)據(jù)準(zhǔn)確性。 比如,一個(gè)考勤軟件的App在做渠道投放,上線了新版的落地頁。

上線了一段時(shí)間數(shù)據(jù)穩(wěn)定后,業(yè)務(wù)人員從數(shù)據(jù)發(fā)現(xiàn),此某個(gè)渠道的落地頁點(diǎn)擊率、轉(zhuǎn)化率等數(shù)據(jù)相比其他渠道的投放的效果高出很多,從數(shù)據(jù)中,可以看到說明這個(gè)渠道來的用戶效果很好,以后就要加大這個(gè)渠道的投放。然而,突然接到技術(shù)人員的反饋,在數(shù)據(jù)埋點(diǎn)的時(shí)候不小心埋錯(cuò)了,導(dǎo)致統(tǒng)計(jì)數(shù)據(jù)出現(xiàn)問題,這個(gè)渠道的數(shù)據(jù)是其他兩個(gè)渠道總和! 因?yàn)殄e(cuò)誤的數(shù)據(jù),得出了錯(cuò)誤的分析結(jié)果,并且還做了后續(xù)錯(cuò)誤決策。由此可見,有效數(shù)據(jù)分析的前提,是對正確的數(shù)據(jù)做分析。尤其是在小公司的人員,沒有強(qiáng)大的數(shù)據(jù)團(tuán)隊(duì),可能就會(huì)借用各種各種第三方的統(tǒng)計(jì)軟件來做數(shù)據(jù)埋點(diǎn),此時(shí)首要確認(rèn)數(shù)據(jù)的正確性,去梳理數(shù)據(jù)來源。

2

需求不匹配,分析目的不明確

梳理了數(shù)據(jù)來源,確保數(shù)據(jù)的準(zhǔn)確性,是前提。那么接下來就是需要明確分析目的,分析目的明確了,后面的各種統(tǒng)計(jì)數(shù)據(jù)和分析方法以及分析結(jié)果才有意義。當(dāng)明確目的后,才有后續(xù)的分析思路。 比如,一個(gè)考勤軟件的App的業(yè)務(wù)人員提出轉(zhuǎn)化率較低,是否有優(yōu)化的空間的需求。

然而我們并沒有進(jìn)一步的確認(rèn)是哪個(gè)環(huán)節(jié)轉(zhuǎn)化率低,就開始直接拉取數(shù)據(jù)進(jìn)行分析,其實(shí)業(yè)務(wù)人員說的是新用戶會(huì)員成單的轉(zhuǎn)化率,是不是來源不精準(zhǔn),能否優(yōu)化渠道或者停止投放,而我們得到的需求不明確,溝通的時(shí)候也未能進(jìn)一步的明確分析目的,就是直接拉取各個(gè)環(huán)節(jié)的轉(zhuǎn)化率,導(dǎo)致拉取的數(shù)據(jù)與原始問題不匹配。

因此,根據(jù)業(yè)務(wù)方的需求,首先要明確為什么要做數(shù)據(jù)分析,要解決什么問題,也就是分析的目的。然后針對分析目的,搭建分析框架,選擇分析方法和具體分析指標(biāo),以及明確抽取哪些數(shù)據(jù),用到哪些圖表等分析思路,只有對分析目的有清晰的認(rèn)識(shí),才會(huì)避開為分析而分析的誤區(qū),分析的結(jié)果和過程就越有價(jià)值。

3

未清理數(shù)據(jù),數(shù)據(jù)采集出現(xiàn)偏差

在了解數(shù)據(jù)來源、確保了準(zhǔn)確性、明確分析需求后,下一步就是數(shù)據(jù)采集和數(shù)據(jù)清洗了,這也是最容易出問題的環(huán)節(jié),有些問題甚至非常隱蔽難以發(fā)現(xiàn)。因此,數(shù)據(jù)本身沒有觀點(diǎn),分析時(shí)不能預(yù)設(shè)觀點(diǎn),只傾向于那些能夠支持自己的觀點(diǎn)的數(shù)據(jù),并在數(shù)據(jù)清洗中,合理的識(shí)別數(shù)據(jù)容量大小、剔除臟數(shù)據(jù)。

注意選擇性偏見或者幸存者偏見??傮w樣本中,任意一個(gè)群體樣本的平均值,都會(huì)圍繞在這個(gè)群體的整體平均值周圍?;谶@個(gè)原理,我們便可以采用隨機(jī)抽樣的方式來對整體樣本中的一個(gè)小群體進(jìn)行分析,得出的結(jié)論是會(huì)比較接近真實(shí)情況的。但是你采集數(shù)據(jù)的過程是否是真的隨機(jī)。

比如,在一個(gè)考勤軟件APP應(yīng)用升級期間,通過衡量用戶的日活、留存率、活躍企業(yè)數(shù)等指標(biāo),來判斷用戶對新版本的喜歡是否優(yōu)于老版本。但這里實(shí)際就隱藏了選擇性偏見,因?yàn)樾掳姹景l(fā)布時(shí),第一批升級上來的用戶往往就是最活躍的用戶。

這批用戶在這些指標(biāo)上,本來表現(xiàn)就是優(yōu)于一般用戶的,因此指標(biāo)數(shù)據(jù)更高并不能說明更好。 注意數(shù)據(jù)樣本容量不夠。我們在分析某特定的用戶行為數(shù)據(jù)時(shí),可能用戶使用很少的情況?;蛘呤窃谔崛?shù)據(jù)的過程中,增加了很多的限制條件或者多種用戶行為或?qū)傩赃M(jìn)行交叉后,得到很少的用戶樣本。

此時(shí),得出的分析結(jié)果未必可信。因?yàn)榇髷?shù)定律,只有當(dāng)數(shù)據(jù)量達(dá)到一定程度后,才能反映出特定的規(guī)律。但是樣本容量多少才算合理,通常只能是具體問題具體分析。 比如,在一個(gè)考勤軟件APP應(yīng)用新上了學(xué)習(xí)打卡的新功能,但由于前期無預(yù)算做推廣,導(dǎo)致新功能只有在小部分老用戶群體中曝光,因此,從數(shù)據(jù)中來判斷此功能并不受歡迎。

但這里實(shí)際就存在數(shù)據(jù)樣本容量不夠,并不能說明問題。因此,遇到這種情況,建議可以把時(shí)間線拉長,這樣可能會(huì)獲得足量的樣本。還有一種做法是,將不重要的限定條件去掉,也可以增大樣本數(shù)。注意存在臟數(shù)據(jù)。臟數(shù)據(jù)是指嚴(yán)重不合理或?qū)τ趯?shí)際業(yè)務(wù)毫無意義的數(shù)據(jù),通常是由程序bug、第三方攻擊、人為等原因造成的。這種數(shù)據(jù)對指標(biāo)的準(zhǔn)確度影響較大。

比如,我們要分析在一個(gè)考勤軟件APP中各個(gè)企業(yè)類型打卡規(guī)則的分布情況,而用于分析用戶打卡視角中,有較多是個(gè)人打卡并不是我們要分析的目標(biāo)群體或者有人的工種的特殊性,就會(huì)造成打卡規(guī)則的分布不規(guī)則的情況,容易造成對用戶喜好的誤判。因此,對臟數(shù)據(jù)的清洗和處理,也是數(shù)據(jù)分析人員日常工作中非常重要的一部分。在分析具體業(yè)務(wù)時(shí),也要針對特定業(yè)務(wù),過濾掉異常數(shù)據(jù),來確保擁有比較好的數(shù)據(jù)質(zhì)量。

4

指標(biāo)不合理,數(shù)據(jù)具備時(shí)效性

清洗完數(shù)據(jù)后,下一步就需要明確分析的數(shù)據(jù)指標(biāo),進(jìn)行數(shù)據(jù)分析,其數(shù)據(jù)分析的結(jié)果通常是各種各樣的指標(biāo),每個(gè)指標(biāo)都有自己的統(tǒng)計(jì)邏輯,反映的事物的某些方面的本質(zhì)。 比如,很多時(shí)候我們會(huì)使用平均值來描述一組數(shù)據(jù)的集中趨勢。

我們在制定業(yè)務(wù)閾值時(shí),也經(jīng)常會(huì)參考平均值。但是,有些業(yè)務(wù)場景不適合使用平均值。就像變化比較大,存在極端值的數(shù)據(jù),或者是對最終結(jié)果影響不一致的數(shù)據(jù)。這種時(shí)候,你就要考慮其他指標(biāo),如加權(quán)平均值、百分位數(shù)、小數(shù)值合并后再求平均值。 因此,在進(jìn)行數(shù)據(jù)分析時(shí),如果不能選擇正確的指標(biāo),也可能會(huì)走入誤區(qū),從而得出錯(cuò)誤的結(jié)論。數(shù)據(jù)是具備一定的時(shí)效性,不同情況下的數(shù)據(jù),一些曾經(jīng)的數(shù)據(jù)可能不再適用,需要找到新的數(shù)據(jù)指標(biāo)。

5

套用方法論,分析結(jié)論不嚴(yán)謹(jǐn)

明確好數(shù)據(jù)分析指標(biāo),接下來就是通過各種數(shù)據(jù)分析方法來分析數(shù)據(jù),得出結(jié)論,支持業(yè)務(wù)決策。數(shù)據(jù)分析方法論是對一個(gè)數(shù)據(jù)分析項(xiàng)目的整體工作起到指導(dǎo)作用的思路模型。然而,在數(shù)據(jù)分析學(xué)習(xí)時(shí)或許習(xí)慣了各種解題套路,但實(shí)操時(shí)其實(shí)并不存在通用的分析套路。

不同的行業(yè)、不同的業(yè)務(wù),不同的階段,哪怕用的是同一種分析方法結(jié)論都應(yīng)有所區(qū)別。 比如,在實(shí)際工作場景中,數(shù)據(jù)分析需要對數(shù)據(jù)表現(xiàn)作出快速判斷,進(jìn)而指導(dǎo)運(yùn)營決策,并不像學(xué)術(shù)研究那樣嚴(yán)謹(jǐn),不需要在每次分析前都去驗(yàn)證樣本群體是否符合某種統(tǒng)計(jì)分布等,實(shí)際工作中,考驗(yàn)得更多的是對業(yè)務(wù)的理解的把握能力。

所以,在開展數(shù)據(jù)分析工作過程中,不能完全依賴過往的類似案例以及分析方法,而應(yīng)重視業(yè)務(wù)的理解。 因此,每一次分析,應(yīng)該結(jié)合業(yè)務(wù)場景中思考,更不能被各種套路方法論給束縛住,也不能簡單依賴過往的類似案例。

6

輕視業(yè)務(wù),與實(shí)際場景脫節(jié)

數(shù)據(jù)不等同與實(shí)際場景,實(shí)際場景往往比數(shù)據(jù)更加復(fù)雜,分析時(shí)需要了解具象化的場景,而不是抽象的數(shù)據(jù),數(shù)據(jù)分析初學(xué)者極易犯的錯(cuò)誤,只懂工具不懂業(yè)務(wù)不能真正理解業(yè)務(wù)需求。好的分析人員需要既懂工具又懂業(yè)務(wù),也要多去一線了解業(yè)務(wù)運(yùn)作,幫助解決業(yè)務(wù)運(yùn)營中遇到的各種問題。

比如,結(jié)構(gòu)化思維模型、KANO分析模型、RFM模型、四象限模型。。。。。。這些經(jīng)典且廣泛應(yīng)用的模型。來積累豐富的數(shù)據(jù)分析模型庫以應(yīng)對各種業(yè)務(wù)場景。 因此,數(shù)據(jù)分析人員結(jié)合實(shí)際業(yè)務(wù)場景,需要具體問題具體分析,服務(wù)于業(yè)務(wù)的應(yīng)用。及時(shí)與企業(yè)各部門溝通,共享數(shù)據(jù)分析的成果,這樣才能體現(xiàn)數(shù)據(jù)分析的真正價(jià)值。所以作為數(shù)據(jù)分析人員,要結(jié)合業(yè)務(wù)需求,保持獨(dú)立思考的心態(tài),大膽假設(shè),小心求證,警惕和避免走進(jìn)數(shù)據(jù)分析的陷阱。

總結(jié)

實(shí)際工作生活中,還有很多需要我們注意的關(guān)于數(shù)據(jù)分析的事項(xiàng),這里就不一一開展,本文只是從業(yè)務(wù)層面的視角梳理了關(guān)于數(shù)據(jù)分析各個(gè)環(huán)節(jié)中可能存在的引發(fā)誤導(dǎo)的一些陷阱。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • APP
    APP
    +關(guān)注

    關(guān)注

    33

    文章

    1586

    瀏覽量

    74187
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1472

    瀏覽量

    35012
  • Kano模型分析法
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    1417

原文標(biāo)題:警惕!數(shù)據(jù)分析的陷阱?

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    電商API常見錯(cuò)誤排查指南:避免集成陷阱

    ? 在電商平臺(tái)開發(fā),API集成是連接系統(tǒng)、實(shí)現(xiàn)數(shù)據(jù)交換的核心環(huán)節(jié)。然而,許多開發(fā)者在集成過程中常遇到錯(cuò)誤,導(dǎo)致項(xiàng)目延遲、數(shù)據(jù)丟失或用戶體驗(yàn)下降。本文將逐步介紹
    的頭像 發(fā)表于 07-11 14:21 ?96次閱讀
    電商API<b class='flag-5'>常見</b>錯(cuò)誤排查指南:避免集成<b class='flag-5'>陷阱</b>

    智能焊接數(shù)據(jù)分析設(shè)備提升工業(yè)效率與精度

    如何通過數(shù)據(jù)采集、分析與應(yīng)用,實(shí)現(xiàn)對焊接過程的精確控制,從而提升工業(yè)生產(chǎn)的整體水平。 首先,智能焊接數(shù)據(jù)分析設(shè)備的核心在于其強(qiáng)大的數(shù)據(jù)
    的頭像 發(fā)表于 01-15 14:11 ?432次閱讀

    智能焊接數(shù)據(jù)分析設(shè)備提升制造精度與效率

    隨著工業(yè)4.0的推進(jìn),智能制造成為制造業(yè)轉(zhuǎn)型升級的重要方向。在這一過程中,焊接技術(shù)作為機(jī)械制造的關(guān)鍵環(huán)節(jié),其精度和效率直接影響到產(chǎn)品的質(zhì)量與生產(chǎn)成本。傳統(tǒng)的焊接方式依賴于人工操作,存在焊接質(zhì)量
    的頭像 發(fā)表于 01-14 09:36 ?431次閱讀

    Mathematica 在數(shù)據(jù)分析的應(yīng)用

    數(shù)據(jù)分析是現(xiàn)代科學(xué)研究和商業(yè)決策不可或缺的一部分。隨著數(shù)據(jù)量的爆炸性增長,對數(shù)據(jù)分析工具的需求也在不斷增加。Mathematica,作為一種強(qiáng)大的計(jì)算軟件,以其獨(dú)特的符號(hào)計(jì)算能力和廣
    的頭像 發(fā)表于 12-26 15:41 ?691次閱讀

    數(shù)據(jù)可視化與數(shù)據(jù)分析的關(guān)系

    的含義。 數(shù)據(jù)分析的定義與作用 數(shù)據(jù)分析是一種使用統(tǒng)計(jì)和邏輯方法來分析數(shù)據(jù)集的過程,目的是發(fā)現(xiàn)模式、趨勢和關(guān)聯(lián)性。它包括
    的頭像 發(fā)表于 12-06 17:09 ?944次閱讀

    LLM在數(shù)據(jù)分析的作用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)分析已經(jīng)成為企業(yè)和組織決策的關(guān)鍵工具。數(shù)據(jù)科學(xué)家和分析師需要從海量數(shù)據(jù)中提取有價(jià)值的信息,以支持業(yè)務(wù)決策。在這個(gè)
    的頭像 發(fā)表于 11-19 15:35 ?1106次閱讀

    為什么選擇eda進(jìn)行數(shù)據(jù)分析

    數(shù)據(jù)科學(xué)領(lǐng)域,數(shù)據(jù)分析是一個(gè)復(fù)雜且多步驟的過程,它涉及到數(shù)據(jù)的收集、清洗、探索、建模和解釋。在這些步驟,探索性
    的頭像 發(fā)表于 11-13 10:41 ?744次閱讀

    raid 在大數(shù)據(jù)分析的應(yīng)用

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)在大數(shù)據(jù)分析的應(yīng)用主要體現(xiàn)在提高存儲(chǔ)系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析
    的頭像 發(fā)表于 11-12 09:44 ?720次閱讀

    SUMIF函數(shù)在數(shù)據(jù)分析的應(yīng)用

    在商業(yè)和科學(xué)研究,數(shù)據(jù)分析是一項(xiàng)基本且關(guān)鍵的技能。Excel作為最常用的數(shù)據(jù)分析工具之一,提供了多種函數(shù)來幫助用戶處理和分析數(shù)據(jù)。SUMI
    的頭像 發(fā)表于 11-11 09:14 ?867次閱讀

    智能制造數(shù)據(jù)分析應(yīng)用

    隨著工業(yè)4.0的推進(jìn),智能制造已經(jīng)成為制造業(yè)轉(zhuǎn)型升級的關(guān)鍵。數(shù)據(jù)分析作為智能制造的核心驅(qū)動(dòng)力,正逐步改變傳統(tǒng)的生產(chǎn)方式,為企業(yè)帶來更高的效率和更大的競爭力。 一、數(shù)據(jù)分析在智能制造的重要性 提高
    的頭像 發(fā)表于 11-07 09:56 ?873次閱讀

    emc技術(shù)在大數(shù)據(jù)分析的角色

    數(shù)據(jù)分析通常涉及來自多個(gè)來源和格式的數(shù)據(jù)。這些數(shù)據(jù)可能包括結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)
    的頭像 發(fā)表于 11-01 15:22 ?680次閱讀

    數(shù)據(jù)分析在數(shù)字化的作用

    與重要性 數(shù)據(jù)分析是指使用統(tǒng)計(jì)和邏輯方法對數(shù)據(jù)進(jìn)行處理和解釋的過程。它涉及到數(shù)據(jù)的收集、清洗、轉(zhuǎn)換、建模和解釋,目的是發(fā)現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 10-27 17:35 ?1135次閱讀

    云計(jì)算在大數(shù)據(jù)分析的應(yīng)用

    云計(jì)算在大數(shù)據(jù)分析的應(yīng)用廣泛且深入,它為用戶提供了存儲(chǔ)、計(jì)算、分析和預(yù)測的強(qiáng)大能力。以下是對云計(jì)算在大數(shù)據(jù)分析應(yīng)用的介紹: 一、存儲(chǔ)和處
    的頭像 發(fā)表于 10-24 09:18 ?1105次閱讀

    IP 地址大數(shù)據(jù)分析如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    一、大數(shù)據(jù)分析在網(wǎng)絡(luò)優(yōu)化的作用 1.流量分析數(shù)據(jù)分析可以對網(wǎng)絡(luò)的流量進(jìn)行實(shí)時(shí)監(jiān)測和分析,
    的頭像 發(fā)表于 10-09 15:32 ?566次閱讀
    IP 地址大<b class='flag-5'>數(shù)據(jù)分析</b>如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    數(shù)據(jù)分析在提高灌區(qū)管理水平的作用

    數(shù)據(jù)分析在提升灌區(qū)管理水平扮演著至關(guān)重要的角色,它通過深度挖掘海量信息,為灌溉系統(tǒng)的高效運(yùn)作、資源優(yōu)化配置及可持續(xù)發(fā)展提供了科學(xué)決策的基礎(chǔ)。這一過程不僅涉及數(shù)據(jù)的收集、整理與
    的頭像 發(fā)表于 08-28 17:23 ?525次閱讀
    <b class='flag-5'>數(shù)據(jù)分析</b>在提高灌區(qū)管理水平<b class='flag-5'>中</b>的作用