如今互聯(lián)網(wǎng)人對(duì)于數(shù)據(jù)的使用可畏常態(tài)化,雖然有的是日常工作,有的只是幾次需求,但無(wú)論對(duì)與數(shù)據(jù)有多少依賴(lài),在數(shù)據(jù)的使用或解讀上,以下情況大家應(yīng)該都會(huì)遇到一二。
1)團(tuán)隊(duì)來(lái)了一位新同學(xué),想分析某個(gè)功能的數(shù)據(jù)情況,但感覺(jué)無(wú)從下手。便問(wèn)老員工這個(gè)功能對(duì)應(yīng)的埋點(diǎn),那個(gè)頁(yè)面對(duì)應(yīng)的參數(shù),得到的不是口口相傳就是看著聊天記錄中的文檔地址,面對(duì)著黑壓壓一片的埋點(diǎn)信息,內(nèi)心估計(jì)已經(jīng)開(kāi)始神獸奔騰了;
2)新版本上線后進(jìn)行效果分析,發(fā)現(xiàn)埋點(diǎn)出現(xiàn)紕漏,此時(shí)若是重要數(shù)據(jù),需要緊急找人發(fā)版,時(shí)間緊張又擔(dān)驚受怕;若此時(shí)是一般數(shù)據(jù),開(kāi)發(fā)同學(xué)的回復(fù)大概率是:“和下個(gè)版一起迭代”,時(shí)隔半年一年再進(jìn)行分析,這段數(shù)據(jù)波動(dòng)的原因估計(jì)也沒(méi)人能說(shuō)清了;
3)測(cè)試同學(xué)拿著協(xié)作的埋點(diǎn)文檔,測(cè)試過(guò)程中發(fā)現(xiàn)不是字段對(duì)應(yīng)錯(cuò)誤就是信息維護(hù)不全,解讀起來(lái)麻煩不說(shuō),如果碰到大版本還需要進(jìn)行埋點(diǎn)回歸,不僅測(cè)試過(guò)程中工作量大,還有漏測(cè)的風(fēng)險(xiǎn)。
埋點(diǎn)數(shù)據(jù)作為日常數(shù)據(jù)最重要的三大來(lái)源之一(包括業(yè)務(wù)數(shù)據(jù)和對(duì)外合作數(shù)據(jù)),其重要性不言而喻。上能影響推薦、ab實(shí)驗(yàn)、數(shù)據(jù)分析的準(zhǔn)確;下能影響倉(cāng)庫(kù)的結(jié)構(gòu)設(shè)計(jì)和日常維護(hù)成本。當(dāng)前數(shù)據(jù)更是作為資產(chǎn)被各家公司所重視。想象一下到年終盤(pán)點(diǎn)時(shí),面對(duì)一團(tuán)“剪不斷,理還亂”的數(shù)據(jù),會(huì)是一種什么心情。
筆者通過(guò)對(duì)最近接手的埋點(diǎn)質(zhì)量項(xiàng)目的一些經(jīng)驗(yàn)總結(jié),希望通過(guò)這篇文章給大家分享一下心得體會(huì)。
01
埋點(diǎn)質(zhì)量問(wèn)題有哪些?
埋點(diǎn)過(guò)程整體鏈路環(huán)節(jié)較長(zhǎng),囊括的角色也相對(duì)較多。出了問(wèn)題排查難度大,周期長(zhǎng),而且涉及團(tuán)隊(duì)配合問(wèn)題也不好把控,下面我們來(lái)總結(jié)一下哪些環(huán)節(jié)容易出問(wèn)題導(dǎo)致埋點(diǎn)質(zhì)量問(wèn)題。
如果在數(shù)據(jù)產(chǎn)出階段不進(jìn)行把控,等到了應(yīng)用階段就會(huì)出現(xiàn):數(shù)據(jù)不完整、數(shù)據(jù)重復(fù)、數(shù)據(jù)不一致、數(shù)據(jù)不匹配等數(shù)據(jù)問(wèn)題,所以解決埋點(diǎn)質(zhì)量問(wèn)題要做到“預(yù)防為主、防治結(jié)合、綜合治理”的方針,下面我們來(lái)看下如何進(jìn)行埋點(diǎn)質(zhì)量管理。
02
如何進(jìn)行埋點(diǎn)質(zhì)量管理?
要開(kāi)展埋點(diǎn)質(zhì)量的管理,筆者認(rèn)為可以從以下三個(gè)角度開(kāi)始執(zhí)行:意識(shí)、制度&流程、工具。
01
意識(shí)
這里所謂的意識(shí)更多的是一種價(jià)值觀、信念或者說(shuō)是一種行為“動(dòng)機(jī)”。是每個(gè)同學(xué)做事對(duì)自我要求的一項(xiàng)軟性標(biāo)準(zhǔn),類(lèi)似于“道德”,可能讀到這大家覺(jué)得有些浮夸,怎么管理個(gè)埋點(diǎn)都上升到道德層面了。別著急,繼續(xù)往下看~
對(duì)于執(zhí)行層,無(wú)論是分析師或埋點(diǎn)產(chǎn)品必須要對(duì)出自自己手中的需求要負(fù)責(zé),時(shí)刻意識(shí)到,埋點(diǎn)需求是整條數(shù)據(jù)鏈路的源頭,并且用戶實(shí)時(shí)發(fā)生數(shù)據(jù)擁有著不可回溯性。如果要是從源頭開(kāi)始“錯(cuò)、缺、亂”,那后續(xù)的環(huán)節(jié)不僅增加了成本,同時(shí)這部分?jǐn)?shù)據(jù)也“白白流失”了。
而對(duì)于高層管理者在任職期間要適當(dāng)?shù)慕o予數(shù)據(jù)治理一些側(cè)重,無(wú)論是在人力上還是時(shí)間上。讓自己或自己的上級(jí)領(lǐng)導(dǎo)提升一些基礎(chǔ)建設(shè)的意識(shí),磨刀不一定會(huì)誤砍柴功。用產(chǎn)品進(jìn)行向上管理固然重要,畢竟是一個(gè)看的見(jiàn)、用得到并且能“體會(huì)”價(jià)值的載體。
如果只在乎表面光鮮,那背后的“千瘡百孔”要何時(shí)才能有機(jī)會(huì)修補(bǔ)。任何一個(gè)組織創(chuàng)建時(shí)都需要有一個(gè)文化或者信念,在做事的時(shí)候可以時(shí)刻提醒自己。所以在質(zhì)量管理的第一個(gè)重要角度是意識(shí)。
02
制度&流程
上面講述了意識(shí)層面上的統(tǒng)一,下面開(kāi)始說(shuō)的就是行為上的規(guī)范。所謂無(wú)規(guī)矩不成方圓,任何一件事有一個(gè)良好的規(guī)范去執(zhí)行,那出錯(cuò)的概率就會(huì)比每個(gè)人自由發(fā)揮低很多。這里所說(shuō)的制度包括兩個(gè)方面:角色流程和采集規(guī)范。
1) 角色流程埋點(diǎn)從需求產(chǎn)出開(kāi)始要經(jīng)歷:埋點(diǎn)開(kāi)發(fā)、數(shù)據(jù)上報(bào)、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)入庫(kù)最終到業(yè)務(wù)應(yīng)用,涉及的人員包括埋點(diǎn)產(chǎn)品&分析師、開(kāi)發(fā)、測(cè)試、采集工程師、倉(cāng)庫(kù)工程師等。
各個(gè)環(huán)節(jié)能有機(jī)組合就需要一個(gè)良好的配合制度,既能保證工作有條不紊,同時(shí)又避免了權(quán)責(zé)混亂導(dǎo)致的問(wèn)題無(wú)法及時(shí)響應(yīng)。以下有個(gè)簡(jiǎn)短的配合流程可以簡(jiǎn)單作為參考:
2) 采集規(guī)范a) 文檔規(guī)范文檔規(guī)范要求負(fù)責(zé)埋點(diǎn)的同學(xué)列清相關(guān)需求點(diǎn),包括:所需要的事件信息、統(tǒng)計(jì)位置、打點(diǎn)邏輯、上報(bào)時(shí)機(jī)。甚至還可能有失敗后如何處理、失敗原因、變更歷史等相關(guān)內(nèi)容,細(xì)化的需求文檔有利于降低其他環(huán)節(jié)同學(xué)的理解偏差,也便于埋點(diǎn)使用時(shí)了解前因后果及錯(cuò)誤信息。
b) 接入規(guī)范
是指業(yè)務(wù)開(kāi)發(fā)同學(xué)在使用埋點(diǎn)組件時(shí)要嚴(yán)格遵守組件方提供sdk的使用規(guī)則,例如通用事件內(nèi)擴(kuò)展字段的埋點(diǎn)位置、上報(bào)時(shí)機(jī)等。切不可根據(jù)“自我經(jīng)驗(yàn)”進(jìn)行更改優(yōu)化。
c) 命名規(guī)范
命名規(guī)范適用于埋點(diǎn)信息的命名,包括事件id、事件參數(shù)以及實(shí)際的參數(shù)值,做到以下原則:
方便解讀
不要有特殊字符,不要采用系統(tǒng)關(guān)鍵字或預(yù)置關(guān)鍵字進(jìn)行命名
字段不易過(guò)長(zhǎng)
版本前后字段映射統(tǒng)一等
無(wú)法挨個(gè)維護(hù)的的參數(shù)值可以采用spm或scm模型來(lái)制定采集規(guī)范。
spm叫超級(jí)位置模型,最早是受到土地戶籍制度啟發(fā)而設(shè)計(jì)的位置系統(tǒng),目的應(yīng)用于頁(yè)面的統(tǒng)計(jì)、追蹤頁(yè)面的來(lái)源等場(chǎng)景,通常在埋點(diǎn)時(shí)作為埋點(diǎn)參數(shù)上報(bào)到數(shù)據(jù)后臺(tái)。其編碼形式采用A.B.C.D四層級(jí)進(jìn)行組合,分別代表了業(yè)務(wù)、頁(yè)面、頁(yè)面區(qū)塊、區(qū)塊內(nèi)的點(diǎn)位,
我們以小紅書(shū)的商城首頁(yè)舉例:
業(yè)務(wù):商城(shop_center)
頁(yè)面:首頁(yè)(home_page)
頁(yè)面區(qū)塊:變美季(beauty)
區(qū)塊內(nèi)點(diǎn)位:3
spm模型命名澳大利亞·秋冬必備神級(jí)修復(fù)的位置內(nèi)容就可以寫(xiě)成:shop_center.home_page.beauty.3
在統(tǒng)計(jì)數(shù)據(jù)時(shí)可以通過(guò)該參數(shù)知道這個(gè)模塊的位置的流量大小情況。
scm叫超級(jí)內(nèi)容模型,用來(lái)標(biāo)識(shí)唯一一塊內(nèi)容的模型,在埋點(diǎn)時(shí)scm模型的數(shù)據(jù)作為埋點(diǎn)參數(shù)上報(bào)到數(shù)據(jù)后臺(tái),其編碼形式和spm一樣也是通過(guò)A.B.C.D四個(gè)層級(jí)進(jìn)行編碼,只不過(guò)四個(gè)層級(jí)記錄的信息與spm有所差別,分別是:內(nèi)容來(lái)源、投放算法、算法版本以及對(duì)應(yīng)的人群,還以上面的內(nèi)容為例:
內(nèi)容來(lái)源(content_source):shop
投放算法(algorithm):cf
算法版本(version):3.3
對(duì)應(yīng)人群(crowd):woman
該條內(nèi)容:澳大利亞·秋冬必備神級(jí)修復(fù)的內(nèi)容情況如下:shop.cf.3.3.woman, 可以統(tǒng)計(jì)不同位置下該條內(nèi)容所展示的信息和流量情況
spm和scm作為兩種不同的編碼規(guī)范,我覺(jué)得可以根據(jù)自己的需要進(jìn)行相關(guān)的改良,比如更改層級(jí)或更改定義等。
03
工具
1) 埋點(diǎn)模型
埋點(diǎn)模型采用的是事件模型,事件模型描述了一個(gè)人做某件事情所需要的幾個(gè)重點(diǎn)要素:時(shí)間(when)、地點(diǎn)(where)、人物(who)、途徑(how)、結(jié)果(what)
例如:
小明4月3號(hào)早上9點(diǎn)用小米手機(jī)在京東買(mǎi)了一個(gè)iphone12,轉(zhuǎn)譯到埋點(diǎn)語(yǔ)言就是:
以上設(shè)備信息均為虛擬信息,僅作參考
實(shí)現(xiàn)以上信息采集的埋點(diǎn)方式當(dāng)前行業(yè)內(nèi)有:代碼埋點(diǎn)、無(wú)埋點(diǎn)。
代碼埋點(diǎn):代碼埋點(diǎn)是根據(jù)具體埋點(diǎn)需求進(jìn)行數(shù)據(jù)采集的方式,這也是用戶行為數(shù)據(jù)最早的采集方式,代碼埋點(diǎn)可支持客戶端埋點(diǎn)和服務(wù)端埋點(diǎn)??蛻舳寺顸c(diǎn)主要采集用戶行為,服務(wù)端埋點(diǎn)更多采集的是業(yè)務(wù)數(shù)據(jù)。
優(yōu)點(diǎn):
埋點(diǎn)可以做到按需采集、減少無(wú)效的信息上報(bào);
事件觸發(fā)方式可以自定義,降低端上的資源消耗
缺點(diǎn):
新增埋點(diǎn)周期較長(zhǎng),需要跟隨版本迭代
管理成本較高,造成系統(tǒng)代碼“冗余”
采集數(shù)據(jù)有“缺失”,只能獲取到上線之后的數(shù)據(jù)
無(wú)埋點(diǎn):無(wú)埋點(diǎn)是識(shí)別端上各區(qū)塊元素,對(duì)其進(jìn)行全面的采集
優(yōu)點(diǎn):
新版本上線也可看到歷史數(shù)據(jù)
前端埋點(diǎn)成本低,管理成本低
埋點(diǎn)范圍覆蓋相對(duì)較廣
缺點(diǎn):
數(shù)據(jù)冗余過(guò)剩
對(duì)應(yīng)用開(kāi)發(fā)的元素命名和開(kāi)發(fā)規(guī)范要求嚴(yán)格
不能進(jìn)行自定義數(shù)據(jù)的采集
服務(wù)端壓力較大
為了埋點(diǎn)數(shù)據(jù)全&準(zhǔn)的兩個(gè)準(zhǔn)則,一般可以采取兩種方式組合的方式,重點(diǎn)業(yè)務(wù)、非重點(diǎn)頁(yè)面采用代碼埋點(diǎn),重點(diǎn)頁(yè)面非重點(diǎn)業(yè)務(wù)采用無(wú)埋點(diǎn),合理分配兩種埋點(diǎn)策略做到不丟不漏在合理的維護(hù)成本范圍內(nèi),盡可能多而全的采集。
2)埋點(diǎn)平臺(tái)
雖然有了意識(shí)上的“統(tǒng)一“、制度上的規(guī)范,但我相信依舊有一些團(tuán)隊(duì)在沿用公用文檔維護(hù)埋點(diǎn)信息,文檔化維護(hù)方式在信息量小的時(shí)候問(wèn)題還不凸顯,但當(dāng)面對(duì)成百上千的埋點(diǎn)就會(huì)出現(xiàn):埋點(diǎn)信息維護(hù)不全查找困難、測(cè)試同學(xué)面對(duì)“海量”的上報(bào)數(shù)據(jù)頭暈眼花極容易漏測(cè)、實(shí)際上報(bào)與需求不符無(wú)法及時(shí)發(fā)現(xiàn)等。
所以埋點(diǎn)質(zhì)量的最后一個(gè)環(huán)節(jié)就需要通過(guò)平臺(tái)化來(lái)進(jìn)行輔助管理,主要管理的方向有以下幾個(gè)方向:
元數(shù)據(jù)管理完善、可溯源,提升查詢(xún)效率
自動(dòng)化測(cè)試+人工校驗(yàn)、降低漏測(cè)風(fēng)險(xiǎn)
質(zhì)量監(jiān)控,提升對(duì)錯(cuò)誤埋點(diǎn)的發(fā)現(xiàn)效率
引入埋點(diǎn)流程、輔助進(jìn)行“團(tuán)隊(duì)管理”
a) 元數(shù)據(jù)的完善
元數(shù)據(jù)管理主要包含以下內(nèi)容:事件基礎(chǔ)信息、業(yè)務(wù)組織架構(gòu)、當(dāng)前開(kāi)發(fā)狀態(tài)、操作日志及變動(dòng)日志
事件基礎(chǔ)信息:事件id&名稱(chēng)、參數(shù)id&名稱(chēng)、參數(shù)值id&名稱(chēng),統(tǒng)計(jì)口徑、上報(bào)時(shí)機(jī)、版本、需求地址等。
業(yè)務(wù)組織架構(gòu):事件歸屬的頁(yè)面、功能層級(jí)結(jié)構(gòu)等信息
當(dāng)前開(kāi)發(fā)狀態(tài):該事件所處的流轉(zhuǎn)狀態(tài),包括:需求中、需求完成、開(kāi)發(fā)中、開(kāi)發(fā)完成、測(cè)試中、測(cè)試上線、灰度、正式上線
操作日志及變動(dòng)日志:記錄系統(tǒng)上所有人員對(duì)于元數(shù)據(jù)的操作日志以及該事件歷史版本變動(dòng)日志等
有了完備的元數(shù)據(jù)信息,還需要提供完善的篩選和查找機(jī)制,讓埋點(diǎn)使用人員可以方便管理和查詢(xún);同時(shí)平臺(tái)可以根據(jù)埋點(diǎn)組件規(guī)范和埋點(diǎn)信息自動(dòng)生成一段代碼給到業(yè)務(wù)開(kāi)發(fā)同學(xué),即降低了代碼埋點(diǎn)的開(kāi)發(fā)成本,也降低了出錯(cuò)的概率。
b) 自動(dòng)化測(cè)試
對(duì)于測(cè)試而言,有了完善元數(shù)據(jù)后埋點(diǎn)平臺(tái)可以提供:
1.自動(dòng)化的測(cè)試功能
可以根據(jù)實(shí)際上報(bào)的數(shù)據(jù)明細(xì)自動(dòng)比對(duì)元數(shù)據(jù)模塊下維護(hù)的信息內(nèi)容,在每次測(cè)試任務(wù)中都會(huì)自動(dòng)提醒哪些事件不符合規(guī)范,極大的提高了測(cè)試效率,加上后期的人工校驗(yàn),也會(huì)降低漏測(cè)的概率。
2.規(guī)范的數(shù)據(jù)展示方式以及詳細(xì)的信息記錄
傳統(tǒng)的測(cè)試方式一邊需要對(duì)著文檔、一邊需要看著一條巨長(zhǎng)的上報(bào)數(shù)據(jù)來(lái)找到需要比對(duì)的信息來(lái)確認(rèn)埋點(diǎn)是否準(zhǔn)確。平臺(tái)完全可以結(jié)構(gòu)化上報(bào)數(shù)據(jù),隱藏?zé)o關(guān)維度信息,并根據(jù)上報(bào)內(nèi)容關(guān)鍵字(事件或參數(shù)信息)自動(dòng)去元數(shù)據(jù)內(nèi)進(jìn)行數(shù)據(jù)查詢(xún),埋點(diǎn)同學(xué)每次測(cè)試任務(wù)只需要了解版本需求范圍即可。
c) 質(zhì)量監(jiān)控
即使測(cè)試通過(guò)了,埋點(diǎn)數(shù)據(jù)就一定讓人放心了么,肯定不是的,上線后面對(duì)大樣本使用,用戶app什么樣的機(jī)型都有,甚至?xí)淮鄹囊恍┬畔?。為了能讓最終上報(bào)的數(shù)據(jù)減少錯(cuò)誤,埋點(diǎn)平臺(tái)可以提供質(zhì)量管理模塊,具體監(jiān)控策略可以根據(jù)數(shù)據(jù)質(zhì)量評(píng)估標(biāo)準(zhǔn)通用的5項(xiàng)準(zhǔn)則:完整性、及時(shí)性、唯一性、穩(wěn)定性、準(zhǔn)確性進(jìn)行設(shè)定。
d) 引入埋點(diǎn)流程輔助管理
整個(gè)埋點(diǎn)平臺(tái)使用流程可以根據(jù)上面2.制度&流程的角色流程進(jìn)行劃分和管理,上線前每個(gè)環(huán)節(jié)由相關(guān)負(fù)責(zé)人員進(jìn)行確認(rèn),多層確認(rèn)機(jī)制可以保證埋點(diǎn)信息的完善和準(zhǔn)確,也為后續(xù)管理上帶來(lái)了極大的便利性。
埋點(diǎn)平臺(tái)功能框架參考如下:
03
寫(xiě)在最后
數(shù)據(jù)質(zhì)量問(wèn)題在業(yè)務(wù)發(fā)展到一定階段都會(huì)遇到,就像升職以后需要管理團(tuán)隊(duì)一樣,不同級(jí)別面臨的問(wèn)題不一樣,所需要采用的手段也不一樣。希望本篇文章可以讓那些即將面臨這個(gè)問(wèn)題或已經(jīng)身在其中的小伙伴能有一部分可借鑒的地方,因篇幅問(wèn)題涉及sdk、埋點(diǎn)設(shè)計(jì)以及平臺(tái)搭建的部分都沒(méi)法詳細(xì)展開(kāi)描述,如果對(duì)此感興趣或有疑問(wèn)的同學(xué)歡迎一起交流。
編輯:jq
-
采集數(shù)據(jù)
+關(guān)注
關(guān)注
0文章
28瀏覽量
13503 -
代碼
+關(guān)注
關(guān)注
30文章
4899瀏覽量
70639
原文標(biāo)題:淺談埋點(diǎn)質(zhì)量管理
文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
為什么90%的工廠質(zhì)量問(wèn)題頻發(fā)?MES質(zhì)量管理這樣做

QMS質(zhì)量管理物聯(lián)網(wǎng)系統(tǒng)解決方案
電能質(zhì)量管理系統(tǒng)的應(yīng)用
智能水穩(wěn)拌合站監(jiān)測(cè)質(zhì)量管理系統(tǒng)顯著改善水穩(wěn)拌合站質(zhì)量管理水平


企業(yè)為什么需要實(shí)施QMS質(zhì)量管理系統(tǒng)?# QMS# 質(zhì)量管理系統(tǒng)# 生產(chǎn)質(zhì)量# 質(zhì)量追溯
國(guó)星半導(dǎo)體IATF 16949質(zhì)量管理體系認(rèn)證項(xiàng)目啟動(dòng)
晶科能源低碳質(zhì)量管理模式入選國(guó)家典型案例
億緯鋰能通過(guò)醫(yī)療器械質(zhì)量管理體系認(rèn)證
在自動(dòng)化智能化的工廠如何有效的進(jìn)行質(zhì)量管理?

智能攤鋪壓實(shí)監(jiān)測(cè)質(zhì)量管理系統(tǒng)是路面施工中必不可少質(zhì)量管理技術(shù)

飛凌嵌入式榮獲ISO13485醫(yī)療器械質(zhì)量管理體系認(rèn)證

實(shí)力見(jiàn)證!星坤控股旗下東莞星坤ISO9001質(zhì)量管理體系復(fù)審成功!
供應(yīng)商質(zhì)量管理4大核心、5大方法、10大步驟(附詳解PPT)
本源量子獲得質(zhì)量管理體系認(rèn)證證書(shū)

MES里面有質(zhì)量模塊,為什么還要實(shí)施質(zhì)量管理軟件QMS

評(píng)論