一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一名數(shù)據(jù)分析工程師的實(shí)習(xí)經(jīng)歷

工程師人生 ? 來(lái)源:工程師吳畏 ? 2019-07-10 17:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從進(jìn)入大學(xué),我就常在思考,未來(lái)要做什么,自己的興趣是什么。我的大學(xué)階段,在保證本專業(yè)的成績(jī)優(yōu)秀的情況下,我盡一切努力探索更多未知的領(lǐng)域。參加過(guò)全國(guó)物流設(shè)計(jì)大賽,電子商務(wù)大賽,機(jī)械設(shè)計(jì)大賽,創(chuàng)新創(chuàng)業(yè)大賽,全國(guó)大學(xué)生數(shù)學(xué)建模大賽,還參與各種社團(tuán),學(xué)生活動(dòng),只是為了找尋真正喜歡的方向。后面,我發(fā)現(xiàn)能從心底里感興趣,真正喜歡的就是參與數(shù)學(xué)建模的整個(gè)過(guò)程,這也在最后奠定了以后的方向。

保研后,在完成學(xué)校所有的論文要求和實(shí)驗(yàn)室項(xiàng)目的同時(shí),我開(kāi)啟了數(shù)據(jù)分析的實(shí)習(xí)道路,現(xiàn)在已經(jīng)在互聯(lián)網(wǎng)實(shí)習(xí)快一年了,記錄一下所有的成長(zhǎng)歷程吧!

首先是面試,有兩輪的面試,因?yàn)槭羌夹g(shù)崗,第一個(gè)面試官問(wèn)了兩個(gè)算法題和一個(gè)數(shù)學(xué)題,第二個(gè)面試官問(wèn)了一個(gè)用sql處理數(shù)據(jù)的問(wèn)題和兩個(gè)數(shù)學(xué)題,而第二個(gè)面試官就是我們數(shù)據(jù)組的老大。

開(kāi)始的一周,需要搭建跳板機(jī),vpn和git的環(huán)境,接著就開(kāi)始工作了。

我們組的工作內(nèi)容:

我們組的工作是分析公司各業(yè)務(wù)的log日志,包括服務(wù)器和客戶端,還有每個(gè)業(yè)務(wù)服務(wù)的數(shù)據(jù)庫(kù)中的數(shù)據(jù)。最后搭建數(shù)據(jù)倉(cāng)庫(kù),完成一整套數(shù)據(jù)收集,處理,分析到展示的過(guò)程,其中還涉及監(jiān)控和報(bào)警,有離線數(shù)據(jù)還有實(shí)時(shí)數(shù)據(jù)的分析。我們提供一個(gè)數(shù)據(jù)報(bào)表展示平臺(tái),每一個(gè)報(bào)表由運(yùn)維,產(chǎn)品,運(yùn)營(yíng),服務(wù)器開(kāi)發(fā)等同事提出數(shù)據(jù)需求,最后由我們完成,同時(shí),我們還會(huì)處理各種臨時(shí)需求,數(shù)據(jù)分析等工作,并提供一個(gè)方便大家查詢數(shù)據(jù)的sql查詢接口

技術(shù)流:

首先,各業(yè)務(wù)的產(chǎn)品經(jīng)理想要分析某個(gè)點(diǎn)擊行為或者功能,需要和對(duì)應(yīng)的開(kāi)發(fā),和我們組協(xié)商打點(diǎn)的數(shù)據(jù)格式,參數(shù),對(duì)應(yīng)的服務(wù)器名,日志路徑,或者jdbc,庫(kù)名與表名,對(duì)應(yīng)的字段名稱,具體業(yè)務(wù)邏輯和含義。業(yè)務(wù)產(chǎn)品需要給我們提出數(shù)據(jù)分析需求,不同的維度的篩選,統(tǒng)計(jì)指標(biāo)的定義。接著需要大數(shù)據(jù)工程師,如果是離線數(shù)據(jù),需要用sqoop將數(shù)據(jù)導(dǎo)入hdfs上,存入規(guī)定地標(biāo)準(zhǔn)路徑和文件中,建立partition以天為分區(qū)。然后數(shù)據(jù)分析工程師需要搭建整個(gè)數(shù)據(jù)倉(cāng)庫(kù),公司的數(shù)據(jù)倉(cāng)庫(kù)是用php搭建的框架,對(duì)應(yīng)格式基本一致的數(shù)據(jù)源,用hive建表,可以對(duì)應(yīng)csv,用jave寫(xiě)serde進(jìn)行解析等方式處理,如果是非格式化且記錄之間的格式變動(dòng)較大,需要用pig處理,pig中調(diào)用python,處理后再用hive建表,也有需要用r進(jìn)行處理的數(shù)據(jù),最后數(shù)據(jù)經(jīng)過(guò)ods,dw層以hive表記錄,到最后dm層時(shí)實(shí)現(xiàn)產(chǎn)品最后的統(tǒng)計(jì)分析需求,dm以mysql表記錄,數(shù)據(jù)倉(cāng)庫(kù)的建立需要伴隨著業(yè)務(wù)不斷修改邏輯,最后展示到web中,web中還需要進(jìn)行一些簡(jiǎn)單的sql進(jìn)行展示,用js插件可以調(diào)用不用的數(shù)據(jù)展示形式。實(shí)時(shí)數(shù)據(jù)是用kafak進(jìn)行收集,然后實(shí)時(shí)查詢,離線數(shù)據(jù)是晚上12:00開(kāi)始跑job,其中包括任務(wù)調(diào)度,依賴等的設(shè)置。如果有以月跑的數(shù)據(jù),還crontab進(jìn)行調(diào)度,有些數(shù)據(jù)還需要外部信息,比如ip地址的對(duì)應(yīng),手機(jī)型號(hào)等,要寫(xiě)對(duì)應(yīng)爬蟲(chóng)收集相關(guān)數(shù)據(jù)。公司有三個(gè)業(yè)務(wù),業(yè)務(wù)的數(shù)據(jù)還會(huì)內(nèi)嵌,交叉統(tǒng)計(jì),有時(shí)候某一個(gè)業(yè)務(wù)邏輯修改會(huì)影響很多數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,因此數(shù)據(jù)分析工作是一個(gè)復(fù)雜的系統(tǒng)工程。

作為一個(gè)數(shù)據(jù)分析工程師,我的工作主要是分析離線數(shù)據(jù),在產(chǎn)品提出需求后,分析要統(tǒng)計(jì)的邏輯,提出倒數(shù)需求log或mysql,建立數(shù)據(jù)倉(cāng)庫(kù)hive,pig,python,php,從ods層到dm層寫(xiě)出數(shù)據(jù)統(tǒng)計(jì)的邏輯,最后把數(shù)據(jù)放如mysql,最后配置web頁(yè)面,有時(shí)候會(huì)寫(xiě)簡(jiǎn)單的爬蟲(chóng),跑臨時(shí)數(shù)據(jù),會(huì)用shell寫(xiě)個(gè)簡(jiǎn)單的腳本,用crontab進(jìn)行調(diào)度等。倉(cāng)庫(kù)的代碼用git管理。

結(jié)語(yǔ):

喜歡我們組的氛圍,大家都熱愛(ài)各種創(chuàng)新的技術(shù)和分析方法,熱愛(ài)分享。很感激老大帶領(lǐng)我進(jìn)入了公司,進(jìn)入了我們組,感謝大家對(duì)我的幫助,開(kāi)啟了我數(shù)據(jù)分析的道路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 工程師
    +關(guān)注

    關(guān)注

    59

    文章

    1590

    瀏覽量

    69500
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1473

    瀏覽量

    35044
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工程師的“新神器”:用CCLinkie轉(zhuǎn)Devicenet連接水質(zhì)分析儀,輕松搞定數(shù)據(jù)難題

    在化工行業(yè)摸爬滾打的工程師們,是不是經(jīng)常為水質(zhì)監(jiān)測(cè)數(shù)據(jù)的獲取和整合頭疼?邊是復(fù)雜的化工生產(chǎn)流程,邊是水質(zhì)分析儀的
    發(fā)表于 06-09 15:36

    問(wèn),成為硬件工程師需要幾只手?#硬件工程師 #YXC晶振 #揚(yáng)興科技 #搞笑

    硬件工程師
    揚(yáng)興科技
    發(fā)布于 :2025年04月25日 17:15:37

    如何成為一名合格的KaihongOS南向驅(qū)動(dòng)開(kāi)發(fā)工程師

    如何成為一名合格的南向驅(qū)動(dòng)開(kāi)發(fā)工程師 1. 我需要具備哪些方面的知識(shí)? KaihongOS南向適配的方向分為:驅(qū)動(dòng)開(kāi)發(fā)、內(nèi)核開(kāi)發(fā)。根據(jù)適配方向劃分,需要掌握的知識(shí)技能分別為: 驅(qū)動(dòng)開(kāi)發(fā)
    發(fā)表于 04-23 08:02

    如何成為一名合格的KaihongOS北向應(yīng)用開(kāi)發(fā)工程師

    如何成為一名合格的北向應(yīng)用開(kāi)發(fā)工程師 在快速發(fā)展的軟件開(kāi)發(fā)領(lǐng)域,北向應(yīng)用開(kāi)發(fā)工程師個(gè)專注于系統(tǒng)級(jí)應(yīng)用開(kāi)發(fā)的高需求職位。 以下是成為一名
    發(fā)表于 04-23 06:46

    如何成為一名嵌入式軟件工程師?

    如何成為一名嵌入式軟件工程師? 01明確崗位的角色與定位 嵌入式軟件工程師主要負(fù)責(zé)開(kāi)發(fā)運(yùn)行在特定硬件平臺(tái)上的軟件,這些軟件通常與硬件緊密集成,以實(shí)現(xiàn)特定的功能。 不僅需要精通編程語(yǔ)言(如C/C++
    發(fā)表于 04-15 14:37

    招拿捏電子工程師#被AI拿捏了 #電子工程師 #電子電工

    電子工程師
    安泰小課堂
    發(fā)布于 :2025年03月25日 17:30:51

    如何成為嵌入式開(kāi)發(fā)工程師?

    ,參加相關(guān)的研討會(huì)和培訓(xùn)課程,閱讀專業(yè)書(shū)籍和論文。 9. 認(rèn)證和網(wǎng)絡(luò):- 考慮獲取相關(guān)認(rèn)證,這可以增加你的市場(chǎng)競(jìng)爭(zhēng)力。- 加入專業(yè)組織和在線社區(qū),擴(kuò)展你的人際網(wǎng)絡(luò)。 通過(guò)上述步驟的學(xué)習(xí)和實(shí)踐,你可以逐步成長(zhǎng)為一名合格的嵌入式開(kāi)發(fā)工程師。記住,實(shí)際動(dòng)手做項(xiàng)目和解決實(shí)際問(wèn)題是
    發(fā)表于 02-19 10:39

    月薪 3 萬(wàn)的嵌入式工程師都在用,串口屏到底神在哪?

    作為一名資深的嵌入式工程師,我深知在選擇硬件組件時(shí),性能、可靠性、易用性和成本效益都是至關(guān)重要的考量因素。月薪3萬(wàn)的嵌入式工程師們之所以傾向于使用串口屏,主要是基于以下幾個(gè)方面的考量
    的頭像 發(fā)表于 02-12 10:33 ?666次閱讀
    月薪 3 萬(wàn)的嵌入式<b class='flag-5'>工程師</b>都在用,串口屏到底神在哪?

    如何成為一名合格的南向驅(qū)動(dòng)開(kāi)發(fā)工程師

    內(nèi)核開(kāi)發(fā) - c,cmake,dts, linux常用命令 以上,如能對(duì)某模塊的南向適配研究透徹,自行調(diào)通,積極解決問(wèn)題。那么對(duì)一名kaihongOS的南向驅(qū)動(dòng)開(kāi)發(fā)工程師而言,他便是合格的,若
    發(fā)表于 01-10 10:06

    如何成為一名合格的北向應(yīng)用開(kāi)發(fā)工程師

    在快速發(fā)展的軟件開(kāi)發(fā)領(lǐng)域,北向應(yīng)用開(kāi)發(fā)工程師個(gè)專注于系統(tǒng)級(jí)應(yīng)用開(kāi)發(fā)的高需求職位。 以下是成為一名合格的KaihongOS北向應(yīng)用開(kāi)發(fā)工程師的建議。 1. 基礎(chǔ)知識(shí) 編程語(yǔ)言 :學(xué)習(xí)
    發(fā)表于 01-10 10:00

    NVIDIA助力百度提升數(shù)據(jù)分析效能

    在現(xiàn)代商業(yè)環(huán)境中,數(shù)據(jù)分析已然成為企業(yè)獲取成功的關(guān)鍵所在。長(zhǎng)期以來(lái),百度廣告數(shù)據(jù)團(tuán)隊(duì)始終面臨著極為復(fù)雜的數(shù)據(jù)分析挑戰(zhàn),其需要為逾千用戶提供在線廣告業(yè)務(wù)
    的頭像 發(fā)表于 11-20 10:06 ?715次閱讀