Q1:計算機專業(yè)本科生,非ACMER。算法達到什么程度才算是合格,有什么量化手段嗎?
Answer:傳統(tǒng)算法和數(shù)據(jù)結(jié)構(gòu)功底扎實。比如LintCode上的題目簡單和中等難度毫無壓力做出,Hard難度在給了一定時間和一定提示時可以獨立完成。
微積分,統(tǒng)計學(xué),離散數(shù)學(xué)
Q2:成為數(shù)據(jù)挖掘工程師有必要要搞編程競賽嗎?現(xiàn)在大二,之前沒有接觸過競賽
Answer:數(shù)據(jù)挖掘的話是Kaggle,KDD的競賽
Q3:數(shù)據(jù)挖掘一定要學(xué)spark嗎
Answer:Python是剛需,Spark可以到用的時候再學(xué)
Q4:怎么練習(xí)普通算法呢,看算導(dǎo)刷oj嗎?
Answer:分為兩步:第一步是模塊化訓(xùn)練,比如專門做圖論和動態(tài)規(guī)劃的題。第二步是在LintCode上隨便選擇一個題,不看標簽,獨立做出。
Q5:有一定高等數(shù)學(xué)基礎(chǔ)和機器學(xué)習(xí)算法概念的小白,如何進行實戰(zhàn)訓(xùn)練。
Answer:分為兩步:第一階段是參加Kaggle,KDD競賽。第二階段是學(xué)習(xí)爬蟲,自己爬取電商,微博等數(shù)據(jù),做訓(xùn)練
Q6:作為一個數(shù)據(jù)挖掘工程師,還有沒有必要深入研究傳統(tǒng)的算法,還是重點關(guān)注機器學(xué)習(xí)等統(tǒng)計的算法?
Answer:重點關(guān)注機器學(xué)習(xí)等統(tǒng)計的算法,這兩種有很大的不同
Q7:請問算法工程師和數(shù)據(jù)挖掘 data scientist 等崗位在技能要求和工作內(nèi)容方面有什么區(qū)別嗎?
Answer:中小廠不區(qū)分。大廠可能會區(qū)分。算法工程師更底層一些,關(guān)注算法模型的開發(fā)和調(diào)優(yōu),數(shù)據(jù)挖掘更側(cè)重模型的建模和使用,應(yīng)用和業(yè)務(wù)方面。
Q8:傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和算法是否對于機器學(xué)習(xí)是有必要的?如果有,主要體現(xiàn)在什么地方?
Answer:首先傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和算法可以鍛煉計算機思維,其實具體的數(shù)據(jù)結(jié)構(gòu)和算法還是會用到的,比如搜索query時詞之間關(guān)系,可以用字符串的距離,動態(tài)規(guī)劃,字典樹等
技術(shù)問題
Q1: 假設(shè)數(shù)據(jù)集有商店id這個屬性,取值上千個,把它做OHE后去學(xué)習(xí),雖然結(jié)果提升了,但維度增加了很多。但不做OHE,用分類樹去學(xué)習(xí),結(jié)果并不好,可以有什么方法緩解數(shù)據(jù)集的擴大與最后結(jié)果的技巧嗎
Answer:這是特征工程中非常典型的問題,OHE后有可能會過擬合, 商店間有相似性,量化后對商店進行聚類,再用這些類去做分類的訓(xùn)練
-
算法工程師
+關(guān)注
關(guān)注
2文章
31瀏覽量
6246
發(fā)布評論請先 登錄


硬件工程師看了只會找個角落默默哭泣#硬件工程師 #MDD #MDD辰達半導(dǎo)體 #產(chǎn)品經(jīng)理 #軟件工程師


如何成為一名合格的KaihongOS北向應(yīng)用開發(fā)工程師



硬件工程師的終極幻想:焊板子焊上人生巔峰!#半導(dǎo)體器件 #硬件工程師 #MDD辰達半導(dǎo)體
如何成為一名合格的北向應(yīng)用開發(fā)工程師

不同時期的硬件工程師,最怕發(fā)生的事 #電子工程師 #硬件工程師 #內(nèi)容過于真實 #YXC晶振 #揚興科技
圖像算法工程師的利器——SpeedDP深度學(xué)習(xí)算法開發(fā)平臺



FPGA算法工程師、邏輯工程師、原型驗證工程師有什么區(qū)別?

評論