一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么說(shuō)數(shù)學(xué)知識(shí)是數(shù)據(jù)科學(xué)家的先決條件?

DPVg_AI_era ? 來(lái)源:lq ? 2019-01-29 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI機(jī)器學(xué)習(xí)的火熱讓數(shù)據(jù)科學(xué)家成為近幾年熱門職業(yè)之一。但對(duì)于試圖從事這一職業(yè)的新人來(lái)說(shuō),數(shù)學(xué)可能最大的攔路虎之一。不過(guò)本文作者認(rèn)為,當(dāng)數(shù)據(jù)科學(xué)家并不一定需要堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ),并給出了9類無(wú)需數(shù)學(xué)基礎(chǔ)的數(shù)據(jù)科學(xué)任務(wù)。

在當(dāng)今世界上,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)已成為最令人向往的職業(yè)方向之一,從大學(xué)生到職業(yè)生涯中期的專業(yè)人士,很多人都希望進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域。但是,在追求數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)領(lǐng)域時(shí)想到的第一個(gè)先決條件是,要具備深入研究復(fù)雜數(shù)學(xué)問(wèn)題的能力,才能走進(jìn)數(shù)據(jù)科學(xué)的大門。

但是那些數(shù)學(xué)基礎(chǔ)薄弱,不具備扎實(shí)數(shù)學(xué)背景的人怎么辦?他們就沒(méi)有希望進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域了嗎?

當(dāng)然不是。本文將提供踏入數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)世界之前,是否強(qiáng)制要求數(shù)學(xué)背景知識(shí)的真實(shí)情況。

為什么說(shuō)數(shù)學(xué)知識(shí)是數(shù)據(jù)科學(xué)家的先決條件?

與大學(xué)其他專業(yè)相比,數(shù)據(jù)科學(xué)更多地是關(guān)于如何快速準(zhǔn)確地學(xué)習(xí)。通過(guò)嚴(yán)格的數(shù)學(xué)運(yùn)算,快速準(zhǔn)確地掌握技術(shù),并且通常可以比大多數(shù)人更容易地學(xué)習(xí)。

數(shù)據(jù)科學(xué)家基本上都是統(tǒng)計(jì)學(xué)家,大多數(shù)人擁有研究生水平的數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識(shí)。這是從事實(shí)際項(xiàng)目所必需的知識(shí),對(duì)于正確使用算法和假設(shè)檢驗(yàn)至關(guān)重要。

掌握邏輯回歸、決策樹、置信區(qū)間等標(biāo)準(zhǔn)數(shù)學(xué)工具也很重要。大多數(shù)企業(yè)都會(huì)使用這些標(biāo)準(zhǔn)工具。因此,招聘人員也傾向于尋找具備扎實(shí)數(shù)學(xué)背景的求職者,這主要是出于歷史原因。

堅(jiān)持使用標(biāo)準(zhǔn)的數(shù)學(xué)訓(xùn)練和標(biāo)準(zhǔn)工具,對(duì)有興趣成為硬核數(shù)據(jù)科學(xué)家的人是非常有用的。

數(shù)據(jù)科學(xué)家需要掌握哪些知識(shí)呢?

一位優(yōu)秀的數(shù)據(jù)科學(xué)家或工程師必須具備豐富的數(shù)據(jù)庫(kù)知識(shí)和工程實(shí)踐知識(shí)。包括處理和記錄錯(cuò)誤、監(jiān)控系統(tǒng),構(gòu)建人為錯(cuò)誤容錯(cuò)渠道,了解擴(kuò)展項(xiàng)目所需的條件、處理持續(xù)整合問(wèn)題、掌握數(shù)據(jù)庫(kù)管理知識(shí),維護(hù)數(shù)據(jù)清理以及確保確定性處理流程等。

凡事有例外,高中數(shù)學(xué)水平的人也有機(jī)會(huì)

實(shí)際上,在機(jī)器學(xué)習(xí)的所有方面的技術(shù)中,數(shù)據(jù)科學(xué)背后的統(tǒng)計(jì)引擎并不涉及高中以后的任何數(shù)學(xué)或統(tǒng)計(jì)理論。

如果具備強(qiáng)大的數(shù)據(jù)和編程背景,任何人都可以非??焖俚貙W(xué)習(xí)數(shù)據(jù)科學(xué)。

不過(guò),由硬核數(shù)學(xué)導(dǎo)向的數(shù)據(jù)科學(xué)家開發(fā)的一些技術(shù)并不使用數(shù)學(xué)或統(tǒng)計(jì)學(xué),這些技術(shù)同樣有效,其中一些技術(shù)已經(jīng)被證明不輸于使用數(shù)學(xué)的同類技術(shù),而且性能通常更加強(qiáng)大。此外,這些技術(shù)更易于理解,并且可解釋性更強(qiáng)。

數(shù)據(jù)科學(xué)家的實(shí)際工作有多少和數(shù)學(xué)有關(guān)?

打破神話,揭示現(xiàn)實(shí)。

從入門級(jí)數(shù)據(jù)科學(xué)家到中級(jí)數(shù)據(jù)科學(xué)家,一般花在數(shù)學(xué)上的時(shí)間不到5%,機(jī)器學(xué)習(xí)也是如此,尤其是建立模型時(shí),很少有時(shí)間做任何數(shù)學(xué)上的工作。對(duì)于機(jī)器學(xué)習(xí),需要學(xué)習(xí)的真正的必要技能是數(shù)據(jù)分析,以便建立能夠進(jìn)行準(zhǔn)確預(yù)測(cè)的模型。初學(xué)者其實(shí)不需過(guò)多掌握微積分和線性代數(shù)。

只有參與學(xué)術(shù)上的機(jī)器學(xué)習(xí)研究或者少數(shù)先進(jìn)的數(shù)據(jù)科學(xué)家團(tuán)隊(duì)時(shí),數(shù)學(xué)的作用才顯得特別重要。高水平的業(yè)內(nèi)人士也經(jīng)常使用高等數(shù)學(xué)。一些人正在拓展機(jī)器學(xué)習(xí)研究人員的研究邊界。

像谷歌和Facebook這樣的公司中,人們只會(huì)在工作中經(jīng)常使用微積分、線性代數(shù)和更高級(jí)的數(shù)學(xué)工具。

最重要的是,在產(chǎn)業(yè)界中,數(shù)據(jù)科學(xué)家只是沒(méi)有將太多時(shí)間花在數(shù)學(xué)上,但花了大量時(shí)間來(lái)獲取數(shù)據(jù)、清理數(shù)據(jù)、探索數(shù)據(jù)。實(shí)際上,80%的人所做的是數(shù)據(jù)整理和數(shù)據(jù)的可視化。

9類無(wú)需數(shù)學(xué)技術(shù)的數(shù)據(jù)科學(xué)任務(wù)

1、使用基本的Excel進(jìn)行高級(jí)機(jī)器學(xué)習(xí):此方法是一種輕量級(jí)的技術(shù)實(shí)現(xiàn),包括非常簡(jiǎn)單易懂的基本Excel實(shí)現(xiàn)。目前可用于Python、Perl,Julia和R。未來(lái)預(yù)計(jì)還將支持SQL實(shí)現(xiàn)。

2、使用HDT進(jìn)行自動(dòng)化的機(jī)器學(xué)習(xí):此方法融合了名為“決策樹”和“回歸”的兩種傳統(tǒng)技術(shù)。但是這種實(shí)現(xiàn)不涉及任何節(jié)點(diǎn)分割或任何傳統(tǒng)的回歸模型,回歸部分是與數(shù)學(xué)無(wú)關(guān)的Jack-knife回歸。早期版本使用邏輯回歸,但由于數(shù)據(jù)轉(zhuǎn)換過(guò)程比較簡(jiǎn)單,使用的參數(shù)較少,導(dǎo)致邏輯回歸被Jack-knife回歸所取代。

3、無(wú)模型置信區(qū)間:需要對(duì)隨機(jī)變量和概率分布有基本的了解才能知道置信區(qū)間的概念。這類置信區(qū)間方法基于百分位數(shù),非常易于理解,無(wú)需數(shù)學(xué)知識(shí)且可靠性高,可用于預(yù)測(cè)分析。

4、假設(shè)檢驗(yàn):這是學(xué)生在統(tǒng)計(jì)課程中的難題之一。這里已被置信區(qū)間的簡(jiǎn)單變體所取代,便于直觀理解。

5、使用Excel的Jack-knife回歸:這些回歸技術(shù)非常簡(jiǎn)單高效,可以在Excel或SQL中輕松實(shí)現(xiàn)。

6、Jack-knife回歸:理論 – 無(wú)須統(tǒng)計(jì)理論的回歸,甚至不涉及線性代數(shù)。不過(guò)帶有置信區(qū)間。在該方法中,即使使用少量元參數(shù),與經(jīng)典回歸相比,也能實(shí)現(xiàn)最低限度的精度損失。該方法在存在異常值、高度相關(guān)的特征或其他違反假設(shè)的情況下性能良好,這些假設(shè)條件在使用傳統(tǒng)回歸時(shí)必須通過(guò)一個(gè)數(shù)據(jù)集滿足。

7、索引,編目和NLP:無(wú)需數(shù)學(xué)知識(shí)的監(jiān)督聚類方法。

8、快速組合特征選擇:這種方法通常需要理解隨機(jī)變量的概念。

9、方差,聚類和密度估計(jì):這些方法中也不大涉及數(shù)學(xué)。

要成為高效的數(shù)據(jù)科學(xué)家,還是要懂點(diǎn)數(shù)學(xué)的

其實(shí),這里的關(guān)鍵點(diǎn)是,對(duì)于初出茅廬的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)從業(yè)者來(lái)說(shuō),數(shù)據(jù)專業(yè)知識(shí)的重要性要優(yōu)于數(shù)學(xué)專業(yè)知識(shí),因此,如果你的目標(biāo)是獲得一份工作,進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,那么最重要的任務(wù)是必須掌握數(shù)據(jù)分析,而不是掌握微積分。數(shù)據(jù)科學(xué)家要做的不是做證明題或研究數(shù)學(xué)問(wèn)題,能夠分析數(shù)據(jù)才是最重要的。

初學(xué)者需要盡快掌握如何收集數(shù)據(jù)、探索和準(zhǔn)備數(shù)據(jù)。全面掌握數(shù)據(jù)可視化和數(shù)據(jù)處理(包括聚合)是關(guān)鍵環(huán)節(jié),這樣才可以同時(shí)使用它們來(lái)執(zhí)行探索性數(shù)據(jù)分析任務(wù)。

盡管這些無(wú)需數(shù)學(xué)知識(shí)的工具和方法,確實(shí)凸顯了在不具備堅(jiān)實(shí)數(shù)學(xué)基礎(chǔ)的情況下從事數(shù)據(jù)科學(xué)的可能性,但并一定能夠滿足行業(yè)的期望,因?yàn)槟芊瘾@得數(shù)據(jù)科學(xué)家的職位,完全取決于你從事的工作內(nèi)容,以及你心儀的公司究竟從事什么業(yè)務(wù)。

在不具備數(shù)學(xué)背景知識(shí)的情況下,確實(shí)有可能成為一名數(shù)據(jù)科學(xué)家。但按以往經(jīng)驗(yàn)來(lái)看,如果沒(méi)有一定程度的數(shù)學(xué)素養(yǎng),從長(zhǎng)期而言,很難成為一個(gè)高效的數(shù)據(jù)科學(xué)家,而高效這一點(diǎn)無(wú)疑是更為重要的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:不懂?dāng)?shù)學(xué),照樣做數(shù)據(jù)科學(xué)家

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    PCB層疊結(jié)構(gòu)設(shè)計(jì)的先決條件

    )出發(fā),深入探討PCB多層板的層疊結(jié)構(gòu)設(shè)計(jì)的先決條件。 一、Core和PP的簡(jiǎn)要介紹 Core是PCB多層板的核心組成部分,它的兩個(gè)表層都鋪有銅箔,可作為信號(hào)層、電源層、地層等導(dǎo)電層。Core的上、下表層之間填充的是固態(tài)材料,具有良好的機(jī)械強(qiáng)度和電氣性能。而PP則是一種半固態(tài)的樹脂
    的頭像 發(fā)表于 06-06 15:37 ?371次閱讀
    PCB層疊結(jié)構(gòu)設(shè)計(jì)的<b class='flag-5'>先決條件</b>

    地物光譜儀如何幫助科學(xué)家研究植被和土壤?

    在遙感、生態(tài)、農(nóng)業(yè)等研究領(lǐng)域,科學(xué)家們常常會(huì)提到一個(gè)工具: 地物光譜儀 。它看起來(lái)像一臺(tái)“測(cè)光的槍”,卻能揭示土壤和植被的“隱藏信息”。那么,地物光譜儀到底是怎么工作的?它又是如何在科學(xué)研究中
    的頭像 發(fā)表于 05-20 15:46 ?158次閱讀
    地物光譜儀如何幫助<b class='flag-5'>科學(xué)家</b>研究植被和土壤?

    在任何平臺(tái)上使用PetaLinux的先決條件

    本篇文章介紹了在任何平臺(tái)上使用 PetaLinux 的先決條件。PetaLinux 是一種嵌入式 Linux 軟件開發(fā)套件 (SDK),主要用于基于 FPGA 的系統(tǒng)級(jí)芯片 (SoC) 設(shè)計(jì)或 FPGA 設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 10:40 ?576次閱讀
    在任何平臺(tái)上使用PetaLinux的<b class='flag-5'>先決條件</b>

    云天勵(lì)飛董事長(zhǎng)陳寧當(dāng)選深圳市青年科學(xué)家協(xié)會(huì)第十屆會(huì)長(zhǎng)

    ? 2025年3月29日,深圳市青年科學(xué)家協(xié)會(huì)十屆一次會(huì)員大會(huì)在深圳市青少年活動(dòng)中心南廳隆重舉行。百余位青年才俊齊聚一堂,共同見證協(xié)會(huì)換屆選舉,共話科技創(chuàng)新未來(lái)。共青團(tuán)深圳市委員會(huì)書記胡火明出席了
    的頭像 發(fā)表于 03-31 19:15 ?827次閱讀
    云天勵(lì)飛董事長(zhǎng)陳寧當(dāng)選深圳市青年<b class='flag-5'>科學(xué)家</b>協(xié)會(huì)第十屆會(huì)長(zhǎng)

    如何在Mac上下載并安裝SPSDK?

    有人有下載和安裝 SPSDK 的說(shuō)明嗎?先決條件文檔僅適用于 Windows。
    發(fā)表于 03-31 07:49

    將HDF5格式串行為保存模式格式后,文件大小小于預(yù)期怎么解決?

    通過(guò)運(yùn)行 install_prerequisites_tf2.sh,安裝了 TensorFlow* 2 的先決條件。 將 HDF5 格式串行為 SavedModel 格式,但文件大小小于預(yù)期。
    發(fā)表于 03-06 06:17

    我國(guó)科學(xué)家制備出可控手性石墨烯卷

    日前,我國(guó)科學(xué)家開發(fā)了一種名為“石蠟輔助浸入法”的新技術(shù),成功讓二維材料“卷起來(lái)”,制備出具有可控手性的石墨烯卷,為未來(lái)量子計(jì)算和自旋電子器件的發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。 由天津大學(xué)教授胡文平、雷圣賓、李
    的頭像 發(fā)表于 02-26 11:17 ?483次閱讀

    深開鴻亮相“小小科學(xué)家”品牌發(fā)布暨科學(xué)探索研學(xué)營(yíng)開營(yíng)活動(dòng)

    為在青少年中營(yíng)造學(xué)科學(xué)、愛科學(xué)、用科學(xué)的濃厚氛圍,1月14日,由市委組織部、市委教育工委、團(tuán)市委共同主辦的“小小科學(xué)家”品牌發(fā)布暨科學(xué)探索研
    的頭像 發(fā)表于 01-15 21:17 ?568次閱讀
    深開鴻亮相“小小<b class='flag-5'>科學(xué)家</b>”品牌發(fā)布暨<b class='flag-5'>科學(xué)</b>探索研學(xué)營(yíng)開營(yíng)活動(dòng)

    AI 推動(dòng)未來(lái)科學(xué) 晶泰科技共襄未來(lái)科學(xué)大獎(jiǎng)周

    科學(xué)家,探討學(xué)科交叉與學(xué)術(shù)創(chuàng)新,傾力打造兼具權(quán)威性、專業(yè)性和國(guó)際影響力的科學(xué)盛會(huì)。 未來(lái)科學(xué)大獎(jiǎng)由未來(lái)論壇于 2016 年創(chuàng)設(shè),被譽(yù)為"中國(guó)諾貝爾獎(jiǎng)"。未來(lái)論壇是當(dāng)前中國(guó)極具聲望的民間科學(xué)
    的頭像 發(fā)表于 12-18 09:58 ?419次閱讀
    AI 推動(dòng)未來(lái)<b class='flag-5'>科學(xué)</b> 晶泰科技共襄未來(lái)<b class='flag-5'>科學(xué)</b>大獎(jiǎng)周

    西湖大學(xué):科學(xué)家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這一點(diǎn)在西湖大學(xué)的科研項(xiàng)目中已得到體現(xiàn)。 成立于2018年的西湖大學(xué)是由施一公院士領(lǐng)銜創(chuàng)辦的、聚焦前沿科學(xué)研究的研究型大學(xué),該校鼓勵(lì)科學(xué)家們探索AI與各學(xué)科交叉融合,為科研創(chuàng)新提速。為此,西湖大學(xué)在浪潮信息等企業(yè)助力下打造
    的頭像 發(fā)表于 12-12 15:59 ?579次閱讀
    西湖大學(xué):<b class='flag-5'>科學(xué)家</b>+AI,科研新范式的樣本

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了一種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動(dòng)的研究范式,這種范式強(qiáng)調(diào)從大量數(shù)據(jù)中提取有價(jià)值的信息
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    如何激發(fā)科學(xué)家的創(chuàng)新思維。AI不僅僅是工具,更是一種思維方式,它鼓勵(lì)我們跳出傳統(tǒng)框架,以數(shù)據(jù)為驅(qū)動(dòng),探索未知。這種思維方式的轉(zhuǎn)變,不僅促進(jìn)了科學(xué)方法的革新,也為解決全球性挑戰(zhàn)提供了新的視角和途徑
    發(fā)表于 10-14 09:12

    SAP B1 Web Client &amp; MS Teams App集成連載一:先決條件/Prerequisites

    一、先決條件/Prerequisites 在設(shè)置 SAP Business One 應(yīng)用之前,確保您已具備以下各項(xiàng):Before you set up the SAP Business One
    的頭像 發(fā)表于 09-14 16:29 ?372次閱讀
    SAP B1 Web Client &amp; MS Teams App集成連載一:<b class='flag-5'>先決條件</b>/Prerequisites

    受人眼啟發(fā)!科學(xué)家開發(fā)出新型改良相機(jī)

    新型事件相機(jī)系統(tǒng)與標(biāo)準(zhǔn)事件相機(jī)系統(tǒng)對(duì)比圖。 馬里蘭大學(xué)計(jì)算機(jī)科學(xué)家領(lǐng)導(dǎo)的一個(gè)研究小組發(fā)明了一種照相機(jī)裝置,可以改善機(jī)器人觀察周圍世界并做出反應(yīng)的方式。受人眼工作原理的啟發(fā),他們的創(chuàng)新型照相機(jī)系統(tǒng)模仿
    的頭像 發(fā)表于 07-22 06:24 ?556次閱讀
    受人眼啟發(fā)!<b class='flag-5'>科學(xué)家</b>開發(fā)出新型改良相機(jī)

    中國(guó)科學(xué)家發(fā)現(xiàn)新型高溫超導(dǎo)體

    據(jù)新華社報(bào)道,我國(guó)科學(xué)家再立新功,又一新型高溫超導(dǎo)體被發(fā)現(xiàn)。 復(fù)旦大學(xué)物理學(xué)系趙俊團(tuán)隊(duì)利用高壓光學(xué)浮區(qū)技術(shù)成功生長(zhǎng)了三層鎳氧化物,成功證實(shí)在鎳氧化物中具有壓力誘導(dǎo)的體超導(dǎo)電性,而且超導(dǎo)體積分?jǐn)?shù)達(dá)到
    的頭像 發(fā)表于 07-19 15:14 ?1176次閱讀