一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

幫助我們創(chuàng)建數(shù)據(jù)科學(xué)領(lǐng)域的下一代數(shù)據(jù)可視化工具

Tableau社區(qū) ? 來(lái)源:Tableau社區(qū) ? 作者:ANA CRISAN ? 2021-03-19 10:11 ? 次閱讀

數(shù)據(jù)科學(xué)在過(guò)去十年里蓬勃發(fā)展,改變了我們的商業(yè)模式,同時(shí)對(duì)于新一代的年輕人來(lái)說(shuō),提供了一個(gè)未來(lái)的職業(yè)方向。但在數(shù)據(jù)科學(xué)快速發(fā)展的同時(shí),人們對(duì)它的理解也在逐步演變,這導(dǎo)致了不同的人對(duì)于如何更好地從數(shù)據(jù)中獲取洞察有了不同的觀點(diǎn)。對(duì)于我來(lái)說(shuō),數(shù)據(jù)科學(xué)的發(fā)展重塑了我的職業(yè)生涯,接下來(lái)我想深入研究數(shù)據(jù)科學(xué)是什么、數(shù)據(jù)科學(xué)的研究工作是什么以及數(shù)據(jù)科學(xué)家是誰(shuí)等問(wèn)題。我查閱了大量的文獻(xiàn),將數(shù)據(jù)科學(xué)和數(shù)據(jù)科學(xué)家的各種研究和分析關(guān)聯(lián)匯總到一起,從而試圖來(lái)回答了這些問(wèn)題。我在一篇題為 “Passing the Data Baton: A Retrospective Analysis on Data Science Work and Workers” 的研究出版物中說(shuō)明了以上結(jié)果。

這項(xiàng)研究的部分動(dòng)機(jī)是作為未來(lái)研究和開(kāi)發(fā)的基礎(chǔ),這樣我可能可以找到一個(gè)可視化分析工具還未滿足其需求的領(lǐng)域。而另一個(gè)動(dòng)機(jī)是,我希望對(duì)十多年前我剛開(kāi)始學(xué)習(xí)計(jì)算機(jī)科學(xué)時(shí)還不存在的這個(gè)領(lǐng)域進(jìn)行自我反思和回顧。在這篇文章中,我總結(jié)了這篇研究論文的幾個(gè)關(guān)鍵收獲,并分享了這些發(fā)現(xiàn)將如何幫助我們創(chuàng)建數(shù)據(jù)科學(xué)領(lǐng)域的下一代數(shù)據(jù)可視化工具。

什么是數(shù)據(jù)科學(xué)?

數(shù)據(jù)科學(xué)對(duì)不同的人來(lái)說(shuō)是不一樣的。對(duì)某些人來(lái)說(shuō),數(shù)據(jù)科學(xué)并不是什么新鮮事,只是統(tǒng)計(jì)技術(shù)的實(shí)際應(yīng)用,并且已經(jīng)存在了很長(zhǎng)一段時(shí)間。對(duì)其他人來(lái)說(shuō),數(shù)據(jù)科學(xué)不僅需要統(tǒng)計(jì)方法的知識(shí),而且還需要計(jì)算技術(shù)使這些方法得到應(yīng)用。例如,一個(gè)數(shù)據(jù)科學(xué)家僅僅理解線性回歸是不夠的,他們還需要知道如何在大規(guī)模的數(shù)據(jù)中應(yīng)用線性回歸——這不是傳統(tǒng)統(tǒng)計(jì)學(xué)教育的一部分。盡管如此,即使是那些認(rèn)為數(shù)據(jù)科學(xué)不僅僅是應(yīng)用統(tǒng)計(jì)學(xué)的人,也可能并不認(rèn)為它是一件新事物。收集和分析數(shù)據(jù)的做法,長(zhǎng)期以來(lái)一直是科學(xué)研究的一部分,例如生物學(xué)或物理學(xué);許多人認(rèn)為,數(shù)據(jù)科學(xué)只是經(jīng)驗(yàn)科學(xué)中對(duì)已經(jīng)存在的研究的延伸。

eee32ca0-879b-11eb-8b86-12bb97331649.png

但其實(shí)還有第三種觀點(diǎn),即數(shù)據(jù)科學(xué)確實(shí)是一件新的事物,既不同于統(tǒng)計(jì)學(xué),也不同于科學(xué)家在研究原子和基因時(shí)使用的方法。數(shù)據(jù)科學(xué)將統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)以及其他必要的學(xué)科專業(yè)知識(shí)結(jié)合起來(lái),帶來(lái)了數(shù)據(jù)科學(xué)所獨(dú)有的、由數(shù)據(jù)科學(xué)家所應(yīng)對(duì)的全新挑戰(zhàn)。此外,數(shù)據(jù)科學(xué)家開(kāi)展的工作與其他類型的數(shù)據(jù)分析不同,它需要更廣泛的跨學(xué)科技能。我們和其他人的研究都認(rèn)為數(shù)據(jù)科學(xué)確實(shí)是一件全新的、不同的事物,基于這點(diǎn),我們創(chuàng)建了一個(gè)關(guān)于數(shù)據(jù)科學(xué)的定義,作為我們工作的基礎(chǔ):

數(shù)據(jù)科學(xué)是一個(gè)跨學(xué)科領(lǐng)域,旨在通過(guò)統(tǒng)計(jì)和計(jì)算技術(shù)的結(jié)構(gòu)化應(yīng)用,從現(xiàn)實(shí)世界的數(shù)據(jù)中得到新的見(jiàn)解。 這一定義很重要,因?yàn)樗鼛椭覀兞私鈹?shù)據(jù)科學(xué)工作者面臨的挑戰(zhàn)和未滿足的需求,它們主要來(lái)自于處理真實(shí)數(shù)據(jù)的挑戰(zhàn)(而不是模擬數(shù)據(jù)),以及大規(guī)模應(yīng)用統(tǒng)計(jì)和計(jì)算方法的挑戰(zhàn)。

什么是數(shù)據(jù)科學(xué)工作?

efed810e-879b-11eb-8b86-12bb97331649.png

重要的是,數(shù)據(jù)科學(xué)的有效定義縮小了研究范圍。我們并沒(méi)有包含人們可能希望進(jìn)行研究的所有類型的數(shù)據(jù)分析,而是仔細(xì)研究那些數(shù)據(jù)科學(xué)家進(jìn)行研究的分析類型。這種區(qū)別很重要,因?yàn)閷?shí)驗(yàn)物理學(xué)家分析數(shù)據(jù)所采取的具體步驟與數(shù)據(jù)科學(xué)家可能采取的分析步驟不同,盡管它們有共同點(diǎn)。這就引出了一個(gè)重要的后續(xù)問(wèn)題:究竟什么是數(shù)據(jù)科學(xué)的研究工作? 有好幾個(gè)行業(yè)標(biāo)準(zhǔn)來(lái)分解數(shù)據(jù)科學(xué)的研究工作。第一種是 KDD(數(shù)據(jù)發(fā)現(xiàn)中的知識(shí))方法,隨著時(shí)間的推移,其他人會(huì)對(duì)該方法進(jìn)行修改和擴(kuò)展。基于這些推論,以及采訪數(shù)據(jù)科學(xué)家,我們創(chuàng)建了一個(gè)框架,其中包括四個(gè)高階過(guò)程(準(zhǔn)備、分析、部署和通信)和 14 個(gè)低階過(guò)程。使用紅色筆劃輪廓,我們還強(qiáng)調(diào)了數(shù)據(jù)可視化在數(shù)據(jù)科學(xué)工作中已經(jīng)發(fā)揮突出作用的具體領(lǐng)域。在我們的研究文章中,我們提供了這些過(guò)程的詳細(xì)定義和示例。

誰(shuí)是數(shù)據(jù)科學(xué)工作者?

我們?cè)谂c數(shù)據(jù)科學(xué)家進(jìn)行的 12 項(xiàng)深入研究中發(fā)現(xiàn)了 9 個(gè)數(shù)據(jù)科學(xué)角色。這些年來(lái),我聽(tīng)到了許多關(guān)于數(shù)據(jù)科學(xué)家的不同看法。我喜歡的一個(gè)例子是,數(shù)據(jù)科學(xué)家是“比統(tǒng)計(jì)學(xué)家更擅長(zhǎng)軟件工程,比軟件工程師更擅長(zhǎng)統(tǒng)計(jì)學(xué)” 的人。我最近聽(tīng)到的一個(gè)直白的說(shuō)法是,數(shù)據(jù)科學(xué)家是“西海岸的統(tǒng)計(jì)學(xué)家”。

然而,當(dāng)我們深入研究現(xiàn)有的數(shù)據(jù)科學(xué)家的研究時(shí),我們沒(méi)想到發(fā)現(xiàn)了一個(gè)重要且一致的特征,即 “數(shù)據(jù)科學(xué)家” 的多樣性以及它們?cè)谔囟〝?shù)據(jù)科學(xué)過(guò)程中的作用如何變化。您可能已經(jīng)注意到數(shù)據(jù)工程師的崛起,例如,作為一個(gè)獨(dú)特但仍然相鄰的數(shù)據(jù)科學(xué)角色。隨著數(shù)據(jù)科學(xué)工作的復(fù)雜性的增加,數(shù)據(jù)科學(xué)家變得更專業(yè),往往從事數(shù)據(jù)科學(xué)研究工作的具體方面。Harris 等人的訪談早在 2012 年就已經(jīng)確定了這一趨勢(shì),這種趨勢(shì)只是隨著時(shí)間的推移而加速。他們敏銳地發(fā)現(xiàn),數(shù)據(jù)科學(xué)角色之間的這種多樣性導(dǎo)致了 “數(shù)據(jù)科學(xué)家和尋求幫助的人之間的交流不暢”。

我們根據(jù) Harris 的研究結(jié)果,對(duì) 12 項(xiàng)研究進(jìn)行了調(diào)查,共有數(shù)千名被認(rèn)定為數(shù)據(jù)科學(xué)家的個(gè)體。通過(guò)對(duì)這些研究的分析,我們能夠識(shí)別出 9 個(gè)不同的數(shù)據(jù)角色。這些人有不同的技能和背景,我們以統(tǒng)計(jì)、計(jì)算機(jī)科學(xué)和領(lǐng)域?qū)I(yè)知識(shí)為軸心來(lái)說(shuō)明。我們還將以人為中心的設(shè)計(jì)納入了我們對(duì)數(shù)據(jù)科學(xué)技能的描述,因?yàn)榭紤]到數(shù)據(jù)產(chǎn)品的影響,就像面部識(shí)別應(yīng)用程序一樣,越來(lái)越重要。我們要強(qiáng)調(diào)的是,這些角色不是絕對(duì)的范疇,它們的邊界是不固定的,同時(shí)這些角色的技術(shù)技能也符合類似的規(guī)律。相反,提出這些角色類別的目的是提供一個(gè)指導(dǎo),從而幫助研究人員對(duì)于正在交談的人以及他們的背景有一個(gè)直觀的認(rèn)識(shí)。

這將如何改變我們創(chuàng)建可視化

和數(shù)據(jù)分析工具的方式?

當(dāng)然,最重要的是我們對(duì)數(shù)據(jù)科學(xué)的定義以及我們的數(shù)據(jù)科學(xué)工作框架和工作人員如何幫助我們構(gòu)建更好的數(shù)據(jù)可視化工具。首先也是最重要的一點(diǎn)是,它有助于提供一個(gè)清晰的標(biāo)準(zhǔn),從而明確了數(shù)據(jù)科學(xué)研究工作的多樣性和對(duì)應(yīng)的工作人員。我們已經(jīng)使用這個(gè)框架創(chuàng)建了更清晰的標(biāo)準(zhǔn)來(lái)分解數(shù)據(jù)科學(xué)中的 Tableau 客戶體驗(yàn)。我們可以更精確地確定他們正試圖做什么,并可以就這些過(guò)程提出更深入的問(wèn)題。

已知 “數(shù)據(jù)科學(xué)家” 這個(gè)角色本身包含了大量的多樣性,我們可以通過(guò)將與我們交談的個(gè)人歸類到九個(gè)數(shù)據(jù)科學(xué)的角色,從而更好地確定誰(shuí)在執(zhí)行這項(xiàng)工作。這樣的分類使得我們更容易理解可視化系統(tǒng)需要支持的任務(wù)以及在什么級(jí)別上支持這些任務(wù)。例如,技術(shù)分析員和 ML/AI 工程師是我們描述的兩個(gè)數(shù)據(jù)科學(xué)角色,他們都可以參與模型構(gòu)建的共同任務(wù),但需求截然不同;如果我們忽略這些差異,我們就有可能為這兩個(gè)角色創(chuàng)建錯(cuò)誤的工具。

但也許對(duì)我來(lái)說(shuō)最重要的是,這個(gè)框架還幫助我思考當(dāng)前可視化分析工具生態(tài)系統(tǒng)中缺少的東西。我得出的一個(gè)令人擔(dān)憂的結(jié)論是,現(xiàn)有工具對(duì)可視化機(jī)器學(xué)習(xí)模型的關(guān)注范圍很窄,缺乏支持?jǐn)?shù)據(jù)科學(xué)研究工作的其他關(guān)鍵方面的工具,如數(shù)據(jù)準(zhǔn)備、部署或通信。這種工具的缺乏不僅增加了數(shù)據(jù)科學(xué)研究工作的開(kāi)銷,還使得數(shù)據(jù)科學(xué)家無(wú)論擔(dān)任什么角色,都更難讓他們的工作影響到組織的決策和實(shí)踐。這項(xiàng)關(guān)于數(shù)據(jù)科學(xué)工作和工作者的研究幫助我面對(duì)以上挑戰(zhàn),同時(shí)為構(gòu)建更好的工具來(lái)幫助人們查看和理解他們的數(shù)據(jù)提供了機(jī)會(huì)。

原文標(biāo)題:數(shù)據(jù)科學(xué)的十年回顧與可視化工具的未來(lái)

文章出處:【微信公眾號(hào):Tableau社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:數(shù)據(jù)科學(xué)的十年回顧與可視化工具的未來(lái)

文章出處:【微信號(hào):TableauChina,微信公眾號(hào):Tableau社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)設(shè)備數(shù)據(jù)集中監(jiān)控可視化管理平臺(tái)是什么

    工業(yè)設(shè)備數(shù)據(jù)集中監(jiān)控可視化管理平臺(tái)是種用于整合、監(jiān)控和可視化工業(yè)設(shè)備數(shù)據(jù)的綜合性系統(tǒng),旨在幫助
    的頭像 發(fā)表于 05-06 11:10 ?39次閱讀

    七款經(jīng)久不衰的數(shù)據(jù)可視化工具

    、圖形等形式展示,使數(shù)據(jù)更易于理解與分析。本文將深入探討數(shù)據(jù)可視化工具的概念、種類及其應(yīng)用,同時(shí),我們將推薦款高效好用的
    發(fā)表于 01-19 15:24

    什么是大屏數(shù)據(jù)可視化?特點(diǎn)有哪些?

    大屏數(shù)據(jù)可視化是指通過(guò)大屏幕展示大量數(shù)據(jù)和信息,以直觀、可視化的方式幫助用戶理解和分析數(shù)據(jù)。這種
    的頭像 發(fā)表于 12-16 16:59 ?532次閱讀

    數(shù)據(jù)可視化數(shù)據(jù)分析的關(guān)系

    在當(dāng)今這個(gè)信息爆炸的時(shí)代,數(shù)據(jù)無(wú)處不在。無(wú)論是企業(yè)運(yùn)營(yíng)、科學(xué)研究還是個(gè)人決策,我們都需要從海量的數(shù)據(jù)中提取有價(jià)值的信息。數(shù)據(jù)分析和
    的頭像 發(fā)表于 12-06 17:09 ?743次閱讀

    Minitab 數(shù)據(jù)可視化技巧

    數(shù)據(jù)分析領(lǐng)域,數(shù)據(jù)可視化種將數(shù)據(jù)以圖形或圖像的形式展示出來(lái)的技術(shù),它可以
    的頭像 發(fā)表于 12-02 15:40 ?1062次閱讀

    智慧能源可視化監(jiān)管平臺(tái)——助力可視化能源數(shù)據(jù)管理

    博達(dá)可視化大屏設(shè)計(jì)平臺(tái)在智慧能源領(lǐng)域的價(jià)值體現(xiàn)在實(shí)時(shí)監(jiān)控、數(shù)據(jù)可視化、決策支持和效率提升等方面。借助該平臺(tái),企業(yè)可以輕松搭建智慧能源類可視化
    的頭像 發(fā)表于 11-29 10:00 ?767次閱讀
    智慧能源<b class='flag-5'>可視化</b>監(jiān)管平臺(tái)——助力<b class='flag-5'>可視化</b>能源<b class='flag-5'>數(shù)據(jù)</b>管理

    智慧園區(qū)數(shù)據(jù)可視化優(yōu)勢(shì)體現(xiàn)在哪些地方

    、地圖、儀表盤等形式呈現(xiàn)數(shù)據(jù),使復(fù)雜的數(shù)據(jù)變得直觀易懂,幫助用戶更快速、準(zhǔn)確地理解數(shù)據(jù)。 2.實(shí)時(shí)監(jiān)控與反饋:數(shù)據(jù)
    的頭像 發(fā)表于 11-15 10:30 ?431次閱讀
    智慧園區(qū)<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>可視化</b>優(yōu)勢(shì)體現(xiàn)在哪些地方

    毫米波演示可視化工具

    電子發(fā)燒友網(wǎng)站提供《毫米波演示可視化工具.pdf》資料免費(fèi)下載
    發(fā)表于 11-13 14:24 ?0次下載
    毫米波演示<b class='flag-5'>可視化工具</b>

    博世Logistics Cockpit軟件平臺(tái)這套神秘引擎把數(shù)據(jù)可視化玩得很酷

    數(shù)據(jù)的呈現(xiàn)方式, 你更喜歡哪種?誰(shuí)會(huì)有耐心從密密麻麻的數(shù)據(jù)中挖掘信息呢?相比之下,圖表、趨勢(shì)圖等視覺(jué)化呈現(xiàn)更易于理解與分析。 你看,當(dāng)紛繁復(fù)雜的行行數(shù)據(jù)被 「
    的頭像 發(fā)表于 08-13 10:40 ?822次閱讀
    博世Logistics Cockpit軟件平臺(tái)這套神秘引擎把<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>可視化</b>玩得很酷

    大屏數(shù)據(jù)可視化 開(kāi)源

    在當(dāng)今信息爆炸的時(shí)代,數(shù)據(jù)已經(jīng)成為各個(gè)行業(yè)決策制定和業(yè)務(wù)發(fā)展的關(guān)鍵。為了更直觀、準(zhǔn)確地理解和利用海量數(shù)據(jù), 大屏數(shù)據(jù)可視化 成為種強(qiáng)大的
    的頭像 發(fā)表于 06-27 16:06 ?621次閱讀
    大屏<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>可視化</b> 開(kāi)源

    物聯(lián)網(wǎng)時(shí)代,為什么需要可視化數(shù)據(jù)大屏

    在互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代,工業(yè)領(lǐng)域日益增長(zhǎng)的數(shù)據(jù)量越來(lái)越離不開(kāi)數(shù)據(jù)分析的支持,可視化數(shù)據(jù)大屏便是集中
    的頭像 發(fā)表于 06-18 13:53 ?614次閱讀
    物聯(lián)網(wǎng)時(shí)代,為什么需要<b class='flag-5'>可視化</b><b class='flag-5'>數(shù)據(jù)</b>大屏

    智慧大屏是如何實(shí)現(xiàn)數(shù)據(jù)可視化的?

    智慧大屏,作為數(shù)據(jù)可視化的重要載體,已在城市管理、交通監(jiān)控、商業(yè)運(yùn)營(yíng)等領(lǐng)域廣泛應(yīng)用。本文旨在闡述智慧大屏實(shí)現(xiàn)數(shù)據(jù)可視化的關(guān)鍵技術(shù)和方法,包括
    的頭像 發(fā)表于 06-04 15:02 ?856次閱讀
    智慧大屏是如何實(shí)現(xiàn)<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>可視化</b>的?

    大屏數(shù)據(jù)可視化的作用和意義

    大屏數(shù)據(jù)可視化則是將這些數(shù)據(jù)以更加直觀、易懂的方式展現(xiàn)出來(lái),幫助用戶快速做出決策、發(fā)現(xiàn)問(wèn)題、分析趨勢(shì),具有重要的作用和意義。 大屏數(shù)據(jù)
    的頭像 發(fā)表于 06-03 17:56 ?975次閱讀

    大屏數(shù)據(jù)可視化是什么?運(yùn)用了什么技術(shù)

    大屏數(shù)據(jù)可視化種利用大屏幕設(shè)備展示數(shù)據(jù)可視化結(jié)果的技術(shù),旨在以更生動(dòng)、直觀的方式呈現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 05-24 15:35 ?1119次閱讀

    東盟能源和華為主編的《東盟下一代數(shù)據(jù)中心建設(shè)白皮書(shū)》正式發(fā)布

    2024年5月17日,在2024全球數(shù)據(jù)中心產(chǎn)業(yè)論壇上,由東盟能源中心(ASEAN Center for Energy)和華為主編的《東盟下一代數(shù)據(jù)中心建設(shè)白皮書(shū)》(以下簡(jiǎn)稱《白皮書(shū)》)重磅發(fā)布,旨在推動(dòng)?xùn)|盟數(shù)據(jù)中心產(chǎn)業(yè)加快綠色
    的頭像 發(fā)表于 05-19 14:19 ?1167次閱讀
    東盟能源和華為主編的《東盟<b class='flag-5'>下一代數(shù)據(jù)</b>中心建設(shè)白皮書(shū)》正式發(fā)布