一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

2018年數(shù)據(jù)科學和機器學習工具調(diào)查

算法與數(shù)據(jù)結(jié)構(gòu) ? 來源:未知 ? 作者:胡薇 ? 2018-06-07 17:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,數(shù)據(jù)科學網(wǎng)站KDnuggets發(fā)布 2018年數(shù)據(jù)科學和機器學習工具調(diào)查結(jié)果。下面一起來看看調(diào)查結(jié)果

最受青睞的分析、數(shù)據(jù)科學、機器學習工具

圖1:2018年的最受青睞的工具及其在2016 - 2017年調(diào)查中的份額

*為了更有效的比較,KDnuggets重新計算了2016年,2017年問卷調(diào)查結(jié)果,排除了受訪者“單一”的選項。

下表是前11名的工具排行,其中每個工具至少有20%的份額:

表1:KDnuggets2018年頂級分析/數(shù)據(jù)科學/ ML軟件調(diào)查

在這里,“2018%share”是指使用該工具的受訪者百分比,“%change 2018 VS 2017”是表示2017年調(diào)查的變化 ,用綠色表示增長幅度達到10%以上,紅色表示下降幅度達到10%以上。

今年,每名受訪者的平均使用工具數(shù)量為7個,略高于2017年投票中的6.75(不包括單一工具回復)。

與2017年軟件投票相比,今年前11名中,出現(xiàn)了一個新面孔Keras,Keras取代了去年Knime的位置。下面是針對以上數(shù)據(jù)的一些觀察發(fā)現(xiàn):

Python消滅了R

到2017年,Python已經(jīng)擁有超過50%的份額,如今已經(jīng)將其份額提高到66%,而在我們此次的調(diào)查中,R份額首次出現(xiàn)下降,而且是一下子降到50%以下。

RapidMiner激增

在過去的幾次調(diào)查中,RapidMiner一直是最大的數(shù)據(jù)科學平臺之一,它的份額從2017年的33%大幅增加到50%左右。

這樣的增長速度是否是因為廠商的推廣帶來的呢?RapidMiner創(chuàng)始人兼總裁Ingo Mierswa的表示:

與許多供應商一樣,RapidMiner通過多種渠道向用戶推廣KDnuggets問卷調(diào)查,之前我們也做過同樣的推廣,但與之前不同的是,首先今年得到了更好的回應,超過400位用戶親自回復了郵件,更重要的是,最近一年里,RapidMiner的月活躍用戶增長了300% ,因此可以向更多的用戶發(fā)送了關(guān)于KDnuggets問卷調(diào)查的郵件。

SQL是穩(wěn)定的

SQL(包括Spark SQL和SQL to Hadoop工具在內(nèi))在最近的3次調(diào)查中仍然占有約40%的份額。所以,如果你是一位有抱負的數(shù)據(jù)科學家,學習SQL吧,它可能會對你很有用!

趨勢

在調(diào)查中,使用率超過2%的新工具是Spark SQL,擁有11.7%的份額。

下表列出了2018年份額增長20%以上的工具,并在2018年達到至少3%的份額。

表 2:使用率增幅最大的主要分析/數(shù)據(jù)科學/機器學習工具

整合

值得一提的是,在2017年擁有2%以上份額的56個工具中,有19個(僅約三分之一)工具在2018年份額有所增加,而有37個的份額下降。結(jié)合Datawatch收購Angoss,Minitab收購Salford等近期的收購案可以表明,數(shù)據(jù)科學平臺的整合即將展開。

2018年擁有3%以上份額,卻在2018年份額下降25%以上的工具見下表:

表 3:使用率跌幅最大的主要分析/數(shù)據(jù)科學工具

深度學習工具

使用深度學習工具的受訪者比例保持穩(wěn)定,2018年有33%的受訪者表示使用深度學習工具,2017年為32%,2016年為18%。 谷歌Tensorflow依然是最主要的平臺。

頂級深度學習工具排名如下:

Tensorflow, 29.9%

● Keras, 22.2%

● PyTorch, 6.4%

● Theano, 4.9%

● Other Deep Learning Tools, 4.9%

● DeepLearning4J, 3.4%

● Microsoft Cognitive Toolkit (Prev. CNTK), 3.0%

● Apache MXnet, 1.5%

● Caffe, 1.5%

● Caffe2, 1.2%

TFLearn, 1.1%

● Torch, 1.0%

● Lasagne, 0.3%

大數(shù)據(jù)工具:Hadoop被拋棄

2018年,約33%的開發(fā)者使用Hadoop或Spark等大數(shù)據(jù)工具 - 與2017年大致相同,但Hadoop使用率顯著下降,下降幅度高達35%,以下是詳細信息:

編程語言

Python似乎不僅超過了R,還包括大多數(shù)其他語言,目前Python和SQL,Java和C / C ++幾乎保持在相同水平。自從KDnuggets 進行這項調(diào)查以來,R第一次出現(xiàn)了下降。其他語言同樣也有所下降。

以下是按熱門度排序的主要編程語言:

● Python, 65.6% (was 59.0% in 2017), 11% up

● R, 48.5% (was 56.6%), 14% down

● SQL, 39.6% (was 39.2%), 1% up

● Java, 15.1% (was 15.5%), 3% down

● Unix, shell/awk/gawk, 9.2% (was 10.8%), 15% down

● Other programming and data languages, 6.9%, (was 7.6%), -9% down

● C/C++, 6.8%, (was 7.1%), 3% down

● Scala, 5.9%, (was 8.3%), 29% down

● Perl, 1.0% (was 1.9%), 46% down

● Julia, 0.7% (was 1.2%), 45% down

● Lisp, 0.3% (was 0.4%), -25% down

● Clojure, 0.2% (was 0.3%), -38% down

● F, # 0.1% (was 0.5%), -73% down

完整結(jié)果和 3 年來的趨勢

以下表格展示了調(diào)查結(jié)果的細節(jié)(此處僅列出排名前 20 的工具):

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86777
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    16471
  • r語言
    +關(guān)注

    關(guān)注

    1

    文章

    30

    瀏覽量

    6515

原文標題:Python完勝R語言,Hadoop被拋棄!2018 年數(shù)據(jù)科學和機器學習工具調(diào)查

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2024諾貝爾物理學獎為何要頒給機器學習?

    (Geoffrey Hinton),表彰他們在使用人工神經(jīng)網(wǎng)絡(luò)的機器學習方面的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。 ? 作為在科學界具有舉足輕重的地位和深遠影響的諾貝爾獎,它不僅是對科學家個人成就的最高
    的頭像 發(fā)表于 10-10 00:11 ?4417次閱讀

    航盛集團2025年數(shù)字化建設(shè)項目正式啟動

    為統(tǒng)一戰(zhàn)略認知、凝聚執(zhí)行合力,近日,航盛2025年數(shù)字化建設(shè)項目啟動會在深圳總部順利召開。航盛高層領(lǐng)導及項目團隊成員出席本次活動。會議標志著航盛集團2025年數(shù)字化建設(shè)項目正式啟動。
    的頭像 發(fā)表于 07-18 10:20 ?117次閱讀

    NXP eIQ Time Series Studio 工具使用攻略(九)-數(shù)據(jù)標簽

    其中"Data Labeling",數(shù)據(jù)標簽工具使用戶能夠通過可視化界面將相應的數(shù)據(jù)標簽(如電弧或無電?。糜诋斍?b class='flag-5'>數(shù)據(jù)圖形的不同部分,從而對導入的原始
    的頭像 發(fā)表于 05-22 09:51 ?827次閱讀
    NXP eIQ Time Series Studio <b class='flag-5'>工具</b>使用攻略(九)-<b class='flag-5'>數(shù)據(jù)</b>標簽

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術(shù)細節(jié),今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    Gartner發(fā)布2025年數(shù)據(jù)和分析重要趨勢

    Gartner公司發(fā)布了2025年數(shù)據(jù)和分析(D&A)重要趨勢,這些趨勢正在催生包括企業(yè)和人員管理等方面的一系列挑戰(zhàn)。Gartner研究副總裁孫鑫(JulianSun)表示:“D&A
    的頭像 發(fā)表于 03-27 11:06 ?570次閱讀
    Gartner發(fā)布2025<b class='flag-5'>年數(shù)據(jù)</b>和分析重要趨勢

    EEPROM芯片市場應用與出貨量分析(截至2025年數(shù)據(jù)

    EEPROM芯片市場應用與出貨量分析(截至2025年數(shù)據(jù)
    的頭像 發(fā)表于 03-03 16:57 ?776次閱讀

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習模型市場
    的頭像 發(fā)表于 02-13 09:39 ?365次閱讀

    新型儲能產(chǎn)業(yè)發(fā)展現(xiàn)狀及趨勢-2024上半年數(shù)據(jù)發(fā)布簡版

    新型儲能產(chǎn)業(yè)發(fā)展現(xiàn)狀及趨勢-2024上半年數(shù)據(jù)發(fā)布 簡版
    發(fā)表于 01-03 15:14 ?0次下載

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數(shù)據(jù)機器學習方法。盡管深度學習(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個強大的工具,目前也非常流行,但它的應用領(lǐng)域仍然有限。與深度
    的頭像 發(fā)表于 12-30 09:16 ?1194次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機器學習需要設(shè)法對數(shù)據(jù)進行分析學習,這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關(guān)系

    在人工智能領(lǐng)域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發(fā)表于 11-15 09:19 ?1229次閱讀

    eda在機器學習中的應用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果一個數(shù)據(jù)集中的某個特征值遠高于其他值,這可能是一個異常值,需要進一步調(diào)查。 2. 特
    的頭像 發(fā)表于 11-13 10:42 ?911次閱讀

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    閱讀這一章后,我深感人工智能與生命科學的結(jié)合正引領(lǐng)著一場前所未有的科學革命,以下是我個人的讀后感: 1. 技術(shù)革新與生命科學進步 這一章詳細闡述了人工智能如何通過其強大的數(shù)據(jù)處理和分析
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    人工智能在科學研究中的核心技術(shù),包括機器學習、深度學習、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復雜的數(shù)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度
    發(fā)表于 10-14 09:12