一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

八大機(jī)器學(xué)習(xí)數(shù)據(jù)集

DPVg_AI_era ? 來(lái)源:lq ? 2019-01-18 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Medium上的一位用戶整理了一份機(jī)器學(xué)習(xí)大型數(shù)據(jù)集清單,包括八大數(shù)據(jù)集資源庫(kù)??傆幸豢钸m合你,快來(lái)收藏吧!

下面的ML大型數(shù)據(jù)集,總有一款適合你。

就目前來(lái)看,找到一個(gè)特定的數(shù)據(jù)集來(lái)解決各種機(jī)器學(xué)習(xí)問(wèn)題,甚至進(jìn)行實(shí)驗(yàn)還是比較困難的。

本文作者Will Badr便列舉了八大機(jī)器學(xué)習(xí)數(shù)據(jù)集。

不僅包含用于實(shí)驗(yàn)的大型數(shù)據(jù)集,還附帶對(duì)數(shù)據(jù)集的描述以及使用示例。有的還包含用于解決與該數(shù)據(jù)集相關(guān)機(jī)器學(xué)習(xí)問(wèn)題的算法代碼。

話不多說(shuō),上數(shù)據(jù)集!

1、Kaggle數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.kaggle.com/datasets

這是作者最喜歡的數(shù)據(jù)集之一。

每個(gè)數(shù)據(jù)集都是一個(gè)小型社區(qū),用戶可以在其中討論數(shù)據(jù)、查找公共代碼或在內(nèi)核中創(chuàng)建自己的項(xiàng)目。包含各式各樣的真實(shí)數(shù)據(jù)集。

用戶還可以看到與每個(gè)數(shù)據(jù)集相關(guān)的“內(nèi)核”,許多數(shù)據(jù)科學(xué)家還提供了相關(guān)手冊(cè)來(lái)分析數(shù)據(jù)集。

2、Amazon數(shù)據(jù)集

數(shù)據(jù)集地址:

https://registry.opendata.aws/

該數(shù)據(jù)源包含多個(gè)不同領(lǐng)域的數(shù)據(jù)集,如:公共交通、生態(tài)資源、衛(wèi)星圖像等。

網(wǎng)頁(yè)中也有一個(gè)搜索框來(lái)幫助用戶尋找想要的數(shù)據(jù)集,還有所有數(shù)據(jù)集的描述和使用示例,這些數(shù)據(jù)集信息豐富且易于使用!

數(shù)據(jù)集存儲(chǔ)在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個(gè)高度可伸縮的對(duì)象存儲(chǔ)服務(wù)。

如果用戶正在使用AWS進(jìn)行機(jī)器學(xué)習(xí)實(shí)驗(yàn)和開(kāi)發(fā),這將非常方便,由于它是AWS網(wǎng)絡(luò)的本地?cái)?shù)據(jù),因此數(shù)據(jù)集的傳輸將非??臁?/p>

3、UCI機(jī)器學(xué)習(xí)資源庫(kù)

數(shù)據(jù)集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一個(gè)來(lái)自加州大學(xué)信息與計(jì)算機(jī)科學(xué)學(xué)院的大型資源庫(kù),包含100多個(gè)數(shù)據(jù)集。

用戶可以找到單變量和多變量時(shí)間序列數(shù)據(jù)集,分類(lèi)、回歸或推薦系統(tǒng)的數(shù)據(jù)集。

有些UCI的數(shù)據(jù)集已經(jīng)是被清洗過(guò)的。

4、谷歌數(shù)據(jù)集搜索引

數(shù)據(jù)集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他們最擅長(zhǎng)的事情,推出了另一項(xiàng)偉大的服務(wù)——它是一個(gè)可以按名稱(chēng)搜索數(shù)據(jù)集的工具箱。

他們的目標(biāo)是統(tǒng)一成千上萬(wàn)個(gè)不同的數(shù)據(jù)集存儲(chǔ)庫(kù),使這些數(shù)據(jù)能夠且易被發(fā)現(xiàn)。

5、微軟數(shù)據(jù)集

數(shù)據(jù)集地址:

https://msropendata.com/

2018年7月,微軟與外部研究社區(qū)共同宣布推出“Microsoft Research Open Data”。

它在云中包含一個(gè)數(shù)據(jù)存儲(chǔ)庫(kù),用于促進(jìn)全球研究社區(qū)之間的協(xié)作。它提供了一系列用于已發(fā)表研究的、經(jīng)過(guò)處理的數(shù)據(jù)集。

6、Awesome Public Datasets Collection

數(shù)據(jù)集地址:

https://github.com/awesomedata/awesome-public-datasets

這是一個(gè)按“主題”組織的數(shù)據(jù)集,比如生物學(xué)、經(jīng)濟(jì)學(xué)、教育學(xué)等。

這里列出的大多數(shù)數(shù)據(jù)集都是免費(fèi)的,但是在使用任何數(shù)據(jù)集之前,用戶需要檢查一下許可要求。

7、政府?dāng)?shù)據(jù)集

政府相關(guān)數(shù)據(jù)集也很容易找到的。

許多國(guó)家為了提高透明度,向公眾分享了各種數(shù)據(jù)集。以下是一些例子:

歐盟開(kāi)放數(shù)據(jù)門(mén)戶:歐洲政府?dāng)?shù)據(jù)集。

數(shù)據(jù)集地址:

https://data.europa.eu/euodp/data/dataset

美國(guó)政府?dāng)?shù)據(jù):目前由于一些非政治性原因,暫時(shí)無(wú)法訪問(wèn)。

數(shù)據(jù)集地址:

https://www.data.gov/

新西蘭政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://catalogue.data.govt.nz/dataset

印度政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://data.gov.in/

8、計(jì)算機(jī)視覺(jué)數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.visualdata.io/

Visual Data包含一些可以用來(lái)構(gòu)建計(jì)算機(jī)視覺(jué)(CV)模型的大型數(shù)據(jù)集。

用戶可以通過(guò)特定的CV主題查找特定的數(shù)據(jù)集,如語(yǔ)義分割、圖像標(biāo)題、圖像生成,甚至可以通過(guò)解決方案(自動(dòng)駕駛汽車(chē)數(shù)據(jù)集)查找特定的數(shù)據(jù)集。

總結(jié)

從上述作者所觀察到數(shù)據(jù)集情況來(lái)看,似乎是涵蓋各個(gè)方向和領(lǐng)域。

這些新數(shù)據(jù)集的社區(qū)將繼續(xù)發(fā)展,使數(shù)據(jù)更容易被獲取,使眾包和計(jì)算機(jī)科學(xué)社區(qū)能夠繼續(xù)快速創(chuàng)新,為生活帶來(lái)更多創(chuàng)造性的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95412
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134643
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25457

原文標(biāo)題:【收藏】8款大型機(jī)器學(xué)習(xí)數(shù)據(jù)集頂級(jí)資源

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    江智原創(chuàng)性老人八大關(guān)鍵時(shí)光點(diǎn)全覆蓋 康養(yǎng)生態(tài)軟件系統(tǒng)

    深圳市江智工業(yè)技術(shù)有限公司從2016年開(kāi)始專(zhuān)注康養(yǎng)機(jī)器人10年來(lái)的努力,專(zhuān)注老人穿戴,飲食,居住,出行,作息,文旅,健康,內(nèi)心八大關(guān)鍵時(shí)光節(jié)點(diǎn)全覆蓋的全球原創(chuàng)性的康養(yǎng)軟件系統(tǒng)于2025年6月正式發(fā)布
    的頭像 發(fā)表于 06-29 20:54 ?486次閱讀
    江智原創(chuàng)性老人<b class='flag-5'>八大</b>關(guān)鍵時(shí)光點(diǎn)全覆蓋 康養(yǎng)生態(tài)軟件系統(tǒng)

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長(zhǎng)以及計(jì)算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場(chǎng)前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場(chǎng)
    的頭像 發(fā)表于 02-13 09:39 ?365次閱讀

    最新!智慧燈桿八大應(yīng)用場(chǎng)景案例獨(dú)家匯總

    最新!智慧燈桿八大應(yīng)用場(chǎng)景案例獨(dú)家匯總
    的頭像 發(fā)表于 01-14 12:47 ?692次閱讀
    最新!智慧燈桿<b class='flag-5'>八大</b>應(yīng)用場(chǎng)景案例獨(dú)家匯總

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開(kāi)發(fā)生物學(xué)數(shù)據(jù)機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個(gè)強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比
    的頭像 發(fā)表于 12-30 09:16 ?1194次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    2025年全球半導(dǎo)體八大趨勢(shì),萬(wàn)年芯蓄勢(shì)待發(fā)

    近日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布了2025年全球半導(dǎo)體市場(chǎng)的八大趨勢(shì)預(yù)測(cè),顯示出對(duì)半導(dǎo)體市場(chǎng)回暖的信心,為業(yè)界提供了寶貴的市場(chǎng)洞察。在全球范圍內(nèi),特別是在人工智能(AI)和高性能運(yùn)算(HPC)需求
    的頭像 發(fā)表于 12-17 16:53 ?2277次閱讀
    2025年全球半導(dǎo)體<b class='flag-5'>八大</b>趨勢(shì),萬(wàn)年芯蓄勢(shì)待發(fā)

    cmp在機(jī)器學(xué)習(xí)中的作用 如何使用cmp進(jìn)行數(shù)據(jù)對(duì)比

    機(jī)器學(xué)習(xí)領(lǐng)域,"cmp"這個(gè)術(shù)語(yǔ)可能并不是一個(gè)常見(jiàn)的術(shù)語(yǔ),它可能是指"比較"(comparison)的縮寫(xiě)。 比較在機(jī)器學(xué)習(xí)中的作用 模型評(píng)估 :比較不同模型的性能是
    的頭像 發(fā)表于 12-17 09:35 ?884次閱讀

    盤(pán)點(diǎn)圖像傳感器選型八大要點(diǎn)

    ,成為了一個(gè)值得深入探討的話題。本文將為您揭示圖像傳感器選型的八大要點(diǎn),幫助您精準(zhǔn)捕捉世界的奧秘。 一、分辨率:細(xì)節(jié)與清晰度的關(guān)鍵 分辨率是評(píng)估圖像傳感器性能的首要指標(biāo),決定了圖像的細(xì)節(jié)和清晰度。高分辨率傳
    的頭像 發(fā)表于 12-02 01:02 ?805次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?967次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點(diǎn) NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項(xiàng)目中提出,旨在為T(mén)ensorFlow框架提供專(zhuān)用的硬件加速。NPU的設(shè)計(jì)目標(biāo)是提高機(jī)器學(xué)習(xí)算法的運(yùn)行效率,特別是在處理大規(guī)模數(shù)
    的頭像 發(fā)表于 11-15 09:19 ?1229次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過(guò)程中不可或缺的一部分。 1. 數(shù)據(jù)清洗
    的頭像 發(fā)表于 11-13 10:42 ?911次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類(lèi)似人類(lèi)智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)學(xué)習(xí)
    發(fā)表于 10-24 17:22 ?2981次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    七騰機(jī)器人:防爆輪式機(jī)器人-四輪驅(qū)全新上線

    今日,七騰機(jī)器人有限公司(以下簡(jiǎn)稱(chēng)“七騰機(jī)器人”)推出全新產(chǎn)品:防爆輪式機(jī)器人-四輪驅(qū)。該款產(chǎn)品是七騰輪式巡檢機(jī)器人產(chǎn)品系列的最新成員,防
    的頭像 發(fā)表于 10-21 16:32 ?557次閱讀
    七騰<b class='flag-5'>機(jī)器</b>人:防爆輪式<b class='flag-5'>機(jī)器</b>人-四輪<b class='flag-5'>八</b>驅(qū)全新上線

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    提高機(jī)器學(xué)習(xí)模型效果與性能的過(guò)程。 而我對(duì)特征工程的理解就是從一堆數(shù)據(jù)里找出能表示這堆數(shù)據(jù)的最小數(shù)據(jù)
    發(fā)表于 08-14 18:00

    米思米直線電機(jī)模組的八大核心優(yōu)勢(shì),你知道嗎?

    米思米直線電機(jī)模組憑借其價(jià)格親民、高精度、高速運(yùn)行、低噪音、長(zhǎng)壽命、多動(dòng)子配置、選型便捷以及品類(lèi)豐富等八大核心優(yōu)勢(shì),在自動(dòng)化與精密制造領(lǐng)域展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力和廣闊的應(yīng)用前景。
    的頭像 發(fā)表于 07-25 10:57 ?962次閱讀
    米思米直線電機(jī)模組的<b class='flag-5'>八大</b>核心優(yōu)勢(shì),你知道嗎?