一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

8種適用于不同機(jī)器學(xué)習(xí)問題的常用數(shù)據(jù)集

電子工程師 ? 來源:lq ? 2019-01-29 10:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

要找到一定特定的數(shù)據(jù)集可以解決各種機(jī)器學(xué)習(xí)問題,是一件很難的事情。越來越多企業(yè)或研究機(jī)構(gòu)將自己的數(shù)據(jù)集公開,已經(jīng)成為全球的趨勢,這也將有助于大家進(jìn)行更多研究。

近期,亞馬遜高級技術(shù)顧問 Will Badr 分享了 8 種適用于不同機(jī)器學(xué)習(xí)問題的常用數(shù)據(jù)集,并給出相應(yīng)的描述,用法示例以及在某些情況下用于解決與該數(shù)據(jù)集相關(guān)的機(jī)器學(xué)習(xí)問題的代碼。

1、Kaggle 數(shù)據(jù)集

鏈接:

https://www.kaggle.com/datasets

這是當(dāng)前數(shù)據(jù)科學(xué)領(lǐng)域最熱門,也是最受歡迎的數(shù)據(jù)集之一。在 Kaggle 中,每個(gè)數(shù)據(jù)集都是對應(yīng)一項(xiàng)比賽,參賽者可以在這個(gè)小社區(qū)里討論數(shù)據(jù),查找一些公共代碼或在 kernel 中創(chuàng)建自己的項(xiàng)目。Kaggle 中包含大量不同類型,不同大小以及多種不同格式的真實(shí)數(shù)據(jù)集。此外,參賽者還可以看到與每個(gè)數(shù)據(jù)集關(guān)聯(lián)的 kernel,其中許多數(shù)據(jù)科學(xué)家會上傳自己的 notebooks 來分析數(shù)據(jù)集,還能找到解決特定數(shù)據(jù)集問題的算法實(shí)現(xiàn)。

2、Amazon 數(shù)據(jù)集

鏈接:

https://registry.opendata.aws/

Amazon 數(shù)據(jù)庫包含不同領(lǐng)域的多種數(shù)據(jù)集,如公共交通,生態(tài)資源,衛(wèi)星圖像等。在數(shù)據(jù)集官網(wǎng)還有一個(gè)搜索框,可以幫助使用者快速找到所需的數(shù)據(jù)集。每個(gè)數(shù)據(jù)集包含相應(yīng)的數(shù)據(jù)集描述和使用示例,數(shù)據(jù)量非常豐富且易于使用。

此外,依托于 Amazon Web Services (AWS) 平臺,如 Amazon S3,這些儲存在云端的數(shù)據(jù)集都有高度的可擴(kuò)展性服務(wù),這對于那些使用 AWS 進(jìn)行機(jī)器學(xué)習(xí)開發(fā)和實(shí)驗(yàn)的用戶來說,將非常方便。因?yàn)樵谠贫耍瑪?shù)據(jù)集的傳輸將非???。

3、UCI 機(jī)器學(xué)習(xí)數(shù)據(jù)集

鏈接:

https://archive.ics.uci.edu/ml/datasets.html

這是由加州大學(xué)歐文分校(UCI)信息與計(jì)算機(jī)科學(xué)學(xué)院的研究者創(chuàng)建的一個(gè)包含 100 多種不同類型數(shù)據(jù)集的大型數(shù)據(jù)庫。該數(shù)據(jù)庫根據(jù)不同的機(jī)器學(xué)習(xí)問題來對數(shù)據(jù)集進(jìn)行分類,在這里,用戶可以找到單變量、多變量時(shí)間序列數(shù)據(jù)集,分類、回歸、推薦系統(tǒng)數(shù)據(jù)集等。此外,該數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù)集已經(jīng)經(jīng)過數(shù)據(jù)清洗過程,是可以直接為用戶使用。

4、Google 數(shù)據(jù)集所搜引擎

鏈接:

https://toolbox.google.com/datasetsearch

2018 年 9 月,Google 推出了這項(xiàng)服務(wù),它是一個(gè)可以按名稱搜索相應(yīng)數(shù)據(jù)集的工具箱,其目標(biāo)是集成數(shù)萬個(gè)不同的數(shù)據(jù)集,并對用戶開放使用。

5、Miscrosoft 數(shù)據(jù)集

鏈接:

https://msropendata.com/

2018 年 7 月,Miscrosoft 聯(lián)合其外部的研究社區(qū)聲明發(fā)布 Miscrosoft Research Open Data 服務(wù)。這項(xiàng)存儲在云端的數(shù)據(jù)庫,包含了一系列在已發(fā)表研究中使用過的數(shù)據(jù)集,致力于促進(jìn)全球研究社區(qū)的研究合作。

6、Awesome 公開數(shù)據(jù)集

鏈接:

https://github.com/awesomedata/awesome-public-datasets

Awesome 是一個(gè)按不同主題分類的數(shù)據(jù)庫,其中涵蓋了如生物學(xué),經(jīng)濟(jì)學(xué),教育等不同領(lǐng)域的重要數(shù)據(jù)集,其中列出的大多數(shù)數(shù)據(jù)集都可供用戶免費(fèi)試用,但在使用任何數(shù)據(jù)集之前,用戶需要通過認(rèn)證已獲得使用許可。

7、government 數(shù)據(jù)集

在這里你可以找到那些與政府相關(guān)的數(shù)據(jù)集。為顯示政府工作的透明度,許多國家機(jī)構(gòu)公開發(fā)布了其國家在一些領(lǐng)域的數(shù)據(jù)集,如下示例:

EU Open Data:歐洲政府?dāng)?shù)據(jù)集

鏈接:

https://data.europa.eu/euodp/data/dataset

US Gov Data:美國政府?dāng)?shù)據(jù)(非政治問題上的數(shù)據(jù)集,但自特朗普政府上調(diào)以來,該網(wǎng)站數(shù)據(jù)集暫時(shí)無法使用)

鏈接:

https://www.data.gov/

New Zealand’s Government Dataset:新西蘭政府?dāng)?shù)據(jù)集

鏈接:

https://catalogue.data.govt.nz/dataset

Indian Government Dataset:印度政府?dāng)?shù)據(jù)集

鏈接:

https://data.gov.in/

8、Computer Vision 領(lǐng)域數(shù)據(jù)集

鏈接:

https://www.visualdata.io/

如果是從事圖像處理、計(jì)算機(jī)視覺深度學(xué)習(xí)領(lǐng)域的工作,那么該數(shù)據(jù)集會是最好的實(shí)驗(yàn)資源。Visual Data 包含一些可用于構(gòu)建計(jì)算機(jī)視覺(CV)模型的優(yōu)秀數(shù)據(jù)集。使用者可以通過某個(gè)特定的 CV 任務(wù)來查找相應(yīng)的數(shù)據(jù)集,如語義分割(semantic segmentation)、圖像生成標(biāo)題(image captioning)、圖像生成(image generation),甚至是無人駕駛解決方案所需的數(shù)據(jù)集。

原文鏈接:

https://towardsdatascience.com/top-sources-for-machine-learning-datasets-bb6d0dc3378b

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:秘籍 | 機(jī)器學(xué)習(xí)數(shù)據(jù)集網(wǎng)址大全

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    用于無線 LAN 的 2.4 GHz 高效前端和適用于藍(lán)牙?應(yīng)用的端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于無線 LAN 的 2.4 GHz 高效前端和適用于藍(lán)牙?應(yīng)用的端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有用于無線 LAN 的 2.4 GHz 高效前端和
    發(fā)表于 07-01 18:32
    <b class='flag-5'>用于</b>無線 LAN 的 2.4 GHz 高效前端和<b class='flag-5'>適用于</b>藍(lán)牙?應(yīng)用的端口 skyworksinc

    適用于 WLAN 和藍(lán)牙?應(yīng)用的 2.4 GHz 高效前端 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()適用于 WLAN 和藍(lán)牙?應(yīng)用的 2.4 GHz 高效前端相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有適用于 WLAN 和藍(lán)牙?應(yīng)用的 2.4 GHz 高效前端的引腳圖、接線圖、封裝手冊
    發(fā)表于 06-20 18:30
    <b class='flag-5'>適用于</b> WLAN 和藍(lán)牙?應(yīng)用的 2.4 GHz 高效前端 skyworksinc

    2.4 GHz、256 QAM 前端模塊,用于 WLAN/ 和端口,適用于藍(lán)牙?應(yīng)用 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()2.4 GHz、256 QAM 前端模塊,用于 WLAN/ 和端口,適用于藍(lán)牙?應(yīng)用相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有2.4 GHz、256 QAM 前端模塊,用于
    發(fā)表于 06-18 18:30
    2.4 GHz、256 QAM 前端模塊,<b class='flag-5'>用于</b> WLAN/ 和端口,<b class='flag-5'>適用于</b>藍(lán)牙?應(yīng)用 skyworksinc

    用于 WLAN/ 的 2.4 GHz、256 QAM 前端模塊和適用于藍(lán)牙?應(yīng)用的端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 WLAN/ 的 2.4 GHz、256 QAM 前端模塊和適用于藍(lán)牙?應(yīng)用的端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有用于 WLAN/ 的 2.4 GHz、256
    發(fā)表于 06-18 18:30
    <b class='flag-5'>用于</b> WLAN/ 的 2.4 GHz、256 QAM 前端模塊和<b class='flag-5'>適用于</b>藍(lán)牙?應(yīng)用的端口 skyworksinc

    適用于PIC MCU的MPLAB XC8 C編譯器用戶指南

    電子發(fā)燒友網(wǎng)站提供《適用于PIC MCU的MPLAB XC8 C編譯器用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-22 16:45 ?0次下載
    <b class='flag-5'>適用于</b>PIC MCU的MPLAB XC<b class='flag-5'>8</b> C編譯器用戶指南

    適用于TI Sitara?平臺的WL1837MODCOM8I WLAN MIMO和Bluetooth?模塊評估板

    電子發(fā)燒友網(wǎng)站提供《適用于TI Sitara?平臺的WL1837MODCOM8I WLAN MIMO和Bluetooth?模塊評估板.pdf》資料免費(fèi)下載
    發(fā)表于 12-05 14:08 ?0次下載
    <b class='flag-5'>適用于</b>TI Sitara?平臺的WL1837MODCOM<b class='flag-5'>8</b>I WLAN MIMO和Bluetooth?模塊評估板

    適用于機(jī)器視覺應(yīng)用的智能機(jī)器視覺控制平臺

    看51camera的合作伙伴Neousys宸曜科技的Nuvis系列工控機(jī)。Nuvis系列機(jī)器視覺控制平臺是適用于現(xiàn)如今機(jī)器視覺市場的高整合機(jī)器視覺解決方案。Nuvis系列
    的頭像 發(fā)表于 11-23 01:08 ?531次閱讀
    <b class='flag-5'>適用于</b><b class='flag-5'>機(jī)器</b>視覺應(yīng)用的智能<b class='flag-5'>機(jī)器</b>視覺控制平臺

    RISC-V的指令位寬的幾點(diǎn)學(xué)習(xí)心得

    ,實(shí)際上,RISC-V指令的位寬具有更大的靈活性。 RISC-V指令的位寬多樣性 RISC-V是一基于精簡指令(RISC)的開放式指令
    發(fā)表于 10-31 22:05

    光電式傳感器有幾種類型各適用于哪些檢測控制場合

    (Photoelectric Switches) 類型: 漫反射型 鏡反射型 對射型 適用場合: 漫反射型適用于檢測物體的有無,常用于包裝機(jī)械、自動化流水線等。 鏡反射型適用于檢測物體
    的頭像 發(fā)表于 09-23 09:18 ?3396次閱讀

    常用的k8s容器網(wǎng)絡(luò)模式有哪些?

    ,每種模式都有其特點(diǎn)和適用場景。Bridge模式適用于簡單的容器通信場景;Host模式適用于需要高度集成和性能優(yōu)化的場景;Overlay模式和Flannel模式適用于跨節(jié)點(diǎn)的容器通信場
    的頭像 發(fā)表于 09-19 11:29 ?626次閱讀

    選擇適用于汽車應(yīng)用的基準(zhǔn)電壓

    電子發(fā)燒友網(wǎng)站提供《選擇適用于汽車應(yīng)用的基準(zhǔn)電壓.pdf》資料免費(fèi)下載
    發(fā)表于 09-02 11:26 ?0次下載
    選擇<b class='flag-5'>適用于</b>汽車應(yīng)用的基準(zhǔn)電壓

    適用于3D機(jī)器視覺的高度可擴(kuò)展的TI DLP技術(shù)

    電子發(fā)燒友網(wǎng)站提供《適用于3D機(jī)器視覺的高度可擴(kuò)展的TI DLP技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 08-23 09:57 ?0次下載
    <b class='flag-5'>適用于</b>3D<b class='flag-5'>機(jī)器</b>視覺的高度可擴(kuò)展的TI DLP技術(shù)

    適用于類人機(jī)器人的TI DLP? Pico?技術(shù)

    電子發(fā)燒友網(wǎng)站提供《適用于類人機(jī)器人的TI DLP? Pico?技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 08-23 09:26 ?0次下載
    <b class='flag-5'>適用于</b>類人<b class='flag-5'>機(jī)器</b>人的TI DLP? Pico?技術(shù)

    供應(yīng) 英芯IP2348,適用于掃地機(jī)器人解決方案的鋰電池同步降壓充電芯片

    電壓,能夠同步降壓模式獨(dú)立充電1~6節(jié)串聯(lián)鋰電池,確保機(jī)器人在各種工作場景下都能穩(wěn)定運(yùn)行。IP2348不僅適用于掃地機(jī)器人,更是電動工具、對講機(jī)等設(shè)備領(lǐng)域的理想選擇。其混合動力升壓模式可輸出4.5V
    發(fā)表于 07-24 14:47

    如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測試

    理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測試,是掌握機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 15:45 ?6791次閱讀