一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個在GitHub上一個開源的鑒黃圖像數(shù)據(jù)集

電子工程師 ? 來源:lq ? 2019-02-18 09:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前方高能預警,非戰(zhàn)斗人士請火速撤離……

今天給大家介紹一個在 GitHub 上一個開源的鑒黃圖像數(shù)據(jù)集,它擁有 158萬的數(shù)據(jù)量,叫做 NSFW data source URLs,目前該項目已收獲 918 star 了。

項目地址:

https://github.com/EBazarov/nsfw_data_source_urls

在 raw_data 文件夾里,可以找到不同的 .txt 格式的文檔,每個文檔都含有一組 URL,以下是關(guān)于該數(shù)據(jù)集的一些統(tǒng)計信息:

159個 不同的類別

158.9331 萬個 URL

下載并清洗后大約有 500GB,或者說有 130 萬張 NSFW 圖像

以下為項目中圖片截圖示例:

注意事項:

1. 建議下載后清洗下數(shù)據(jù)集,例如:

刪除重復圖片

移動被禁止/刪除掉的圖片(它們有一個特殊的圖像占位符)

找出損壞的數(shù)據(jù)并將其刪除

2. 注意噪聲,一些資源提供了 NSFW 和中性圖像的高度混合數(shù)據(jù)。

3. 該庫還可以幫助檢索 NSFW 圖像,針對中性圖像沒有專用的 URL。

值得一提的是,在該項目之前還有一個類似的開源項目 nsfw_data_scrapper,里面有 22 萬張圖像,同樣也可以用來檢測或訓練鑒黃系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25428
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    483

    瀏覽量

    17654

原文標題:上班時間請勿打開,158萬張鑒黃圖片數(shù)據(jù)集來嘍~

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微軟開源GitHub Copilot Chat,AI編程迎來新突破

    GitHub Copilot + vscode的組合我已經(jīng)用了很久,我的代碼開發(fā)效率完全提升了level。幫我代碼提示,代碼不全,注釋理解生成代碼等等,這些我是我經(jīng)常用到的功能。
    的頭像 發(fā)表于 07-02 09:34 ?125次閱讀
    微軟<b class='flag-5'>開源</b><b class='flag-5'>GitHub</b> Copilot Chat,AI編程迎來新突破

    NVIDIA推出開源物理AI數(shù)據(jù)

    標準化合成數(shù)據(jù)的初始版本預計將成為世界上最大的此類數(shù)據(jù),目前已作為開源版本提供給機器人開發(fā)人員。
    的頭像 發(fā)表于 03-24 17:52 ?611次閱讀

    開源項目!Open Echo:開源的聲納項目

    連接器。 我水中測試了幾次 KOGGER BASIC 側(cè)掃儀,分辨率和范圍都非常不錯。(不過,我還需要做更多的測試,并編寫使用陀螺儀數(shù)據(jù)的軟件,使其成為掃描側(cè)掃聲納。 最
    發(fā)表于 03-20 13:37

    Open Echo:開源的聲納項目

    “ ?這是還在迭代中的項目。開源的回聲測深儀/水深測量儀/聲吶系統(tǒng),適用于水文測繪及科研用途?;贏rduino平臺開發(fā)并具備良好兼容性? ” ? Open Echo 概覽 作為持續(xù)迭代
    的頭像 發(fā)表于 03-20 11:14 ?943次閱讀
    Open Echo:<b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>開源</b>的聲納項目

    開源啦!??!基于鴻蒙ArkTS封裝的圖表組件《McCharts》,大家快來起共創(chuàng)

    下,后續(xù)有更新我也會同步給大家。這是我第一個開源的項目,做的不好的地方也希望多多指點,我是比較愿意多學習的,也希望大家多學習。大家想交流的可以通過GitHub上的群二維碼加群,也可以私信我,我看到都會回復。
    發(fā)表于 03-15 15:21

    開源項目!教你如何制作開源教育機械臂

    和適應(yīng)性強的機器人平臺。 作為開源項目,構(gòu)建Pedro所需的所有文件都可以Pedro Github頁面上找到: 用于3D打印和定制的
    發(fā)表于 03-10 11:22

    DAC8728多通道輸出數(shù)據(jù),不能保持上一個數(shù)據(jù)嗎?

    比如我給0通道寫數(shù)據(jù)的時候,此時其他通道是置零的嗎?不能保持上一個數(shù)據(jù)嗎? 現(xiàn)在多通道輸出的正弦波都是這個樣子的,請問是不是我分析的這個原因呢?
    發(fā)表于 01-13 07:07

    gitee 與 GitHub 的比較

    全球范圍內(nèi)擁有龐大的用戶基礎(chǔ)。 Gitee(碼云) Gitee,原名為OSChina,是一個中國的代碼托管平臺,由開源中國(OSChina)運營。它提供了類似于GitHub的服務(wù),包括代碼托管、代碼審查、項目管理等。 特點 本地
    的頭像 發(fā)表于 01-06 09:47 ?1475次閱讀

    華為云 Flexus X 實例部署安裝 HivisionIDPhoto 輕量級的 AI 證件照制作算法

    背景 最近有開源項目非常火,就是 HivisionIDPhotos 輕量級的 AI 證件照制作算法
    的頭像 發(fā)表于 12-25 17:08 ?593次閱讀
    華為云 Flexus X 實例部署安裝 HivisionIDPhoto <b class='flag-5'>一</b><b class='flag-5'>個</b>輕量級的 AI 證件照制作算法

    一個月速成python+OpenCV圖像處理

    OpenCV是廣受歡迎且極為流行的計算機視覺庫,它因其強大的功能、靈活性和開源特性而在開發(fā)者和研究者中備受青睞。學習OpenCV主要就是學習里面的計算機視覺算法。要學習這些算法的原理,知道它們
    的頭像 發(fā)表于 11-29 18:27 ?452次閱讀
    <b class='flag-5'>一個</b>月速成python+OpenCV<b class='flag-5'>圖像</b>處理

    基于FPGA的JPEG-LS圖像壓縮器介紹

    現(xiàn)在來看GitHub上面開源的JPEG LS算法的Verilog實現(xiàn)
    的頭像 發(fā)表于 10-15 17:27 ?1209次閱讀
    基于FPGA的JPEG-LS<b class='flag-5'>圖像</b>壓縮器介紹

    OPA690設(shè)計簡單的同向比例放大器,如果負載加上一個50歐姆的電阻,輸出波形即失真了怎么解決?

    您好,我用貴公司OPA690設(shè)計簡單的同向比例放大器,增益為9倍,輸入信號為800mv(峰峰值)、頻率最大為10M。結(jié)果是我放大9倍已經(jīng)實現(xiàn)了,但是如果負載加上一個50歐姆的電阻,輸出波形即失真了,麻煩指點下?為了能夠驅(qū)動
    發(fā)表于 09-23 08:24

    晶振電路旁邊為何要并上一個電阻?

    設(shè)計電路時,通常看到些主控的外部高速晶振并聯(lián)了1MQ的電阻,但是發(fā)現(xiàn)有的電路不用也可以正常工作。般來說,單片機的時鐘電路是使用外部
    的頭像 發(fā)表于 09-12 08:10 ?2825次閱讀
    晶振電路旁邊為何要并<b class='flag-5'>上一個</b>電阻?

    上傳本地項目代碼到github

    概述 GitHub面向開源及私有軟件項目的托管平臺,因為只支持git 作為唯的版本庫格式進行托管,故名
    發(fā)表于 09-11 16:33

    socket對應(yīng)連接嗎

    的接口,允許不同計算機之間建立連接,進行數(shù)據(jù)交換。socket可以看作是兩程序之間的通信端點,由IP地址和端口號唯
    的頭像 發(fā)表于 08-16 10:55 ?917次閱讀