一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

向來提倡open的谷歌,現(xiàn)在也玩兒“自閉”?

DPVg_AI_era ? 來源:lq ? 2019-01-20 08:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌AI又成了話題。Reddit網(wǎng)友找到了谷歌AI一個(gè)名叫Conceptual Captions的數(shù)據(jù)集,發(fā)現(xiàn)該數(shù)據(jù)集并不完善,于是乎聯(lián)系谷歌AI相關(guān)人員,卻慘遭三連拒。

向來提倡open的谷歌,現(xiàn)在也玩兒“自閉”?

昨天谷歌AI大佬Jeff Dean剛剛發(fā)表長文總結(jié)了2018年的主要研究成果,其中包括“開源軟件和數(shù)據(jù)集”:

發(fā)布開源軟件和創(chuàng)建新的公共數(shù)據(jù)集是我們?yōu)檠芯亢蛙浖こ躺鐓^(qū)做出貢獻(xiàn)的兩種主要方式。

然而細(xì)心的Reddit網(wǎng)友卻發(fā)現(xiàn),谷歌AI并沒有那么“開源”,反而還拒絕共享數(shù)據(jù):

事情是這樣的。

這位網(wǎng)友發(fā)現(xiàn)了谷歌AI一個(gè)叫Conceptual Captions數(shù)據(jù)集相關(guān)的比賽,以及描述這個(gè)數(shù)據(jù)集的論文(ACL 2018):

論文地址:

http://aclweb.org/anthology/P18-1238

在GitHub中對此數(shù)據(jù)集的描述為:一種包含330萬張圖像的大規(guī)模圖像數(shù)據(jù)集,專門用于機(jī)器學(xué)習(xí)圖像字幕系統(tǒng)的訓(xùn)練和評估。

GitHub地址:

https://github.com/google-research-datasets/conceptual-captions

然而,當(dāng)這位網(wǎng)友躍躍欲試想要拿這個(gè)數(shù)據(jù)集操練一番時(shí)卻發(fā)現(xiàn)了一些問題:這個(gè)數(shù)據(jù)集全部圖像都是托管的,一些鏈接現(xiàn)在已經(jīng)失效。

于是,這位網(wǎng)友開始試圖聯(lián)系谷歌AI相關(guān)人員。

結(jié)果,真可謂是大跌眼鏡。

慘遭三連拒,熱心研究者被潑冷水

第一拒:拒絕分享預(yù)訓(xùn)練模型

這就使得基準(zhǔn)測試和論文里的結(jié)果數(shù)字變得非常難以復(fù)現(xiàn)。畢竟,不是每個(gè)人都有1k的TPU。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/3

問:哪里可以找到基于Conceptual Captions數(shù)據(jù)集的預(yù)訓(xùn)練模型(RNN-,Transformer-based)?

答:預(yù)訓(xùn)練模型沒有發(fā)布。

第二拒:拒絕分享與每個(gè)圖像關(guān)聯(lián)的Alt-text

諷刺的是,這篇論文標(biāo)題是“Conceptual Captions: A Cleaned, Hypernymed, Image Alt-text Dataset For Automatic Image Captioning”。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/6

問:是否會(huì)發(fā)布與每個(gè)圖像關(guān)聯(lián)的Alt-text?用于生成字幕的代碼也會(huì)公開嗎?

答:沒有發(fā)布Alt-text或代碼的計(jì)劃。

第三拒:拒絕分享圖像/鏡像鏈接

這位網(wǎng)友表示:雖然我同意存在法律問題,但數(shù)據(jù)集中缺少數(shù)百張圖像,其他研究人員要想比較模型變得超級困難。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/1

問:您能提供從tsv文件通過url下載圖像的示例代碼嗎?Python的urllib無法下載某些url (IOError: [Errno socket error] [Errno 110] Connection timed out)。但是我可以在瀏覽器中看到這些圖像。

答:謝謝你的關(guān)注!不幸的是,由于版權(quán)/法律問題,我們無法提供通過url從tsv文件下載圖像的代碼。

谷歌AI“自閉”拒共享,引網(wǎng)友熱議

這位熱心網(wǎng)友在慘遭三連拒后表示對這樣的事情非常痛心:

一篇數(shù)據(jù)集論文對于復(fù)現(xiàn)結(jié)果非常重要,如果存在阻礙數(shù)據(jù)集共享的法律問題,那么發(fā)表私人數(shù)據(jù)集論文就好了(有些領(lǐng)域不公開Alt-text),但基于一個(gè)不公開預(yù)訓(xùn)練模型、不完全共享的數(shù)據(jù)集舉辦挑戰(zhàn)賽,我認(rèn)為這就不太酷了。

而后,其它網(wǎng)友們也炸鍋了。

熱心網(wǎng)友1:_michaelx99

Deepmind的一些論文也是這樣,僅僅根據(jù)他們發(fā)表的論文,完全不可能把結(jié)果復(fù)現(xiàn)出來。我花了一段時(shí)間才意識(shí)到Arxiv或他們網(wǎng)站上的一篇“論文”并不是真正的出版物,因此它的主要目標(biāo)是展示公司已經(jīng)開發(fā)了某種能力。這與其他人能夠證實(shí)或否認(rèn)他們在科學(xué)過程中所做的事情關(guān)系不大。我并不是說大公司在網(wǎng)上發(fā)布的所有論文都是這樣,但正如你剛剛發(fā)現(xiàn)的,其中一些論文確實(shí)如此。

熱心網(wǎng)友2:duckbill_principate

據(jù)我所知,四分之一的ML論文本質(zhì)上是美化的廣告。

熱心網(wǎng)友3:GoAwayStupidAI

可重復(fù)性是科學(xué)的標(biāo)志。沒有這些數(shù)據(jù),這個(gè)結(jié)果是不可復(fù)制的,所以科學(xué)會(huì)很糟糕。

熱心網(wǎng)友4:Silver5005

這是ML論文最大的問題。我一直在嘗試實(shí)現(xiàn)一個(gè)股票預(yù)測的LSTM,你可以找到數(shù)百篇論文都在做同樣的概念。但它們都沒有數(shù)據(jù)集,也不會(huì)談?wù)撍鼈內(nèi)绾吻謇砘驑?biāo)準(zhǔn)化它們的數(shù)據(jù)。

熱心網(wǎng)友5:duckbill_principate

人們不分享他們的模型、代碼或數(shù)據(jù)集,這本身并不困擾我。令我困擾的是,這種情況發(fā)生了,而這些論文仍然被接受。這是同行評審過程的絕對失敗,它的責(zé)任完全落在審查員(和我們)的肩上。這些論文是在信任的基礎(chǔ)上被接受的,在某些情況下甚至是權(quán)威(我們都知道,盡管存在著雙盲的本質(zhì),但不難推斷出某些論文可能來自哪個(gè)群體),這是絕對不可接受的。

這更接近于廣告而不是科學(xué)。

熱心網(wǎng)友6:epic

我不知道為什么有這么多谷歌的辯護(hù)者。這對科學(xué)和機(jī)器學(xué)習(xí)都不利。是的,我們都明白為什么,但這仍然很糟糕。特別是像這樣的論文,如果不能從數(shù)據(jù)中分離出來的話,再現(xiàn)性是非常困難的。有機(jī)會(huì)的組織和個(gè)人應(yīng)該以一個(gè)好榜樣來領(lǐng)導(dǎo)這個(gè)領(lǐng)域,而不是反過來。

對此,你怎么看?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108170
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35165

    瀏覽量

    280085
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25457

原文標(biāo)題:谷歌AI遭猛懟!發(fā)布數(shù)據(jù)集論文和挑戰(zhàn)賽,卻拒絕公開數(shù)據(jù)集

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    WPP Media發(fā)布業(yè)內(nèi)首個(gè)「大營銷模型」Open Intelligence

    全新數(shù)據(jù)解決方案和開創(chuàng)性「大營銷模型」,通過預(yù)測性智能提升營銷表現(xiàn),驅(qū)動(dòng)業(yè)務(wù)增長 上海?2025年6月4日?/美通社/ --?今天,WPP Media正式推出 Open Intelligence
    的頭像 發(fā)表于 06-04 16:12 ?263次閱讀
    WPP Media發(fā)布業(yè)內(nèi)首個(gè)「大營銷模型」<b class='flag-5'>Open</b> Intelligence

    谷歌地圖GPS定位

    谷歌地圖GPS定位:精準(zhǔn)導(dǎo)航背后的技術(shù)解析 谷歌地圖作為全球最受歡迎的地圖服務(wù)之一,其精準(zhǔn)的GPS定位功能為用戶提供了極大便利。本文將深入探討谷歌地圖如何利用GPS技術(shù),實(shí)現(xiàn)高精度定位,并帶來革命性
    的頭像 發(fā)表于 05-29 16:54 ?320次閱讀

    Open Echo:一個(gè)開源的聲納項(xiàng)目

    “ ?這是一個(gè)還在迭代中的項(xiàng)目。開源的回聲測深儀/水深測量儀/聲吶系統(tǒng),適用于水文測繪及科研用途?;贏rduino平臺(tái)開發(fā)并具備良好兼容性? ” ? Open Echo 概覽 作為持續(xù)迭代
    的頭像 發(fā)表于 03-20 11:14 ?1007次閱讀
    <b class='flag-5'>Open</b> Echo:一個(gè)開源的聲納項(xiàng)目

    MWC 2025亮點(diǎn):中國移動(dòng)、阿里云和中興通訊榮獲GSMA GLOMO “Open Gateway挑戰(zhàn)獎(jiǎng)”

    在世界移動(dòng)通信大會(huì)(MWC25巴塞羅那)期間,由中國移動(dòng)、阿里云和中興通訊聯(lián)合打造的AaaS Open Gateway能力開放解決方案榮獲GSMA全球移動(dòng)大獎(jiǎng)(GLOMO)“Open Gateway
    的頭像 發(fā)表于 03-06 11:33 ?1137次閱讀
    MWC 2025亮點(diǎn):中國移動(dòng)、阿里云和中興通訊榮獲GSMA GLOMO “<b class='flag-5'>Open</b> Gateway挑戰(zhàn)獎(jiǎng)”

    Open AI 將在德國投資

    美國人工智能軟件巨頭 Open AI 將在慕尼黑設(shè)立其首個(gè)德國子公司 柏林2025年2月8日 ?/美通社/ --?作為 Chat GPT 的創(chuàng)造者而聞名全球的 Open AI 公司表示,新辦事處將在
    的頭像 發(fā)表于 02-08 12:27 ?368次閱讀

    谷歌公司被立案調(diào)查 谷歌股價(jià)暴跌 谷歌母公司Alphabet跌8%

    據(jù)國家市場監(jiān)督管理總局消息顯示,谷歌公司因涉嫌違反《中華人民共和國反壟斷法》,已被該局依法開展立案調(diào)查。而且谷歌公司在全球多個(gè)國家均面臨著反壟斷的嚴(yán)峻挑戰(zhàn)。其中,美國司法部更是對谷歌提出了分拆的請求
    的頭像 發(fā)表于 02-06 16:23 ?1539次閱讀

    谷歌2.5億美元收購HTC XR業(yè)務(wù)

    近日,HTC與谷歌共同宣布了一項(xiàng)重要協(xié)議。根據(jù)協(xié)議內(nèi)容,谷歌將向HTC支付2.5億美元的交易金額,并吸納部分HTC的XR研發(fā)團(tuán)隊(duì)加入其麾下。此次交易不僅標(biāo)志著谷歌在XR領(lǐng)域的進(jìn)一步布局,
    的頭像 發(fā)表于 01-24 13:51 ?623次閱讀

    Open-E JovianDSS Up31增強(qiáng)的功能和新特性

    我們非常高興地宣布發(fā)布 Open-E JovianDSS Up31 版本,該版本包含多項(xiàng)強(qiáng)大的增強(qiáng)功能和新特性,旨在提高數(shù)據(jù)存儲(chǔ)基礎(chǔ)架構(gòu)的性能、安全性和集成能力。以下是最新更新的詳細(xì)概述
    的頭像 發(fā)表于 01-24 11:20 ?439次閱讀

    Open開發(fā)新方法!Lua語言快速學(xué)習(xí)

    很多朋友都問我不會(huì)Lua又想open開發(fā),怎么辦?我的答復(fù)是Lua先學(xué)起來,再看LuatOS具體應(yīng)用示例,上手極快,感興趣的朋友們,可以參照本文一起學(xué)。
    的頭像 發(fā)表于 12-11 09:31 ?542次閱讀
    <b class='flag-5'>Open</b>開發(fā)新方法!Lua語言快速學(xué)習(xí)

    不會(huì)Lua又想Open開發(fā),怎么辦?

    本次我把收藏已久的LuatOS具體應(yīng)用示例特分享個(gè)大家,希望不會(huì)Lua又想Open開發(fā)的朋友有收獲。
    的頭像 發(fā)表于 12-09 14:43 ?505次閱讀
    不會(huì)Lua又想<b class='flag-5'>Open</b>開發(fā),怎么辦?

    日本KDDI與三星合作,大規(guī)模部署Open RAN

    近日,日本知名移動(dòng)通信運(yùn)營商KDDI宣布與三星攜手,后者將作為核心供應(yīng)商,助力KDDI在日本推進(jìn)基于4G/5G O-RAN標(biāo)準(zhǔn)的Open RAN部署,提供vRAN解決方案。雙方計(jì)劃在未來幾年內(nèi)不斷擴(kuò)大Open RAN的覆蓋范圍。
    的頭像 發(fā)表于 10-16 15:43 ?1084次閱讀

    TAS5411-Q1 open load不管接不接喇叭都是open,重啟不變,為什么?

    TAS5411應(yīng)用有個(gè)問題煩請問一下,Open Load和shorted load兩個(gè)狀態(tài) 不更新,open load不管接不接喇叭都是open,重啟不變,不知道需不需要經(jīng)行其他設(shè)
    發(fā)表于 09-29 06:56

    DP83TC811:Open Alliance規(guī)范合規(guī)性測試所用的配置

    電子發(fā)燒友網(wǎng)站提供《DP83TC811:Open Alliance規(guī)范合規(guī)性測試所用的配置.pdf》資料免費(fèi)下載
    發(fā)表于 08-27 09:50 ?0次下載
    DP83TC811:<b class='flag-5'>Open</b> Alliance規(guī)范合規(guī)性測試所用的配置

    求助,關(guān)于open-loop反饋參數(shù)beta問題求解

    大家好。向大家請教一個(gè)反饋參數(shù)beta的問題。 在Ti Precison Lab 放大器的1333節(jié)關(guān)于穩(wěn)定性分析中,使用open loop配置確定Aol、beta和loop gain,如圖所示
    發(fā)表于 08-14 06:24

    谷歌獲Character.AI大模型技術(shù)授權(quán),創(chuàng)始人重歸谷歌懷抱

    8月5日最新資訊,創(chuàng)新企業(yè)Character.AI在上周五正式宣布,他們已經(jīng)與科技巨頭谷歌的母公司Alphabet達(dá)成了一項(xiàng)重要合作,非獨(dú)家授權(quán)谷歌使用其先進(jìn)的大型語言模型技術(shù)。此次合作不僅標(biāo)志著雙方在人工智能領(lǐng)域的深度合作,
    的頭像 發(fā)表于 08-05 14:35 ?761次閱讀