一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ai真的到了嗎,這些業(yè)界的人都看不懂的問題,你怎么看

mK5P_AItists ? 來源:未知 ? 作者:龔婷 ? 2018-03-19 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天,OpenAI在官方博客上丟出了7個研究過程中發(fā)現(xiàn)的未解決問題。

OpenAI希望這些問題能夠成為新手入坑AI的一種有趣而有意義的方式,也幫助從業(yè)者提升技能。

OpenAI版AI界七大未解之謎,現(xiàn)在正式揭曉——

丨1. Slitherin

難度指數(shù):☆☆

實現(xiàn)并解決貪吃蛇的多玩家版克隆作為Gym環(huán)境。

環(huán)境:場地很大,里面有多條蛇,蛇通過吃隨機出現(xiàn)的水果生長,一條蛇在與另一條蛇、自己或墻壁相撞時即死亡,當(dāng)所有的蛇都死了,游戲結(jié)束。

智能體:使用自己選擇的自我對弈的RL算法解決環(huán)境問題。你需要嘗試各種方法克服自我對弈的不穩(wěn)定性。

檢查學(xué)習(xí)行為:智能體是否學(xué)會了適時捕捉食物并避開其他蛇類?是否學(xué)會了攻擊、陷害、或者聯(lián)合起來對付競爭對手?

丨2. 分布式強化學(xué)習(xí)中的參數(shù)平均

難度指數(shù):☆☆☆

這指的是探究參數(shù)平均方案對RL算法中樣本復(fù)雜度和通信量影響。一種簡單的解決方法是平均每個更新的每個worker的梯度,但也可以通過獨立地更新worker、減少平均參數(shù)節(jié)省通信帶寬。

這樣做還有一個好處:在任何給定的時間內(nèi),我們都有不同參數(shù)的智能體,可能出現(xiàn)更好的探測行為。另一種可能是使用EASGD這樣的算法,它可以在每次更新時將參數(shù)部分結(jié)合在一起。

丨3. 通過生成模型完成的不同游戲中的遷移學(xué)習(xí)

難度指數(shù):☆☆☆

這個流程如下:

訓(xùn)練11個Atari游戲的策略。從每個游戲的策略中,生成1萬個軌跡,每個軌跡包含1000步行動。

將一個生成模型(如論文Attention Is All You Need提出的Transformer)與10個游戲產(chǎn)生的軌跡相匹配。

然后,在第11場比賽中微調(diào)上述模型。

你的目標(biāo)是量化10場比賽預(yù)訓(xùn)練時的好處。這個模型需要什么程度的訓(xùn)練才能發(fā)揮作用?當(dāng)?shù)?1個游戲的數(shù)據(jù)量減少10x時,效果的大小如何變化?如果縮小100x呢?

丨4. 線性注意Transformer

難度指數(shù):☆☆☆

Transformer模型使用的是softmax中的軟注意力(soft attention)。如果可以使用線性注意力(linear attention),我們就能將得到的模型用于強化學(xué)習(xí)。

具體來說,在復(fù)雜環(huán)境下使用Transformer部署RL不切實際,但運行一個具有快速權(quán)重(fast weight)的RNN可行。

你的目標(biāo)是接受任何語言建模任務(wù),訓(xùn)練Transformer,然后找到一種在不增加參數(shù)總數(shù)情況下,用具有不同超參數(shù)的線性注意Transformer獲取每個字符/字的相同位元的方法。

先給你潑盆冷水:這可能是無法實現(xiàn)的。再給你一個潛在的有用提示,與使用softmax注意力相比,線性注意轉(zhuǎn)化器很可能需要更高的維度key/value向量,這能在不顯著增加參數(shù)數(shù)量的情況下完成。

丨5. 已學(xué)習(xí)數(shù)據(jù)的擴充

難度指數(shù):☆☆☆

可以用學(xué)習(xí)過的數(shù)據(jù)VAE執(zhí)行“已學(xué)習(xí)數(shù)據(jù)的擴充”。

我們首先可能需要在輸入數(shù)據(jù)上訓(xùn)練一個VAE,然后將每個訓(xùn)練點編碼到一個潛在的空間,之后在其中應(yīng)用一個簡單(如高斯)擾動,最后解碼回到觀察的空間。用這種方法是否能得到更好的泛化,目前還是一個謎題。

這種數(shù)據(jù)擴充的一個潛在優(yōu)勢是,它可能包含視角變換、場景光纖變化等很多非線性

轉(zhuǎn)換。

丨6. 強化學(xué)習(xí)中的正則化

難度指數(shù):☆☆☆☆

這指的是實驗性研究和定性解釋不同正則化方法對RL算法的影響。

在監(jiān)督學(xué)習(xí)中,正則化對于優(yōu)化模型和防止過擬合具有極其重要的意義,其中包含一些效果很贊的方法,如dropout、批標(biāo)準化和L2正則化等。

然而,在策略梯度和Q-learning等強化學(xué)習(xí)算法上,研究人員還沒有找到合適的正則化方法。順便說一下,人們在RL中使用的模型要比在監(jiān)督學(xué)習(xí)中使用的模型小得多,因為大模型表現(xiàn)更差。

丨7. Olympiad Inequality問題的自動解決方案

難度指數(shù):☆☆☆☆☆

Olympiad Inequality問題很容易表達,但解決這個問題往往需要巧妙的手法。

建立一個關(guān)于Olympiad Inequality問題的數(shù)據(jù)集,編寫一個可以解決大部分問題的程序。目前還不清楚機器學(xué)習(xí)在這里是否有用,但你可以用一個學(xué)習(xí)的策略減少分支因素。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279714
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249410

原文標(biāo)題:AI界的七大未解之謎:OpenAI丟出一組AI研究課題

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    所以做出來了嗎

    所以做出來了嗎,求
    發(fā)表于 06-16 01:43

    失去工作不是因為AI,而是因為使用AI的人

    當(dāng)算法能精準預(yù)測消費者需求時,當(dāng)AI生成的文案比人類更懂傳播心理學(xué)時,當(dāng)自動化系統(tǒng)開始取代基礎(chǔ)決策崗位時,真正的危機已悄然降臨—— 不是AI在搶奪的工作,而是那些比你更早掌握AI、更
    的頭像 發(fā)表于 05-13 12:05 ?233次閱讀
    <b class='flag-5'>你</b>失去工作不是因為<b class='flag-5'>AI</b>,而是因為使用<b class='flag-5'>AI</b><b class='flag-5'>的人</b>

    求大師傅分享

    有沒有關(guān)于機械類別學(xué)習(xí)資料啊,剛?cè)胄校F(xiàn)在連螺母螺牙看不懂
    發(fā)表于 04-26 10:17

    STM32H745BIT6單片機怎么看哪個引腳配置哪個內(nèi)核???

    STM32H745BIT6單片機怎么看哪個引腳配置哪個內(nèi)核啊,在數(shù)據(jù)手冊里沒看到
    發(fā)表于 03-13 06:08

    ADS7841的采樣頻率的設(shè)置,是不是通過設(shè)置CS高低電平的時間來計算?

    ADS7946好像是通過DCLK的時間來設(shè)置,有點看不懂,想請教,ADS7841采樣頻率怎么設(shè)置,怎么計算,謝謝您!
    發(fā)表于 02-08 06:57

    電磁兼容的這些問題,考慮到了嗎?(下)

    性?為了確保電子設(shè)備的電磁兼容性符合要求,需進行相關(guān)的測試。這些測試包括傳導(dǎo)和輻射發(fā)射測試、傳導(dǎo)和輻射抗擾度測試等。這些測試需在專業(yè)的電磁兼容實驗室中進行,以確保測試結(jié)
    的頭像 發(fā)表于 01-16 11:39 ?680次閱讀
    電磁兼容的<b class='flag-5'>這些</b>問題,<b class='flag-5'>你</b><b class='flag-5'>都</b>考慮<b class='flag-5'>到了嗎</b>?(下)

    電磁兼容的這些問題,考慮到了嗎?(上)

    導(dǎo)讀隨著電子設(shè)備的廣泛使用,電磁兼容性問題愈發(fā)關(guān)鍵。本文將深入解析開發(fā)生產(chǎn)電子設(shè)備時需關(guān)注的電磁兼容性要點,并結(jié)合案例分析,助你全面了解如何確保電子設(shè)備在復(fù)雜電磁環(huán)境中的穩(wěn)定運行。在電子設(shè)備日益普及的今天,電磁兼容性問題越來越受到人們的關(guān)注。電磁兼容性是指電子設(shè)備在電磁環(huán)境中能正常工作,且不對該環(huán)境中其他設(shè)備產(chǎn)生干擾。在開發(fā)和生產(chǎn)電子設(shè)備時,需考慮哪些電磁兼
    的頭像 發(fā)表于 01-14 11:39 ?734次閱讀
    電磁兼容的<b class='flag-5'>這些</b>問題,<b class='flag-5'>你</b><b class='flag-5'>都</b>考慮<b class='flag-5'>到了嗎</b>?(上)

    芯片行業(yè),怎么看?

    剛過去的2024年,半導(dǎo)體行業(yè)喜憂參半。但恭喜大家,我們順利跨入了2025年?;氐饺ツ甑陌雽?dǎo)體行業(yè),喜的是,在AI的推動下,類似英偉達、博通、Marvell等大廠能夠憑借在數(shù)據(jù)中心相關(guān)芯片上的優(yōu)勢
    的頭像 發(fā)表于 01-03 10:03 ?644次閱讀
    芯片行業(yè),<b class='flag-5'>怎么看</b>?

    快恢復(fù)二極管選型參數(shù)怎么看?常用型號有哪些?

    快恢復(fù)二極管選型參數(shù)怎么看?常用型號有哪些?
    的頭像 發(fā)表于 11-14 17:30 ?1976次閱讀
    快恢復(fù)二極管選型參數(shù)<b class='flag-5'>怎么看</b>?常用型號有哪些?

    TPA3112用tina仿真后面的揚聲器怎么看發(fā)出的聲音怎么樣?

    TPA3112用tina仿真后面的揚聲器怎么看發(fā)出的聲音怎么樣啊
    發(fā)表于 11-04 07:29

    求電氣圖講解,剛接觸電氣圖,看不懂圖紙

    電氣圖講解,剛接觸電氣圖,看不懂圖紙,有無老師能簡要講解一下各部分
    發(fā)表于 10-13 21:33

    請問AD657的共模和差模輸入電容怎么看?

    如題,AD657的共模和差模輸入電容怎么看??輸入阻抗是10的12次方歐姆, 輸入電容是5.2pf??
    發(fā)表于 09-06 07:07

    防雷器件有哪些?防雷器等級型號怎么看

    防雷器件有哪些?防雷器等級型號怎么看
    的頭像 發(fā)表于 07-31 15:05 ?2760次閱讀

    三星貼片電容的批次號怎么看?

    三星貼片電容的批次號怎么看?在這個問題之前我們先普及一下,怎么分辨三星貼片電容是不是正品?
    的頭像 發(fā)表于 07-31 14:10 ?799次閱讀
    三星貼片電容的批次號<b class='flag-5'>怎么看</b>?

    可能看不懂的硬核傳感器知識:MEMS芯片制造工藝流程

    ?? 本文整理自公眾號芯生活SEMI Businessweek中關(guān)于MEMS制造工藝的多篇系列內(nèi)容,全面、專業(yè)地介紹了MEMS芯片制造中的常用工藝情況,因水平所限,部分介紹或有缺漏,可在本文留言討論。 ? 作為現(xiàn)代傳感器重要的制造技術(shù),MEMS工藝深刻地影響了現(xiàn)今傳感器產(chǎn)業(yè)的發(fā)展??梢哉f,MEMS的工藝技術(shù)都是從集成電路(IC)行業(yè)借鑒而來的,特別在MEMS剛興起時,傳統(tǒng)IC行業(yè)的工藝設(shè)備和技術(shù)為MEMS制造提供了巨大的基礎(chǔ)設(shè)施。比如,MEMS中使用的光刻設(shè)備,可能是為
    的頭像 發(fā)表于 07-21 16:50 ?2759次閱讀
    <b class='flag-5'>你</b>可能<b class='flag-5'>看不懂</b>的硬核傳感器知識:MEMS芯片制造工藝流程