英偉達(dá)待發(fā)布最新研究成果,通過現(xiàn)有數(shù)據(jù)集模擬新圖像,以期突破人工智能訓(xùn)練的潛力。
英偉達(dá)展示了其最新的人工智能模型,該模型使用了一個(gè)小數(shù)據(jù)集生成式對(duì)抗網(wǎng)絡(luò)通常使用的數(shù)據(jù)集的一小部分,據(jù)了解,這些數(shù)據(jù)集的對(duì)象是來自大都會(huì)藝術(shù)博物館的藝術(shù)品。
從數(shù)據(jù)集中,英偉達(dá)開發(fā)的人工智能能夠創(chuàng)建新的圖像,復(fù)制原始藝術(shù)家的作品,這些圖像可以用來幫助進(jìn)一步升級(jí)人工智能模型。
人工智能通過應(yīng)用一種突破性的神經(jīng)網(wǎng)絡(luò)訓(xùn)練技術(shù)取得了這一重要的成就,這種技術(shù)類似于流行的NVIDIA StyleGAN2模型。
該技術(shù)被稱為自適應(yīng)識(shí)別器增強(qiáng)技術(shù)(ADA), 英偉達(dá)稱該技術(shù)可以將所需的訓(xùn)練圖像數(shù)量減少10-20倍,同時(shí)仍能獲得良好的效果。
英偉達(dá)圖形研究副總裁David Luebke說:
這些結(jié)果意味著人們可以使用生成式對(duì)抗網(wǎng)絡(luò)來解決耗時(shí)太長(zhǎng)或難以獲取大量數(shù)據(jù)的問題,我迫不及待地想看看藝術(shù)家、醫(yī)學(xué)專家和研究人員用它來做什么。
醫(yī)療保健是英偉達(dá)的研究可以應(yīng)用的一個(gè)特別令人興奮的領(lǐng)域。例如,它可以幫助創(chuàng)建癌癥組織學(xué)圖像來訓(xùn)練其他AI模型,這項(xiàng)突破將有助于解決當(dāng)前大多數(shù)數(shù)據(jù)集的問題。
人工智能訓(xùn)練通常需要大型數(shù)據(jù)集,但并不是一直有效可用的。另一方面,大型數(shù)據(jù)集很難確保其內(nèi)容是否合適,不會(huì)無(wú)意中導(dǎo)致算法偏差。
今年早些時(shí)候,麻省理工學(xué)院被迫刪除了一個(gè)名為8000萬(wàn)小圖像的大型數(shù)據(jù)集。該數(shù)據(jù)集在訓(xùn)練人工智能方面很流行,但被發(fā)現(xiàn)包含帶有種族主義、厭惡女性和其他不可接受的標(biāo)簽的圖像。
麻省理工學(xué)院網(wǎng)站上的一份聲明稱,他們并不知道這些冒犯性的標(biāo)簽,它們是“使用來自WordNet的名詞進(jìn)行自動(dòng)數(shù)據(jù)收集的結(jié)果”。
該聲明還解釋了數(shù)據(jù)集中包含的8000萬(wàn)張圖片大小只有32×32像素意味著手工檢查幾乎是不可能的,也不能保證所有冒犯性的圖片都會(huì)被刪除。
從一個(gè)可以手動(dòng)檢查的小數(shù)據(jù)集開始,像英偉達(dá)ADA這樣的技術(shù)可以用來創(chuàng)建新的圖像來模擬原始圖像,并可以放大到訓(xùn)練人工智能模型所需的大校
在一篇博文中,英偉達(dá)寫道:
“通常需要5萬(wàn)到10萬(wàn)張訓(xùn)練圖像來訓(xùn)練高質(zhì)量的生成式對(duì)抗網(wǎng)絡(luò)。但在許多情況下,研究人員根本沒有可供他們使用的數(shù)萬(wàn)或數(shù)十萬(wàn)張樣本圖像。
由于只有幾千張圖像可供訓(xùn)練,許多生成式對(duì)抗網(wǎng)絡(luò)在產(chǎn)生真實(shí)的結(jié)果時(shí)會(huì)不準(zhǔn)確。當(dāng)鑒別器僅僅記住了訓(xùn)練圖像而不能向生成器提供有用的反饋時(shí),就會(huì)出現(xiàn)這種問題,稱為過擬合?!?br /> 責(zé)任編輯:YYX
-
人工智能
+關(guān)注
關(guān)注
1806文章
49008瀏覽量
249322 -
ada
+關(guān)注
關(guān)注
0文章
16瀏覽量
21813 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3949瀏覽量
93703
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論