來自特拉維夫大學(xué)的一組研究人員開發(fā)了一種神經(jīng)網(wǎng)絡(luò),能夠讀取食譜并生成烹飪完成后的熟食產(chǎn)品的圖像。嗯,好像可以更換人頭拍色情片的DeepFakes還不夠糟糕,現(xiàn)在我們無法確定我們在網(wǎng)上看到的美味食物都是否是真實的了。由研究人員Ori Bar El,Ori Licht和Netanel Yosephian組成的特拉維夫團隊使用名為StackGAN V2的生成對抗網(wǎng)絡(luò)(GAN)的修改版本和巨大的recipe1M數(shù)據(jù)集中的52K圖像/配方組合創(chuàng)建了他們的AI。
該團隊開發(fā)了一種人工智能,只需要列出任何配方和說明清單,就可以運算成品食品的樣子。
這一切都是一名研究人員在向祖母詢問她傳統(tǒng)的番茄醬炸魚排配方時開始的。由于她年事已高,她不記得確切的食譜,所以吃貨科學(xué)家就建立了一個能夠給出食物圖像的系統(tǒng),方便輸出食譜。由于人們很難從飯菜中獲得具有實際數(shù)量和“隱藏”成分的精確配方,如鹽,胡椒,黃油,面粉等。因此基于配方生成食物圖像就成了有用的做法,這項任務(wù)對于人類來說非常具有挑戰(zhàn)性,對于計算機更是如此。
由于目前大多數(shù)人工智能系統(tǒng)都試圖在人類易于完成的任務(wù)中取代人類專家,解決一項甚至超出人類能力的任務(wù)會很有趣。
值得一提的是,與CUB和Oxford102數(shù)據(jù)集中的圖像相比,recipe1M數(shù)據(jù)集中的圖像質(zhì)量較低。這反映在許多模糊的圖像上,光照條件差,“粥狀圖像”以及圖像不是方形(這使得訓(xùn)練模型變得困難)。這個事實可能會解釋這兩個模型成功生成“類似粥”的食物圖像(例如面食,米飯,湯,沙拉),但卻難以生成具有獨特形狀的食物圖像(例如漢堡包,雞肉,飲料) )。
如果有足夠的配方,特拉維夫團隊的人工智能現(xiàn)在可以將它變成一個看起來足夠好的圖像,根據(jù)研究論文顯示,在盲測中,人類有時更喜歡計算機生成的圖片而不是真實照片。
該團隊打算繼續(xù)開發(fā)該系統(tǒng),希望擴展到超越食物的領(lǐng)域。包括完善當前的數(shù)據(jù)集質(zhì)量,還考慮構(gòu)建一個包含兒童書籍文本和相應(yīng)圖像的數(shù)據(jù)集,這樣就可以讓計算機看文章畫插畫了。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103616 -
人工智能
+關(guān)注
關(guān)注
1806文章
49028瀏覽量
249499 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25447
原文標題:研究人員開發(fā)神經(jīng)網(wǎng)絡(luò) 可讀取食譜并生成熟食產(chǎn)品的圖像
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
無刷電機小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究
神經(jīng)網(wǎng)絡(luò)RAS在異步電機轉(zhuǎn)速估計中的仿真研究
BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較
BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點分析
BP神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用
人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

基于光學(xué)衍射神經(jīng)網(wǎng)絡(luò)的軌道角動量復(fù)用全息技術(shù)的設(shè)計與實驗研究

評論