一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用深度學習,制作“圖片+文字”型的表情包

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 10:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學習生成表情包,笑不笑由你。

自從有了表情包,跟人聊天時的第一反應,就是去找找看有什么適合的表情。

有一類表情包,形式是文字+圖,尤其能夠精妙地抒發(fā)和傳遞感情。

在這一點上,可能全世界的網(wǎng)友都一樣。

好用的表情永遠不嫌多,而且似乎總是不夠用。

怎么辦?

好在我們有深度學習。

表情包,一個天然的圖說生成問題

斯坦福大學的Abel L. Peirson V和E. Meltem Tolunayl,在這一期斯坦福深度學習自然語言處理課程CS224n的期末作業(yè)中,提交了一個表情包生成器,使用深度學習,制作“圖片+文字”型的表情包。

下面這些都是他們的系統(tǒng)自動生成的結果。不得不說,深得表情包制作精髓。

這個表情包生成器的基本的框架是一個編碼器-解碼器圖說生成系統(tǒng),先進行CNN圖像嵌入,然后用一個LSTM RNN進行文字生成。

其中,編碼器的目標是要給出一個有意義的狀態(tài),讓解碼器開始進行文字生成。他們使用在ImageNet上預訓練的Inception-v3做為編碼器模型,并將最后一層隱藏CNN作為編碼器的輸出。當表情包模板進入Inception模型后,輸出是一組長度固定的向量,也即圖像嵌入,能夠反映圖像的內容。這個圖像嵌入之后會被投射到詞嵌入空間里,方便后續(xù)文字生成。

他們一共嘗試了3種不同的編碼器模型,最簡單的一種只輸入圖像,另一種輸入圖像和標簽,最后一種的輸入也是圖像和標簽,但使用了注意力機制。至于解碼器,都是一個單向LSTM。這樣搭配組合成了3種編碼器-解碼器方案。下圖展示了第二種方案的模型。

學習40萬個表情,幽默程度媲美人類

數(shù)據(jù)集是這個表情包生成器的精髓。他們的數(shù)據(jù)集由大約40萬張帶標簽和圖說的圖片組成。其中有2600個獨特的圖像-標簽對,是他們寫Python腳本從Memegenerator.net中獲取的。一張圖片對應一個標簽,標簽是對這幅圖的簡單描述,而每張圖都與很多不同的圖說(大約160個)相關聯(lián)。

下圖展示了數(shù)據(jù)的樣本:

在訓練前,他們還針對圖說中的標點、格式和某些詞出現(xiàn)的頻率等進行了預處理。

訓練的結果,深度學習生成了各種表情:

系統(tǒng)看過的圖像(左邊4張)的輸入標簽是來自訓練集的標簽,而對于沒見過的圖像(右邊4張),我們使用的句子是“AI是新的電力”。

從語法、搞笑程度和可區(qū)分性(分辨是人制作的還是深度學習生成的)幾個維度判斷,深度學習表情包生成器取得了不錯的效果。尤其是搞笑程度,因為這一點是制作表情包的初衷,普通表情包的搞笑程度7分(滿分10分),深度學習生成的表情包最高達到了6.8。

兩位作者指出,幽默是很難評判的事情,本身就是一個很深的研究領域。他們的這項工作十分基礎,接下來如果能構建出能夠自動斷句的表情包生成器(就是自動判斷圖片上方和下方兩行文字從哪里斷開),將會是一個很大的進步。(因為使用的都是網(wǎng)絡熱圖,因此數(shù)據(jù)含有性別歧視和不文明的成分。)此外,探索視覺注意力機制在表情包生成中的作用,也是一個不錯的研究方向。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3796

    瀏覽量

    138009
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122789
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22741

原文標題:深度學習了40萬個表情,一大波AI 表情包來了

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    表情識別-深度學習探索情感

    來源:易百納技術社區(qū) 隨著人工智能技術的不斷進步,深度學習成為計算機視覺領域的重要技術。微表情識別作為人類情感分析的一種重要手段,受到了越來越多的關注。本文將介紹基于深度
    的頭像 發(fā)表于 08-14 17:27 ?2839次閱讀
    微<b class='flag-5'>表情</b>識別-<b class='flag-5'>深度</b><b class='flag-5'>學習</b>探索情感

    表情一起玩(表情動畫制作軟件)

    即可緩存到本地,隨時可以快速查找使用; <br/>5.快速編輯制作表情,添加任意文字,只需數(shù)秒就可以做出你想要的表情,可保存和使用編輯方案模版,</p&
    發(fā)表于 04-27 17:31

    如何制作QQ表情的安裝?如何制作eip文件?

    如何制作QQ表情的安裝?如何制作eip文件?[hide]第一步:制作BMP, JPG, GIF格式的QQ
    發(fā)表于 05-07 08:39

    利用深度無盤快速制作通用的方法

    利用深度無盤快速制作通用的方法相信論壇里有不少的網(wǎng)管朋友都想想節(jié)約時間快速的完成一家網(wǎng)吧的無盤施工吧,特別是那些維護比較多的網(wǎng)吧,經(jīng)常為了安裝操作系統(tǒng)、上傳系統(tǒng)感到麻煩。這個時候有人就會想到通用
    發(fā)表于 07-18 16:38

    深度學習中的圖片如何增強

    深度學習中的圖片增強
    發(fā)表于 05-28 07:03

    深度學習模型是如何創(chuàng)建的?

    嵌入式系統(tǒng)已被證明可以降低成本并增加各個行業(yè)的收入,包括制造工廠,供應鏈管理,醫(yī)療保健等等。本文將介紹有關深度學習嵌入式系統(tǒng)的信息。深度學習模型是如何創(chuàng)建的?創(chuàng)建
    發(fā)表于 10-27 06:34

    C#教程之圖片上繪制文字

    C#教程之圖片上繪制文字,很好的C#資料,快來學習吧。
    發(fā)表于 04-20 11:13 ?5次下載

    AI為表情生成搞笑文字說明

    制作表情還能獲得研究生學分?如果使用深度學習技術來實現(xiàn)的話,是有可能的。
    的頭像 發(fā)表于 07-31 17:38 ?8228次閱讀

    用Python做幾個表情

    今天制作表情用到的技術還是之前提到的Turtle庫,可以從之前的文章除了畫佩奇我們還要玩點更高級的,去學習Turtle的常用語法,然后就是PIL庫,之前通過這篇文章:Python騷操
    的頭像 發(fā)表于 02-11 11:13 ?5487次閱讀

    【大大表情】數(shù)字化轉型好伙伴!鋼鐵大大表情全新升級!

    【大大表情】數(shù)字化轉型好伙伴!鋼鐵大大表情全新升級!
    的頭像 發(fā)表于 06-27 19:39 ?4206次閱讀

    曝騰訊QQ發(fā)生崩潰 部分群聊無法發(fā)送文字圖片

    3月10日午間,騰訊QQ突然出現(xiàn)崩潰現(xiàn)象,部分群聊無法發(fā)送文字、圖片內容,只能發(fā)送表情、文檔。
    的頭像 發(fā)表于 03-10 14:27 ?3679次閱讀

    如何用約43000張圖片的數(shù)據(jù)集,來計算得出表情的火爆程度排名

    電視節(jié)目的火爆程度可以根據(jù)尼爾森收視率排名(Neilsen ratings)來衡量,但是表情呢?目前仍然沒有什么獨立指標能用以評估表情(memes)的瀏覽人數(shù),所以筆者自己摸索出了
    的頭像 發(fā)表于 10-11 10:06 ?4369次閱讀
    如何用約43000張<b class='flag-5'>圖片</b>的數(shù)據(jù)集,來計算得出<b class='flag-5'>表情</b><b class='flag-5'>包</b>的火爆程度排名

    可通過面部表情來發(fā)送表情的耳機

    無需打字、無需搜索表情,只需對著手機微笑,就能發(fā)出微笑表情。 同樣的,對著手機皺眉,就能發(fā)出皺眉表情。 以上功能來自一款名為 C-Fac
    的頭像 發(fā)表于 10-30 10:13 ?2599次閱讀
    可通過面部<b class='flag-5'>表情</b>來發(fā)送<b class='flag-5'>表情</b><b class='flag-5'>包</b>的耳機

    圖片文字識別:揭開數(shù)字世界的神秘面紗

    隨著數(shù)字化時代的到來,我們生活中的大部分數(shù)據(jù)都以圖片的形式存在。然而,這些圖片中蘊含的信息往往比文字更豐富,如何從這些圖片中提取有價值的信息,是數(shù)字世界中一個十分重要的問題。這時,
    的頭像 發(fā)表于 05-11 18:20 ?907次閱讀

    面部表情識別技術的最新研究進展

    面部表情識別技術是人工智能領域的研究熱點之一,對于揭示情感狀態(tài)和心理狀況具有重要意義。本文將介紹面部表情識別技術的最新研究進展,包括深度學習、多模態(tài)融合、微
    的頭像 發(fā)表于 08-21 17:58 ?1695次閱讀