29歲的吉恒杉坐在電腦前,手指輕輕點(diǎn)擊鼠標(biāo),將屏幕上成百上千幅內(nèi)容各異的畫面標(biāo)注成兩類——“接吻”和“非接吻”。作為優(yōu)酷的一名人工智能標(biāo)注員,他正在訓(xùn)練機(jī)器識別何為“接吻”鏡頭,因此也被戲稱為“吻戲鑒定師”。
打開視頻網(wǎng)站,不少片花、集錦以及進(jìn)度條里的劇情提要,都離不開“吻戲鑒定師”的功勞。愛情是影視劇永恒的主題,吻戲往往出現(xiàn)在劇情的高潮。機(jī)器對海量視頻素材進(jìn)行掃描,將吻戲等片段快速抓取出來,供小編們加工創(chuàng)作。
人工智能和視頻黑科技的應(yīng)用,不僅提升了用戶觀看體驗,更催生出眾多炫酷的新就業(yè)崗位:吻戲鑒定師、明星標(biāo)注師、射門投籃視頻分析員……既對娛樂、體育感興趣又精通技術(shù)的“程序猿”,成為視頻網(wǎng)站最緊缺的人才,也折射出新經(jīng)濟(jì)、數(shù)字經(jīng)濟(jì)崛起帶來的就業(yè)新變化。
“剛開始我和女朋友說,我的工作是訓(xùn)練計算機(jī)識別出吻戲鏡頭,她聽完覺得特別不可思議,誰能給錢讓你干這個呢?”
吉恒杉2016年畢業(yè)于北京航空航天大學(xué),碩士學(xué)的是計算機(jī)視覺,通俗地講,這個專業(yè)的目的是“教電腦看懂世界”。畢業(yè)后,他先在一家互聯(lián)網(wǎng)公司做程序員,去年9月加入阿里巴巴技術(shù)團(tuán)隊,成為優(yōu)酷的一名高級算法工程師,主要工作是教計算機(jī)識別接吻等場景,也被稱為“吻戲鑒定師”。
“這個崗位正好和我的專業(yè)吻合,給大家傳遞快樂和幸福,又能以工作的名義看網(wǎng)劇,我特別喜歡?!闭勂鹱约旱墓ぷ鳎闵家荒樞θ?。他平時愛看網(wǎng)劇,最喜歡《軍師聯(lián)盟》,是吳秀波的鐵粉。
十年來,我國網(wǎng)絡(luò)視頻內(nèi)容消費(fèi)用戶達(dá)到近6億?!吧磉呍絹碓蕉嗟娜擞?a href="http://www.www27dydycom.cn/v/tag/107/" target="_blank">手機(jī)和電腦看網(wǎng)劇、電影和體育比賽,每次上下班坐地鐵,都能看到有人拿著手機(jī)、帶著耳塞看視頻。”吉恒杉發(fā)現(xiàn),大家的需求不再是簡單地看劇,還想看更精彩有趣的片段、集錦,更主動地找到自己最想看的明星或者場景。
要想實現(xiàn)搜索和智能編輯,就得訓(xùn)練機(jī)器從海量的素材中找出相應(yīng)的場景,并打上標(biāo)簽,就像從茫茫海洋中挑出螃蟹和海龜。男女主角的“吻戲”傳遞出美好和幸福,一般是劇情發(fā)展的高潮,因此成為劇集中最常見的標(biāo)簽,如何教機(jī)器識別接吻成了吉恒杉和同事們首要的難題。
這項看上去高冷的人工智能黑科技,在最初的環(huán)節(jié)真的需要不少“人工”。吉恒杉從圖片庫和視頻中截出數(shù)千幅圖片,從中一張一張標(biāo)注出“接吻”的畫面。這個過程叫做“數(shù)據(jù)標(biāo)注”。
“一天要標(biāo)注幾百張接吻的圖像,最多時標(biāo)注上千張,盯著電腦屏幕看一天,最后都有點(diǎn)麻木了?!奔闵颊f,通常數(shù)據(jù)標(biāo)注得越準(zhǔn)確、數(shù)量越多,模型的效果就越好。自然,機(jī)器識別的效果就會更好。
機(jī)器畢竟不是人,對有些復(fù)雜情況也無法識別。比如,為了拍出唯美畫面,“接吻”這個姿態(tài)也千差萬別,有的深情對視,而有的若即若離,團(tuán)隊里的“吻戲鑒定師”們不得不打印出角度各異的“接吻”畫面貼在墻上,一群人激烈討論到底怎么才算“接吻”。
“吻戲鑒定師”是個技術(shù)活,需要根據(jù)機(jī)器的反應(yīng)進(jìn)行繁瑣的后期調(diào)試。機(jī)器學(xué)習(xí)了上千幅圖片中的特征,這時再給機(jī)器任意一張“接吻”的畫面,它就能認(rèn)出來了。截止目前,吉恒杉和同事們已經(jīng)為2萬多條“吻戲”打上了標(biāo)簽。
有阿里巴巴的技術(shù)實力加持,目前,5分鐘時長的視頻全鏈路處理可在10秒內(nèi)完成。比如劇集《三生三世十里桃花》,每一集50分鐘的視頻被切割成3000幀圖片,機(jī)器只需要5秒就能挑出來楊冪和趙又廷的吻戲。
吉恒杉所在的團(tuán)隊目前有8個人。隨著業(yè)務(wù)的快速拓展,“吻戲鑒定師”們也開始接觸和研究其他場景,比如哭戲、打戲,接下來還要鑒定體育比賽中的射門、撲球、投籃、慶祝等畫面,以便網(wǎng)站小編制作比賽精彩集錦。他們不光要看圖片,還要時常“探班”,到比賽或節(jié)目現(xiàn)場去觀察和體會每個場景、動作的細(xì)小差別。
別看這份工作上看去輕松有趣,但其中的辛苦只有做過才知道。盯著電腦屏幕一整天,吉恒杉和同事們最輕松的時刻是下班后去健身房,或者去公司的“太空艙”按摩,享受片刻閑暇。即便是休息,他腦子里想的還是如何教機(jī)器“鑒別”更多的明星和場景。
這幾年娛樂圈出現(xiàn)了一些新現(xiàn)象,比如,現(xiàn)在的明星長得越來越像,如何訓(xùn)練機(jī)器識別古力娜扎和迪麗熱巴,如何分辨TFBOYS的三小只,需要不斷試錯和反復(fù)進(jìn)行模型訓(xùn)練。區(qū)分“明星臉”、“網(wǎng)紅臉”、“雙胞胎”,成了吉恒杉和同事們面臨的新挑戰(zhàn)。
-
人工智能
+關(guān)注
關(guān)注
1806文章
49008瀏覽量
249322 -
計算機(jī)視覺
+關(guān)注
關(guān)注
9文章
1708瀏覽量
46770
原文標(biāo)題:吻戲鑒定師:高冷IT男標(biāo)注上千幅圖片 訓(xùn)練機(jī)器識別“接吻”
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
如何為工業(yè)相機(jī)匹配最佳的鏡頭

OCR識別訓(xùn)練完成后給的是空壓縮包,為什么?
【「# ROS 2智能機(jī)器人開發(fā)實踐」閱讀體驗】機(jī)器人入門的引路書
請問訓(xùn)練平臺訓(xùn)練完的識別程序,可以實現(xiàn)在識別到物體時屏幕再顯示出來,沒有識別到物體時屏幕不顯示嗎?
海思SD3403邊緣計算AI數(shù)據(jù)訓(xùn)練概述
有人這CAN機(jī)器手臂控制板的原理圖嗎?CAN舵機(jī)ID無法被識別
全國首個異構(gòu)人形機(jī)器人訓(xùn)練場啟用
“AI接吻”——AI技術(shù)的雙刃劍
PCM2707為什么無法被電腦識別?
什么是協(xié)議分析儀和訓(xùn)練器
如何訓(xùn)練自己的AI大模型
在NVIDIA Isaac Lab中訓(xùn)練四足機(jī)器人運(yùn)動

遠(yuǎn)心鏡頭的幾個參數(shù)解析

評論