現(xiàn)在,機器學習已經(jīng)應用在各行各業(yè)中,開發(fā)工程師隊伍越發(fā)壯大,其中有一類工程師的工作內(nèi)容在外行人眼里似乎更”豐富多彩“,那就是鑒黃師?,F(xiàn)在我們看到的視頻都是經(jīng)過他們本人或他們研發(fā)的技術(shù)處理而來。就在大家致力從音、言、畫等全方位鑒黃時,有一個逆風而上的團隊,正在利用機器學習研究著一項非同一般的任務。
剛拿到這篇論文的時候,營長是拒絕的,畢竟原文作者都沒有署名。目前就知道這項史無前例的工作是由德國一家公司 Very Intelligent Ecommerce Inc 委托進行的,并將研究和調(diào)研成果應用到項目 Autoblow AI 中,旨在使他們的成人智能玩具更加人性化。(關(guān)于這個項目大家可自行搜索了解更多... ...)
下面營長還是”竭盡所能“地為大家介紹一下這項羞羞的機器學習學術(shù)研究項目。研究人員通過分析并標記超過 108 小時的愛情動作視頻,利用聚類分析發(fā)現(xiàn)了 16 種”典型“或”常見“的 blowjob(以下簡稱 bj)動作片段,以此設計和評估一個通過使用深度學習來生成完整全過程 bj 的系統(tǒng)。這個系統(tǒng)優(yōu)于簡單的馬爾科夫鏈模型。雖然內(nèi)容敏感,但,是真學術(shù)?。ㄒ槐菊?jīng)臉)欲知詳情,下文繼續(xù)為你分解。
數(shù)據(jù)集
我們將獲取到的色(xue)情(xi)視頻進行剪切,處理后僅包含 bj 的片段。然后手動對這些片段進行標注,并記錄下嘴巴的位置信息序列,該位置記錄為整數(shù),其中1000和0分別表示尖端和基部。(向數(shù)據(jù)標注工程師獻上我的膝蓋)
為了便于研究,我們使用線性插值技術(shù)將視頻和標注標準化為每秒16幀,最終把視頻中剪切出來的1060個剪輯處理成6270467個標準化幀,這1060個剪輯由109個小時的視頻中所得來。
動作分析
對 Autoblow AI的設定程序有一個基本的了解有助于分析此項研究。Autoblow AI有十種模式,每一種模式都代表著一系列的動作。上或下運動速度的不同就產(chǎn)生了不同的動作,其中速度可用電機來控制。兩到三個不同的動作連續(xù)釋放也可以創(chuàng)造出復雜的動作模式。圖 1 給出了一個基于三種動作模式的分析例子:
圖 1 基于三種不同模式而創(chuàng)造出的復雜模式示例
我們能夠清楚地看到運動具有周期性以及隨著時間的變化動作的狀態(tài)情況,其中包括停頓和中斷?;谏锨€這類的片段,我們能夠構(gòu)建模型來識別數(shù)據(jù)集中常見或典型的動作。
k 均值聚類
我們首先使用k均值聚類算法來進行研究,該算法雖然存在很多缺點,但是它的運算速度快。
我們將每個視頻分割成一個個一秒鐘的窗口,按每個窗口的位置序列給出一組16維的向量。之后采用k均值來找到16個聚類。下圖 2 和 3 給出了每一個類別位置序列的平均值,以及每一個類別中100個樣本的具體位置序列。
圖 2 16 種類別中嘴位置序列的平均值
圖 3 每一類別上100個樣本中嘴的具體位置序列
為了進一步驗證我們的假設,我們使用了最近開發(fā)的一種被稱為UMAP的降維技術(shù)來減少聚類的數(shù)量,以便能在二維和三維中對數(shù)據(jù)進行可視化。其結(jié)果如圖 4 所示。
圖 4 使用 UMAP 降維后數(shù)據(jù)的分布圖
我們能從圖中看到許多令人信服的結(jié)構(gòu)。比如類別5和類別2的數(shù)據(jù),它們分別代表著在頂部和底部附近進行活動,而圖中這兩類數(shù)據(jù)也是處在相互對立的點上。再比如類別1和5的數(shù)據(jù),它們都代表著在頂部進行活動,圖中這兩類數(shù)據(jù)正好也是彼此相鄰。我們還能從圖中觀察到一條介于兩端點之間密集的線,這條線貫穿了所有表示低強度的動作(5,12,7,3,13,2)的數(shù)據(jù)點,這一結(jié)構(gòu)也與現(xiàn)實中 bj時,從最高點到最低點來回活動相符。
這個圖表值得我們?nèi)ゼ毤毞治觯谀壳斑@些驗證就足以讓我們?nèi)ハ嘈艛?shù)據(jù)之間是呈現(xiàn)出某種趨勢的。這些數(shù)據(jù)能夠為我們建立更加復雜的動作模型做支撐。
程序生成
如上所述,一個完整的 bj過程是由一系列的動作來組成的。在上一節(jié)中,我們已經(jīng)確定了在一秒鐘內(nèi)發(fā)生的典型動作。下一步我們要做的是找到這些動作之間常見的演變順序。
這個問題與自然語言中‘猜猜下一個詞會是啥’的問題有頗多相似之處。以下漫畫最能說明這個問題。
我們希望從上一節(jié)中構(gòu)建出來的模塊來組成一個典型的 bj過程。我們首先建立了一個以馬爾可夫鏈為基線的簡單模型,之后又設計了一個深度學習模型來作為替代,并定量比較了兩種模型的優(yōu)劣。
馬爾可夫鏈模型
馬爾可夫鏈背后的原理很簡單:假設下一步的動作僅取決于當前的位置,而不是先前的動作。例如:假設我們剛剛完成了動作1;在此基礎(chǔ)上,我們知道我們再次做動作1的概率為50%,30%的概率做動作2,15%的概率做動作3,等等。然后根據(jù)概率隨機選擇下一個動作來生成一個‘唯一’的動作順序。
因此,我們先計算了一個模式由另一個模式引起的頻率,并驗證了此概率與直覺相符。之后采用這些概率生成唯一的動作順序,并使用簡單的移動平均進行平滑處理。結(jié)果如下圖 5 所示。
圖 5 一個由馬爾可夫鏈模型生成的完整‘不可描述動作’ 過程
馬爾可夫鏈的問題很明顯,就是假設下一狀態(tài)的概率僅取決于當前的狀態(tài)。而事實上,下一狀態(tài)的概率會取決于先前的許多狀態(tài)。
另一個問題是在預測下一狀態(tài)時,還需知道先前狀態(tài)哪一個對下一狀態(tài)影響最大。深度學習能夠在“復雜又非顯而易見相關(guān)性”的問題上大展身手。
Dense Neural Network (DNN) 模型
在本節(jié)中,我們設計了一個DNN架構(gòu),該架構(gòu)能夠基于先前的狀態(tài)預測出下一步的狀態(tài)。
本文中,使用了一個簡單的兩層體系結(jié)構(gòu),把最后的16種狀態(tài)作為模型的輸入,輸出為范圍在0到1之間的關(guān)于16種狀態(tài)的概率值。用零矢量來表示“缺失”狀態(tài)(如視頻開始前的一小段)。通過縱向連接先前的狀態(tài)向量來創(chuàng)建輸入,以交叉熵作為損失函數(shù),訓練數(shù)據(jù)與測試數(shù)據(jù)的比值為8:2。
模型性能的好壞很大程度上取決于訓練數(shù)據(jù)與測試數(shù)據(jù)的切分情況,為了解決這一隨機誤差帶來的影響,我們重復了10次試驗,每次都使用不同的隨機種子來分割數(shù)據(jù)。下面我們將定性地分析一個由模型產(chǎn)生的動作演變順序(如圖 6 所示)。
圖 6由 DNN 模型產(chǎn)生的一個完整 bj過程
模型比較
在本節(jié)中,我們將定量地分析這兩種模型。定性地說,DNN模型具有更好的魯棒性,因為它被鎖定在單一狀態(tài)下的可能性要小很多。對于預測來講,首先要考慮的是預測的準確性。圖 7 表示DNN在不同任務上的預測準確率。
圖 7 DNN 在不同任務上的預測準確率
通過計算得到的馬爾可夫鏈模型的準確率約為58.08%,略低于神經(jīng)網(wǎng)絡的平均精度。
為了證明結(jié)果的可信度,我們還引入了“相對錯誤”這一度量指標。下面給出一個小例子以便理解相對錯誤。當你在預測是否會下雨時,如果回答百分百下雨,但結(jié)果沒下雨,那么你的預測就完全錯誤。但如果你預測百分之八十下雨,結(jié)果沒下雨,那么意味著你只錯了百分之八十。
根據(jù)這一思路,我們重新計算了兩種模型的平均絕對誤差,DNN模型的誤差如圖 8 所示,而馬爾可夫鏈模型的誤差計算結(jié)果為1.126。從這一結(jié)果也能表明DNN模型優(yōu)于馬爾可夫鏈模型。
圖 8 DNN 模型在不同任務上的平均絕對誤差
未來的研究
第一,我們相信程序生成能夠被改善。DNN架構(gòu)的替代方案包括循環(huán)神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡和生成對抗網(wǎng)絡。我們之后打算使用這些技術(shù)來改善動作演變順序的真實性。當然,演變順序得以物理硬件的限制為前提。
第二,我們認為類似的分析可以適用于其他情色行為,本文中以 bj 為主題,服務于Autoblow AI。
第三,我們希望能將研究擴展到圖像識別和視頻分類中去。現(xiàn)在我們已經(jīng)開發(fā)出一個可用于識別靜止幀中是否存在 bj行為的模型,并且正在研究更為復雜的視頻分析問題。接下來研究的重點會著眼于如何將性玩具與色情內(nèi)容實現(xiàn)同步。
-
圖像識別
+關(guān)注
關(guān)注
9文章
527瀏覽量
39115 -
機器學習
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134620
原文標題:關(guān)于那些羞羞的不可描述的動作分析,一個正經(jīng)的機器學習項目
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
工程領(lǐng)域學術(shù)研究的基本規(guī)律和原則
【MiCOKit申請】學術(shù)研究開發(fā)
【下載】《機器學習》+《機器學習實戰(zhàn)》
【瑞芯微RK1808計算棒試用申請】基于機器學習的視覺機械臂研究與設計
怎樣去設計一種基于PLC的搬運機器手控制系統(tǒng)
11個機器學習開源項目
什么是機器學習?機器學習能解決什么問題?(案例分析)

機器學習研究中的四大危機是什么?
NVIDIA在西雅圖開設機器人研究實驗室,聚集跨學科研究團隊
機器學習所需的數(shù)學知識你能夠有效使用嗎
蘋果在人工智能和機器學習領(lǐng)域?qū)儆凇昂髞碚摺?/a>

六個構(gòu)建機器學習模型需避免的錯誤
基于Spark的學術(shù)論文熱點數(shù)據(jù)挖掘方法
深度學習頂級學術(shù)會議ICLR 2023錄用結(jié)果已經(jīng)公布!
機器學習筆記之優(yōu)化-拉格朗日乘子法和對偶分解

評論