PyTorch教程21.5之推薦系統(tǒng)的個(gè)性化排名

1946866 2023-06-06 | pdf | 0.13 MB | 次下載 | 免費(fèi)

普通下載普通下載

資料介紹

在前幾節(jié)中，僅考慮了明確的反饋，并根據(jù)觀察到的評(píng)分對(duì)模型進(jìn)行了訓(xùn)練和測(cè)試。這種方法有兩個(gè)缺點(diǎn)：首先，大多數(shù)反饋在現(xiàn)實(shí)世界場(chǎng)景中不是顯式的而是隱式的，收集顯式反饋的成本更高。其次，完全忽略了可能預(yù)測(cè)用戶興趣的未觀察到的用戶-項(xiàng)目對(duì)，使得這些方法不適用于評(píng)級(jí)不是隨機(jī)丟失而是由于用戶偏好而丟失的情況。未觀察到的用戶-項(xiàng)目對(duì)是真實(shí)負(fù)反饋（用戶對(duì)項(xiàng)目不感興趣）和缺失值（用戶將來可能與項(xiàng)目交互）的混合體。我們簡(jiǎn)單地忽略矩陣分解和 AutoRec 中未觀察到的對(duì)。清楚地，

為此，一類旨在從隱式反饋生成排名推薦列表的推薦模型得到了普及。一般而言，個(gè)性化排名模型可以通過逐點(diǎn)、成對(duì)或列表方法進(jìn)行優(yōu)化。Pointwise 方法一次考慮單一交互，并訓(xùn)練分類器或回歸器來預(yù)測(cè)個(gè)人偏好。矩陣分解和 AutoRec 使用逐點(diǎn)目標(biāo)進(jìn)行了優(yōu)化。成對(duì)方法為每個(gè)用戶考慮一對(duì)項(xiàng)目，并旨在為該對(duì)近似優(yōu)化排序。通常，成對(duì)方法更適合排序任務(wù)，因?yàn)轭A(yù)測(cè)相對(duì)順序讓人聯(lián)想到排序的本質(zhì)。Listwise 方法近似于整個(gè)項(xiàng)目列表的順序，例如，NDCG）。然而，listwise 方法比 pointwise 或 pairwise 方法更復(fù)雜，計(jì)算量更大。在本節(jié)中，我們將介紹兩個(gè)成對(duì)目標(biāo)/損失，貝葉斯個(gè)性化排名損失和鉸鏈損失，以及它們各自的實(shí)現(xiàn)。

21.5.1。貝葉斯個(gè)性化排序損失及其實(shí)現(xiàn)

貝葉斯個(gè)性化排名 (BPR) （Rendle等人，2009 年）是一種成對(duì)的個(gè)性化排名損失，源自最大后驗(yàn)估計(jì)。它已被廣泛應(yīng)用于許多現(xiàn)有的推薦模型中。BPR 的訓(xùn)練數(shù)據(jù)由正負(fù)對(duì)（缺失值）組成。它假設(shè)用戶比所有其他未觀察到的項(xiàng)目更喜歡正面項(xiàng)目。

在形式上，訓(xùn)練數(shù)據(jù)由元組構(gòu)成，形式為 (u,i,j), 代表用戶u喜歡這個(gè)項(xiàng)目i在項(xiàng)目上j. 下面給出了旨在最大化后驗(yàn)概率的 BPR 的貝葉斯公式：

(21.5.1)p(Θ∣>u)∝p(>u∣Θ)p(Θ)

在哪里Θ表示任意推薦模型的參數(shù)，>u表示用戶期望的所有項(xiàng)目的個(gè)性化總排名u. 我們可以制定最大后驗(yàn)估計(jì)來推導(dǎo)出個(gè)性化排名任務(wù)的通用優(yōu)化標(biāo)準(zhǔn)。

(21.5.2)BPR-OPT:=ln?p(Θ∣>u)∝ln?p(>u∣Θ)p(Θ)=ln?∏(u,i,j∈D)σ(y^ui?y^uj)p(Θ)=∑(u,i,j∈D)ln?σ(y^ui?y^uj)+ln?p(Θ)=∑(u,i,j∈D)ln?σ(y^ui?y^uj)?λΘ‖Θ‖2

在哪里 D=def{(u,i,j)∣i∈Iu+∧j∈I?Iu+} 是訓(xùn)練集，有Iu+表示用戶的項(xiàng)目 u喜歡，I表示所有項(xiàng)目，并且 I?Iu+指示除用戶喜歡的項(xiàng)目之外的所有其他項(xiàng)目。y^ui和y^uj是用戶的預(yù)測(cè)分?jǐn)?shù)u到項(xiàng)目i和j，分別。先驗(yàn)的