一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

系統(tǒng)機器學(xué)習(xí)算法總結(jié)知識分享

zhKF_jqr_AI ? 來源:未知 ? 作者:steve ? 2017-12-15 14:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Statsbot數(shù)據(jù)科學(xué)家Daniil Korbut簡明扼要地介紹了用于推薦系統(tǒng)的主流機器學(xué)習(xí)算法:協(xié)同過濾、矩陣分解、聚類、深度學(xué)習(xí)

現(xiàn)在有許多公司使用大數(shù)據(jù)來制定高度相關(guān)的建議以提高收入。數(shù)據(jù)科學(xué)家需要根據(jù)業(yè)務(wù)的限制和需求,在各種推薦算法中選擇最好的算法。

為了簡化這一任務(wù),Statsbot團隊準(zhǔn)備了一份現(xiàn)有主要推薦系統(tǒng)算法的概覽。

協(xié)同過濾

協(xié)同過濾(collaborative filtering, CF)及其改版是最常用的推薦算法之一。 即使是數(shù)據(jù)科學(xué)初學(xué)者也可以使用它來構(gòu)建他們的個人電影推薦系統(tǒng),比如用它寫一個簡歷項目。

當(dāng)我們想向用戶推薦東西時,最符合邏輯的做法是找到有相似興趣的人,分析他們的行為,然后給我們的用戶推薦相同的東西。 或者我們可以查看與用戶之前所購類似的物品,并進行相應(yīng)的推薦。

這正是CF的兩種基本方法:基于用戶的協(xié)作過濾和基于物品的協(xié)作過濾。

在這兩種情形下,推薦引擎分兩步:

  1. 找出數(shù)據(jù)庫中有多少用戶/物品與給定的用戶/物品類似。

  2. 評估其他用戶/物品,這一評估基于比待評估用戶/物品更相似的用戶/物品的總權(quán)重,以預(yù)測給用戶推薦相應(yīng)產(chǎn)品的評分。

算法中的“最相似”是什么意思?

假設(shè)我們有一個表示每個用戶的偏好的向量(矩陣 R的行)和一個表示用戶給每件產(chǎn)品評分的向量(矩陣 R的列)。

首先,讓我們?nèi)コ恍┰?,只保留兩個向量中值均已知的元素。

例如,如果我們想比較比爾和簡,我們可以看到,比爾還沒有看過《泰坦尼克號》,而簡到現(xiàn)在為止還沒看過《蝙蝠俠》,所以我們只能通過《星球大戰(zhàn)》來衡量他們的相似性。怎么會有人不看《星球大戰(zhàn)》,是吧?:)

最流行的衡量相似性的技術(shù)是用戶/物品向量之間的余弦相似性或加權(quán)平均數(shù)。

矩陣分解

下一個有趣的算法是矩陣分解。這是一個非常優(yōu)雅的推薦算法,因為使用矩陣分解時通常不用考慮要在結(jié)果矩陣的列和行中保留的物品。

u是第i個用戶的興趣向量,v是表示第j部電影的參數(shù)的向量。因此,我們可以使用u和v的點積來逼近x(第i個用戶對第j部電影的評分)。我們使用已知評分來構(gòu)建這些向量,并使用它們來預(yù)測未知評分。

例如,我們有表示用戶特德的向量(1.4; .9)和表示電影A的向量(1.4; .8),矩陣分解之后我們可以直接通過計算(1.4; .9)和(1.4; .8)的點積來還原電影A——特德的評分,結(jié)果為2.68。

聚類

前面兩個推薦算法非常簡單,比較適合小型系統(tǒng)。到目前為止,我們將推薦問題看作一個監(jiān)督學(xué)習(xí)任務(wù)。現(xiàn)在到了應(yīng)用無監(jiān)督方法來解決這個問題的時候了。

想象一下,我們正在建立一個大型推薦系統(tǒng),協(xié)同過濾和矩陣分解會花很長時間。這時第一個想到的應(yīng)該是聚類(clustering)。

根據(jù)屬于同一聚類的所有客戶的偏好,每個聚類會被分配一個典型偏好。每個聚類中的客戶將收到在聚類層次計算出的推薦。

業(yè)務(wù)初期缺乏用戶評分,因此聚類會是最佳選擇。

不過,單獨使用的話,聚類有點弱。因為通過聚類,我們識別出用戶群組,然后給同一群組中的每個用戶都推薦相同的物品。當(dāng)我們有足夠多的數(shù)據(jù)的時候,更好的選擇是將聚類作為第一步,用來調(diào)整相關(guān)用戶/物品選取,以供協(xié)同過濾算法使用。聚類也能提升復(fù)雜推薦系統(tǒng)的性能。

深度學(xué)習(xí)

十年來,神經(jīng)網(wǎng)絡(luò)有一個巨大的飛躍。今天,神經(jīng)網(wǎng)絡(luò)被應(yīng)用到許多領(lǐng)域,正逐漸取代傳統(tǒng)的機器學(xué)習(xí)方法。我想談一下YouTube使用的深度學(xué)習(xí)方法。

毫無疑問,為這樣的服務(wù)打造推薦系統(tǒng)是一項非常具有挑戰(zhàn)性的任務(wù),因為這一服務(wù)的規(guī)模很大,語料庫是動態(tài)的,還有各種難以觀察的外部因素。

根據(jù)《YouTube推薦系統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)》,YouTube推薦系統(tǒng)算法包括兩個神經(jīng)網(wǎng)絡(luò):一個用于生成候選視頻,另一個用于排名。如果你沒有足夠的時間閱讀上面的論文,我這里有一個快速總結(jié)。

接受用戶的歷史事件作為輸入,候選生成網(wǎng)絡(luò)顯著減少了視頻的數(shù)量,從一個巨大的語料庫抽取出一組相關(guān)性最高的視頻。生成的候選視頻是最和用戶相關(guān)的,我們即將預(yù)測用戶給候選視頻的評分。這個網(wǎng)絡(luò)的目標(biāo)只是通過協(xié)同過濾來提供一些范圍較廣的個性化候選視頻。

接下來我們需要更仔細(xì)地分析這些候選視頻,以挑選出其中最好的視頻。我們通過評分網(wǎng)絡(luò)完成這一任務(wù),評分網(wǎng)絡(luò)可以通過一個期望目標(biāo)函數(shù)給每個視頻賦值一個分?jǐn)?shù),該期望目標(biāo)函數(shù)使用描述視頻的數(shù)據(jù)和有關(guān)用戶行為的信息。評分最高的那些視頻將被推薦給用戶。

使用這一兩步方法,我們可以基于一個非常巨大的視頻語料庫推薦視頻,同時保證推薦的少量視頻是個性化的。這一設(shè)計也允許我們混合從其他來源生成的候選視頻。

這一推薦任務(wù)構(gòu)成了一個極端多類分類(extreme multiclass classification)問題,基于用戶(U)和情境(C)精確地分類在給定時刻t觀看(wt)的特定視頻,這一視頻取自一個語料庫(V),總共有數(shù)百萬的視頻類別(i)。

構(gòu)建你自己的推薦系統(tǒng)

  • 基于大型數(shù)據(jù)庫的在線推薦,最好的辦法是將這個問題拆分成兩個子問題:1)選擇排名最高的N個候選 2)對它們進行評分。

  • 如何評估模型質(zhì)量?除了標(biāo)準(zhǔn)的質(zhì)量指標(biāo)之外,還有一些特別針對推薦問題的指標(biāo):Recall at K和Precision at K,Average Recall at K和Average Precision at K。另外可以參考《A Survey of Accuracy Evaluation Metrics of Recommendation Task》(JMLR 10 (2009))

  • 如果使用分類算法解決推薦問題,則應(yīng)考慮生成負(fù)樣本。如果用戶購買了推薦的物品,不應(yīng)將其作為正樣本,也不應(yīng)將未購買的推薦物品作為負(fù)樣本。

  • 基于在線分?jǐn)?shù)和離線分?jǐn)?shù)考量算法質(zhì)量。 僅使用歷史數(shù)據(jù)的訓(xùn)練模型可能導(dǎo)向簡陋的推薦系統(tǒng),因為該算法不知道新的潮流和偏好。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 聚類
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    14435
  • 協(xié)同過濾
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    9882
  • 矩陣分解
    +關(guān)注

    關(guān)注

    1

    文章

    13

    瀏覽量

    3728

原文標(biāo)題:推薦系統(tǒng)機器學(xué)習(xí)算法概覽

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    。 學(xué)習(xí)建議 對于初學(xué)者,建議先通過仿真(如Gazebo)驗證算法,再遷移到真實機器人,以降低硬件調(diào)試成本。 多參與開源社區(qū)(如ROS2的GitHub項目),學(xué)習(xí)前沿技術(shù)并貢獻(xiàn)代碼
    發(fā)表于 05-03 19:41

    請問STM32部署機器學(xué)習(xí)算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學(xué)習(xí)算法硬件至少要使用哪個系列的芯片?
    發(fā)表于 03-13 07:34

    機器學(xué)習(xí)模型市場前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學(xué)習(xí)模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學(xué)習(xí)模型市場
    的頭像 發(fā)表于 02-13 09:39 ?359次閱讀

    《具身智能機器系統(tǒng)》第10-13章閱讀心得之具身智能機器人計算挑戰(zhàn)

    是全書最“硬核”的部分,涉及不少機器人的硬件、系統(tǒng)、算法等方面的知識,對于我這個非相關(guān)專業(yè)的人士,閱讀起來還是有些吃力,不過好在這本書也不是講解特別深入,還是偏向于綜述性質(zhì)的概況
    發(fā)表于 01-04 01:15

    華為云 Flexus X 實例部署安裝 Jupyter Notebook,學(xué)習(xí) AI,機器學(xué)習(xí)算法

    前言 由于本人最近在學(xué)習(xí)一些機器算法,AI 算法知識,需要搭建一個學(xué)習(xí)環(huán)境,所以就在最近購買的
    的頭像 發(fā)表于 01-02 13:43 ?536次閱讀
    華為云 Flexus X 實例部署安裝 Jupyter Notebook,<b class='flag-5'>學(xué)習(xí)</b> AI,<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>

    傳統(tǒng)機器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會介紹傳統(tǒng)機器學(xué)習(xí)的基礎(chǔ)知識和多種算法
    的頭像 發(fā)表于 12-30 09:16 ?1186次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    【「具身智能機器系統(tǒng)」閱讀體驗】1.初步理解具身智能

    感謝 感謝電子發(fā)燒友網(wǎng)社區(qū)給予《具身智能機器系統(tǒng)》試讀機會。在這知識的盛宴中,我感受到社區(qū)的關(guān)懷與支持。定不負(fù)期望,認(rèn)真研讀,分享所學(xué),回饋社區(qū)。 一、本書大綱 《具身智能機器
    發(fā)表于 12-28 21:12

    【「具身智能機器系統(tǒng)」閱讀體驗】1.全書概覽與第一章學(xué)習(xí)

    了解具身智能機器人相關(guān)的知識,我感到十分榮幸和幸運。 全書簡介 本書以循序漸進的方式展開,通過對具身智能機器人技術(shù)的全方位解析,幫助讀者系統(tǒng)化地學(xué)
    發(fā)表于 12-27 14:50

    《具身智能機器系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

    醫(yī)療領(lǐng)域,手術(shù)輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場景中,協(xié)作機器人面臨的主要挑戰(zhàn)是快速適應(yīng)新工藝流程。具身智能通過在線
    發(fā)表于 12-24 15:03

    【「具身智能機器系統(tǒng)」閱讀體驗】+初品的體驗

    學(xué)習(xí)資源,以培養(yǎng)更多的專業(yè)人才。隨著具身智能機器人技術(shù)對社會的影響越來越大,該書還可以向公眾普及相關(guān)的知識,以提升社會對新技術(shù)的認(rèn)知和接受度,從而為技術(shù)的發(fā)展創(chuàng)造良好的社會環(huán)境。 隨著具身智能
    發(fā)表于 12-20 19:17

    《具身智能機器系統(tǒng)》第1-6章閱讀心得之具身智能機器系統(tǒng)背景知識與基礎(chǔ)模塊

    與環(huán)境持續(xù)互動來優(yōu)化決策策略。書中還進一步討論了強化學(xué)習(xí)的基本原理,包括狀態(tài)空間、動作空間、獎勵函數(shù)的設(shè)計,以及策略網(wǎng)絡(luò)的訓(xùn)練方法。 具身智能機器系統(tǒng)是一個多學(xué)科知識交叉的復(fù)雜工程體
    發(fā)表于 12-19 22:26

    什么是機器學(xué)習(xí)?通過機器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機器學(xué)習(xí)”最初的研究動機是讓計算機系統(tǒng)具有人的學(xué)習(xí)能力以便實現(xiàn)人工智能。因為沒有學(xué)習(xí)能力的
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機器學(xué)習(xí)算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度
    的頭像 發(fā)表于 11-15 09:19 ?1217次閱讀

    【「時間序列與機器學(xué)習(xí)」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機器學(xué)習(xí)算法在時間序列預(yù)測中的應(yīng)用,內(nèi)容全面,循序漸進。每一章都經(jīng)過精心設(shè)計,對理論知識進行了詳細(xì)的闡述,對實際案例進行了生動的展示,使讀
    發(fā)表于 08-12 11:28

    【「時間序列與機器學(xué)習(xí)」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實地構(gòu)建了時間序列分析的基礎(chǔ)知識,更巧妙地展示了
    發(fā)表于 08-12 11:21