一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微博Push系統(tǒng)的發(fā)展歷程,如何利用機(jī)器學(xué)習(xí)進(jìn)行熱點(diǎn)挖掘以及個(gè)性化推薦系統(tǒng)的模型升級(jí)之路

電子工程師 ? 來(lái)源:lq ? 2019-05-19 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

想必國(guó)內(nèi)絕大多數(shù)網(wǎng)民都有新浪微博的用戶賬號(hào)。據(jù)最新數(shù)據(jù)顯示,2018 年第四季度財(cái)報(bào),微博月活躍用戶突破 4.62 億,連續(xù)三年增長(zhǎng) 7000 萬(wàn) +;微博垂直領(lǐng)域數(shù)量擴(kuò)大至 60 個(gè),月閱讀量過(guò)百億領(lǐng)域達(dá) 32 個(gè)。毫無(wú)疑問(wèn),從 2009 年 8 月上線至今,微博已是當(dāng)前業(yè)界領(lǐng)先的中文社交媒體,成績(jī)斐然。

當(dāng)年有一句話叫做 “圍觀就是力量,輿論改變中國(guó)”,明星緋聞、爆炸性新聞等眾多熱門(mén)事件從微博發(fā)出傳遍全網(wǎng)。直到如今,微博也上線了不少新功能如 “熱搜” 、“新鮮事”、“故事” 等,更加強(qiáng)調(diào) “社交”、“全媒體”、“垂直領(lǐng)域” 發(fā)展,進(jìn)一步滿足社交屬性下人們對(duì)獲取實(shí)時(shí)、一手新聞資源的需求。

Push(消息推送)的作用則在于提高用戶活躍度和粘性,提高用戶留存率,進(jìn)而進(jìn)一步提高產(chǎn)品功能和用戶參與度。如國(guó)內(nèi)外重大事件的提醒、領(lǐng)域內(nèi)大事件的提醒、關(guān)注人或好友的重要消息推送、感興趣內(nèi)容的消息提醒等方式,可引導(dǎo)用戶感興趣的內(nèi)容打開(kāi)應(yīng)用。

然而,另一個(gè)事實(shí)是,此前頻頻 “吐槽” 的應(yīng)對(duì)熱門(mén)事件的流量暴增導(dǎo)致的微博服務(wù)器崩潰問(wèn)題,無(wú)論是熱搜消息,還是信息流方面,均受到了極大的挑戰(zhàn)。隨著用戶數(shù)量和消息并發(fā)量的不斷上漲,基于移動(dòng)端的消息推送服務(wù)器性能和穩(wěn)定性也需要經(jīng)受非常大的考驗(yàn)。例如,在排序方面,微博平臺(tái)每天的推送量可達(dá)到幾個(gè)億的規(guī)模,如果全部采用全量計(jì)算,對(duì)服務(wù)器的資源消耗會(huì)過(guò)大,微博團(tuán)隊(duì)采用了分片批量計(jì)算的方式。

近期,微博研發(fā)中心技術(shù)專家齊彥杰在接受 AI 科技大本營(yíng)采訪時(shí)表示,“微博一直致力于打造基于用戶關(guān)系的社交媒體平臺(tái),讓用戶及時(shí)獲取好友動(dòng)態(tài),隨時(shí)隨地發(fā)現(xiàn)新鮮事。如何不錯(cuò)過(guò)重要的信息?讓用戶每 5 分鐘去刷新自己的關(guān)注列表顯然并不現(xiàn)實(shí),更高效的方式是通過(guò)系統(tǒng)推送進(jìn)行消息提醒,但推送是一個(gè)強(qiáng)打擾的行為,如何做一個(gè)既不過(guò)分打擾用戶,又能讓用戶開(kāi)心吃瓜的 Push 推薦系統(tǒng),就是一件很有意思的事情了?!?/p>

齊彥杰,微博研發(fā)中心技術(shù)專家

在 5 月 25 日 - 5 月 27 日杭州舉辦的 CTA 大會(huì)(官網(wǎng):https://dwz.cn/iSZ7BQUR)上,齊彥杰將作為機(jī)器學(xué)習(xí)論壇的演講嘉賓,向大家介紹微博 Push 系統(tǒng)的發(fā)展歷程,如何利用機(jī)器學(xué)習(xí)進(jìn)行熱點(diǎn)挖掘、博文標(biāo)注,以及個(gè)性化推薦系統(tǒng)的模型升級(jí)之路。

機(jī)器學(xué)習(xí)在微博的落地

實(shí)際上,微博一步步進(jìn)化的背后離不開(kāi)平臺(tái)技術(shù)研發(fā)團(tuán)隊(duì)在新技術(shù)能力上的持續(xù)提升。在齊彥杰看來(lái),“微博非常重視新技術(shù)的跟進(jìn)與落地,內(nèi)部團(tuán)隊(duì)做了大量工作?,F(xiàn)在也非常注重對(duì)外的交流,每年會(huì)參與一些比較重要的會(huì)議?!?/p>

AI 科技大本營(yíng):在過(guò)去幾年,內(nèi)容推薦和用戶增長(zhǎng)領(lǐng)域呈現(xiàn)出了哪些比較突出的技術(shù)或應(yīng)用?與過(guò)去傳統(tǒng)手段有哪些區(qū)別和聯(lián)系?

齊彥杰:過(guò)去幾年,技術(shù)的發(fā)展可以說(shuō)是一日千里,快得令人震驚。如果大家平常關(guān)注會(huì)議或比賽,會(huì)發(fā)現(xiàn)每年好的論文或解決方案,進(jìn)步非常大。而工業(yè)界也非常努力,不斷提升產(chǎn)品效果,讓用戶體驗(yàn)越來(lái)越好。

列舉這些就是想說(shuō)明,如果論年計(jì),突出的技術(shù)也會(huì)變得不突出,因?yàn)榘l(fā)展太快了。僅僅在模型排序方面,比如幾年前 LR + 超大規(guī)模特征還是排序標(biāo)配,后來(lái)演變?yōu)榱?FM+,直到現(xiàn)在則是 Deep+,不得不說(shuō)技術(shù)一直在前進(jìn)。但不變的是,更加有效地利用數(shù)據(jù),通過(guò)計(jì)算量的提升,提高模型的準(zhǔn)確率,服務(wù)好用戶的個(gè)性化需求。

AI 科技大本營(yíng):您認(rèn)為基于微博當(dāng)前的技術(shù)能力,在完成精準(zhǔn)、快速個(gè)性化推送的過(guò)程中,面臨著哪些挑戰(zhàn)?為什么機(jī)器學(xué)習(xí)方法能夠適用于當(dāng)前的問(wèn)題解決?

齊彥杰:微博的數(shù)據(jù)是巨量的,用戶行為也是極為豐富的,更別說(shuō)博文中蘊(yùn)含的形式、內(nèi)容、情緒等復(fù)雜的信息,這是微博的優(yōu)勢(shì),也是微博機(jī)器學(xué)習(xí)的挑戰(zhàn)。如何去理解用戶、理解內(nèi)容,連接用戶與用戶、用戶與內(nèi)容?這些問(wèn)題都需要 NLP、計(jì)算機(jī)視覺(jué)、圖計(jì)算、排序模型等技術(shù)解決。也只有基于機(jī)器學(xué)習(xí),通過(guò)超大規(guī)模數(shù)據(jù)的學(xué)習(xí)與抽象,才可以做到精準(zhǔn)的個(gè)性化內(nèi)容分發(fā)。

AI 科技大本營(yíng):您在之前的分享中,也提到 “博文質(zhì)量、算法模型與分發(fā)效率共同決定了 Push 效果”,那么在您看來(lái),微博用戶類型繁多,關(guān)注的興趣點(diǎn)更為廣泛,在實(shí)踐過(guò)程中,是如何根據(jù)用戶畫(huà)像進(jìn)行更加精準(zhǔn)的內(nèi)容推薦?

齊彥杰:首先,博文的內(nèi)容要豐富,滿足個(gè)性化的需求一定要保障候選博文的范圍足夠廣泛;然后,按需儲(chǔ)備,根據(jù)用戶畫(huà)像能夠知道用戶對(duì)哪些內(nèi)容有更大的需求,根據(jù)需求挖掘內(nèi)容更能保障易消費(fèi)物料的準(zhǔn)確性與充足性;再通過(guò)豐富的召回方法和高效的排序模型進(jìn)行推薦分發(fā)。

常用的推薦算法包括協(xié)同、向量、模型等。

AI 科技大本營(yíng):實(shí)際上微博文本短小、信息量少(有時(shí)還會(huì)涉黃、不健康、不適宜內(nèi)容等信息),很難做到對(duì)文本內(nèi)容進(jìn)行細(xì)粒度表征。對(duì)此,在本文理解方面,團(tuán)隊(duì)有沒(méi)有比較好的解決辦法?

齊彥杰:這確實(shí)是一個(gè)很好的問(wèn)題。前面我提到,用戶理解和內(nèi)容理解是痛點(diǎn)和難點(diǎn),但也是機(jī)器學(xué)習(xí)在高速進(jìn)步的領(lǐng)域,當(dāng)前 NLP、計(jì)算機(jī)視覺(jué)方面的進(jìn)步給了我們很好的支持,包括去年 BERT 模型的出現(xiàn),Embedding 的實(shí)踐,以及人臉識(shí)別、物體識(shí)別等,對(duì)于內(nèi)容的表征都有很好的表現(xiàn)。

AI 科技大本營(yíng):不少人曾提到多模態(tài)融合的概念,對(duì)此您是如何看待的?在微博的相關(guān)業(yè)務(wù)中已經(jīng)有實(shí)際的應(yīng)用及成效了嗎?

齊彥杰:這個(gè)問(wèn)題和上一個(gè)問(wèn)題可以聯(lián)系起來(lái)看。因?yàn)楝F(xiàn)在隨著個(gè)人硬件的提升,內(nèi)容創(chuàng)作的形式也是在不斷豐富,從最初的文本,到后來(lái)圖片的增多,再到視頻內(nèi)容的涌現(xiàn),甚至直播的加入,用戶有太多的形式去表現(xiàn)自己的思想或情緒。單純的文本維度已經(jīng)不能完整的表征內(nèi)容,所以多模態(tài)融合對(duì)于推薦系統(tǒng)的提高有很大的幫助。據(jù)我所知,有很多同事在做相關(guān)的內(nèi)容,也有比較好的效果。

關(guān)于齊彥杰本人

據(jù)了解,齊彥杰最早服務(wù)于行業(yè)軟件,2010 年進(jìn)入互聯(lián)網(wǎng)行業(yè),一直從事爬蟲(chóng)、索引、檢索、數(shù)據(jù)分析等方向的研發(fā)工作。后來(lái)用戶獲取信息的習(xí)慣逐漸從主動(dòng)搜索轉(zhuǎn)向被動(dòng)接受,推薦系統(tǒng)進(jìn)入高速發(fā)展時(shí)期,機(jī)器學(xué)習(xí)也開(kāi)始了對(duì)整個(gè)社會(huì)進(jìn)行改造?!皺C(jī)器學(xué)習(xí)最需要就是數(shù)據(jù),不管是在數(shù)量上,還是在維度上,微博均擁有著巨量的公開(kāi)語(yǔ)料及行為數(shù)據(jù)。我認(rèn)為這是機(jī)器學(xué)習(xí)應(yīng)用最好的土壤?!?后來(lái),也就是 2016 年,齊彥杰加入新浪微博團(tuán)隊(duì),目前在微博 UG 算法組主要負(fù)責(zé) Push 相關(guān)方向的業(yè)務(wù)。

據(jù)他的觀察,最近幾年微博 Push 得到比較大的改造,完成了從編輯推薦向算法推薦、各業(yè)務(wù)獨(dú)立到統(tǒng)一 Push 平臺(tái)的升級(jí),使用戶在體驗(yàn)上有了很好的提升。

作為本次杭州 CTA 大會(huì)機(jī)器學(xué)習(xí)論壇的演講嘉賓,齊彥杰表示:“技術(shù)的前進(jìn)離不開(kāi)先行者的經(jīng)驗(yàn),更離不開(kāi)思想的撞擊,期待 CTA2019 的技術(shù)盛宴?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Push
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    9569
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134532
  • 微博
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    6563

原文標(biāo)題:“搞垮” 微博服務(wù)器?每天上億條用戶推送是如何做到的

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2025年電商API發(fā)展趨勢(shì):智能個(gè)性化

    體驗(yàn)與商業(yè)生態(tài)。 一、智能趨勢(shì):從自動(dòng)到自主決策 AI驅(qū)動(dòng)的實(shí)時(shí)決策 API將深度集成機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)動(dòng)態(tài)定價(jià)、庫(kù)存預(yù)測(cè)與風(fēng)險(xiǎn)管控。例
    的頭像 發(fā)表于 07-11 14:26 ?95次閱讀
    2025年電商API<b class='flag-5'>發(fā)展</b>趨勢(shì):智能<b class='flag-5'>化</b>與<b class='flag-5'>個(gè)性化</b>

    EM儲(chǔ)能網(wǎng)關(guān) ZWS智慧儲(chǔ)能云應(yīng)用(13) — 企業(yè)個(gè)性化配置

    儲(chǔ)能公有云平臺(tái),企業(yè)用戶如何自主個(gè)性化配置?ZWS智慧儲(chǔ)能云通過(guò)靈活的多級(jí)配置功能,實(shí)現(xiàn)個(gè)性化系統(tǒng)配置,幫助強(qiáng)化儲(chǔ)能企業(yè)獨(dú)特性。簡(jiǎn)介儲(chǔ)能企業(yè)在使用智慧儲(chǔ)能云平臺(tái)時(shí),常面臨企業(yè)個(gè)性化和品
    的頭像 發(fā)表于 05-23 11:39 ?162次閱讀
    EM儲(chǔ)能網(wǎng)關(guān) ZWS智慧儲(chǔ)能云應(yīng)用(13) — 企業(yè)<b class='flag-5'>個(gè)性化</b>配置

    個(gè)性化醫(yī)療的挑戰(zhàn),流液體監(jiān)測(cè)

    的診斷等。個(gè)性化醫(yī)療考慮的是個(gè)體患者的疾病模式、體質(zhì)和性別以及這些因素對(duì)療法和藥物的影響。其總體目標(biāo)是創(chuàng)建適合個(gè)體患者的療法,并在必要時(shí)根據(jù)疾病的進(jìn)展情況進(jìn)行調(diào)整和
    的頭像 發(fā)表于 05-19 13:25 ?153次閱讀
    <b class='flag-5'>個(gè)性化</b>醫(yī)療的挑戰(zhàn),<b class='flag-5'>微</b>流液體監(jiān)測(cè)

    NVIDIA大語(yǔ)言模型在推薦系統(tǒng)中的應(yīng)用實(shí)踐

    推薦系統(tǒng)的主要任務(wù)在于根據(jù)用戶的過(guò)往行為預(yù)測(cè)其潛在興趣點(diǎn),并據(jù)此推薦相應(yīng)的商品。在傳統(tǒng)的推薦系統(tǒng)中,當(dāng)處理用戶請(qǐng)求時(shí),會(huì)觸發(fā)多個(gè)召回模塊,例如熱門(mén)商品召回、個(gè)性化召回以及深度召回等,從
    的頭像 發(fā)表于 03-05 09:30 ?786次閱讀
    NVIDIA大語(yǔ)言<b class='flag-5'>模型</b>在推薦<b class='flag-5'>系統(tǒng)</b>中的應(yīng)用實(shí)踐

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    , 規(guī)劃模塊,控制模塊,嵌入式計(jì)算平臺(tái)。 接下來(lái),作者以自動(dòng)駕駛為例,講述了自動(dòng)駕駛的發(fā)展歷程以及自動(dòng)駕駛的計(jì)算系統(tǒng)的組成和工作原理,比如攝像頭,激光雷達(dá),毫米波雷達(dá)
    發(fā)表于 01-04 19:22

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    引入GPT這樣的大模型后,情況發(fā)生了根本性的變化。只需提供適當(dāng)?shù)奶崾驹~以及封裝好的機(jī)器人函數(shù)庫(kù),大模型便能靈活地生成控制代碼,極大地簡(jiǎn)化了開(kāi)發(fā)過(guò)程,并提高了自動(dòng)
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】1.全書(shū)概覽與第一章學(xué)習(xí)

    了解具身智能機(jī)器人相關(guān)的知識(shí),我感到十分榮幸和幸運(yùn)。 全書(shū)簡(jiǎn)介 本書(shū)以循序漸進(jìn)的方式展開(kāi),通過(guò)對(duì)具身智能機(jī)器人技術(shù)的全方位解析,幫助讀者系統(tǒng)化學(xué)習(xí)這一領(lǐng)域的核心知識(shí)。 首先在第一部
    發(fā)表于 12-27 14:50

    《具身智能機(jī)器系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    醫(yī)療領(lǐng)域,手術(shù)輔助機(jī)器人需要毫米級(jí)的精確控制,書(shū)中有介紹基于視覺(jué)伺服的實(shí)時(shí)控制算法,以及如何利用模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場(chǎng)景中,協(xié)作機(jī)器
    發(fā)表于 12-24 15:03

    【「大模型啟示錄」閱讀體驗(yàn)】如何在客服領(lǐng)域應(yīng)用大模型

    多個(gè)因素以確保所選模型能夠滿足企業(yè)的具體需求和目標(biāo)。首先,企業(yè)需要明確自己的客服需求和目標(biāo)。例如,是否需要24小時(shí)在線客服服務(wù)?是否需要處理復(fù)雜問(wèn)題的能力?是否需要個(gè)性化服務(wù)?明確這些需求有助于企業(yè)更好
    發(fā)表于 12-17 16:53

    語(yǔ)音芯片賦能可穿戴設(shè)備:開(kāi)啟個(gè)性化音頻新體驗(yàn)

    語(yǔ)音芯片與可穿戴設(shè)備合作,帶來(lái)定制音效、智能降噪、個(gè)性化推薦、語(yǔ)音交互及跨設(shè)備共享等,引領(lǐng)個(gè)性化音頻時(shí)代,提升用戶聽(tīng)覺(jué)體驗(yàn)。
    的頭像 發(fā)表于 12-14 15:44 ?915次閱讀

    智慧路燈照明管理系統(tǒng),呈現(xiàn)個(gè)性化城市照明效果

    【智慧城市】智慧路燈照明管理系統(tǒng),呈現(xiàn)個(gè)性化城市照明效果
    的頭像 發(fā)表于 10-28 14:39 ?824次閱讀
    智慧路燈照明管理<b class='flag-5'>系統(tǒng)</b>,呈現(xiàn)<b class='flag-5'>個(gè)性化</b>城市照明效果

    以AI破解個(gè)性化客服難題

    一文匯集多個(gè)行業(yè)借助 AI 實(shí)現(xiàn)的個(gè)性化客服實(shí)踐
    的頭像 發(fā)表于 10-25 09:06 ?2389次閱讀
    以AI破解<b class='flag-5'>個(gè)性化</b>客服難題

    開(kāi)啟全新AI時(shí)代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國(guó)產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    嵌入式系統(tǒng)是電子信息產(chǎn)業(yè)的基礎(chǔ),是智能系統(tǒng)的核心。大模型催生AI走入千家萬(wàn)戶、喚醒端側(cè)AI的需求爆發(fā)。以機(jī)器人、無(wú)人駕駛和智能制造為代表的智能嵌入式
    發(fā)表于 08-30 17:24

    Meta發(fā)布Imagine Yourself AI模型,重塑個(gè)性化圖像生成未來(lái)

    Meta公司近日在人工智能領(lǐng)域邁出了重要一步,隆重推出了其創(chuàng)新之作——“Imagine Yourself”AI模型,這一突破性技術(shù)為個(gè)性化圖像生成領(lǐng)域帶來(lái)了前所未有的變革。在社交媒體與虛擬現(xiàn)實(shí)技術(shù)
    的頭像 發(fā)表于 08-26 10:59 ?995次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書(shū)概覽與時(shí)間序列概述

    指標(biāo)監(jiān)控、容量預(yù)估彈性伸縮、告警關(guān)聯(lián)、告警收斂和告警系統(tǒng)評(píng)估等,以及監(jiān)控中出現(xiàn)的節(jié)假日效應(yīng)、持續(xù)異常等實(shí)際情況。 ●第8章“金融領(lǐng)域的應(yīng)用場(chǎng)景”:介紹量化交易的概念、發(fā)展歷程,如何通過(guò)
    發(fā)表于 08-07 23:03