在KDD 2018上,Airbnb的研究人員們發(fā)表了一篇名為Customized Regression Model for Airbnb Dynamic Pricing的論文。這篇文章描述了Airbnb使用的動態(tài)定價模型,以下是論智對文章的大致介紹。
價格優(yōu)化的目的是幫助房東制定最優(yōu)價格。傳統(tǒng)定價策略是為大量相同的產(chǎn)品定價,但在Airbnb沒有相同的產(chǎn)品,因為平臺所提供的房屋都有獨一無二的價值和體驗感受。這樣的獨特性就很難估計傳統(tǒng)定價策略所需要的需求曲線。
“研究人員所提出的策略模型在Airbnb上應(yīng)用了一年多的時間。第一代模型剛一使用,網(wǎng)站的預(yù)定量就得到大幅提升,采用了這一方法的房東們受益也隨之增長。經(jīng)過多次迭代后,策略模型將進一步改善定價的質(zhì)量?!?/p>
想給Airbnb上所有不同的房間定價是非常有挑戰(zhàn)性的,即使我們可以收集同一區(qū)域中的同樣大小的房間,但是其他因素(例如評分星級)也會影響價格。除此之外,由于不同的季節(jié)和區(qū)域因素,需求也是隨時間波動的。同樣,預(yù)定的早晚也是影響價格的因素,預(yù)定的越晚,房間預(yù)訂成功的機會就越小,這也會導(dǎo)致需求函數(shù)的變化。
為了讓房東的受益最大化,Airbnb提出了“Price Tips”和“Smart Pricing”工具。Price Tips可以提供價格日歷,根據(jù)房東目前的定價,顯示該房間每天被預(yù)定出去的概率是多少。點擊某一天,頁面中會顯示Airbnb推薦的價格以及其他信息。
Price Tips截圖
在Smart Pricing工具中,房東可以設(shè)置一個最低值和最高值,之后Airbnb會自動生成不同日期的新價格。
Smart Pricing截圖
在理想情況下,我們會估計一個需求曲線F(P), 在給定價格P的情況下估計房間的需求量,之后選擇P的值,使P×F(P)的值最大。之前我們已經(jīng)提到過影響價格的因素有很多,而且,由于Airbnb并不是直接控制房間價格的,而是只能給出“建議價格”,所以想要直接拿不同的定價策略做實驗來觀察市場反應(yīng)也是不容易的。
Airbnb最終采用的定價系統(tǒng)有三個要素:
一個二元分類模型,預(yù)測某一晚某房間預(yù)定的概率。
這些預(yù)測之后會被輸入到一個定價策略模型中,會對空閑日期提出建議價格。
策略模型會加入其他個性化邏輯,以符合房東的目標、結(jié)合特殊事件等等。
定價系統(tǒng)概覽
這篇論文的主要目的是定價策略模型,但是我們首先要簡單了解下預(yù)定概率模型的細節(jié)。
預(yù)定概率模型
想知道某件房間會有多大概率被預(yù)定,這里是用的是Gradient Boosting Machines(GBM),除此之外還有一個針對各個市場訓(xùn)練的模型。對于訓(xùn)練數(shù)據(jù)的采樣率在根據(jù)各市場密度的不同有所差別:
“房屋密度高的市場能從地理位置這一因素中獲益最多,這里的采樣率會高于全局常量的采樣率?!?/p>
模型在做決策時考慮了三個方面:
頁面所列出的各項特征,例如每晚的價格、房間類型、可住人數(shù)、房間數(shù)量、洗手間數(shù)量、房間設(shè)施、地理位置、評價、歷史入住率、能否立即預(yù)定等等。
時間因素,例如季節(jié)、日期、可入住時間等等。
供給因素,例如周圍是否有相似房源、評價、搜索率等等。
模型在不同價格點預(yù)測預(yù)定概率,可能會得到一個需求曲線。但是,由于上述的多重影響因素,想得到精確的需求曲線進行價格設(shè)置是非常困難的。
“我們試著基于估計的需求曲線,直接應(yīng)用利潤最大化策略,但是在線的A/B測試結(jié)果顯示這些方法在實際中通常會失敗。所以,我們決定找其他的替代方法?!?/p>
替代法使用預(yù)定概率模型的輸出結(jié)果作為定價策略模型的輸入因素之一。
定價策略模型
首先讓我們思考:在缺少最優(yōu)價的基礎(chǔ)上,訓(xùn)練定價策略模型時,應(yīng)該用什么評估尺度呢?
深思熟慮之后,研究團隊確定了兩種評估尺度:價格下降查全率(PDR)和預(yù)定反悔率(BR)。我們曾統(tǒng)計過,某間房間是否在某天被預(yù)定出去,以及預(yù)定的價格是多少。PDR和BR都能反映出這一點。
假設(shè)如果某間房沒能以價格P成功預(yù)定,那么它也一定不會在比P更高的價格上預(yù)訂出去。但是如果價格低于P,那么可能有被預(yù)定的機會。PDR就表示當實際價格高于模型的建議價格時,房間未被預(yù)定的比例。在下面的圖表中,PDR為0.6(5晚中有3晚沒有被預(yù)定出去)。
如果我們只有PDR,那么最終我們訓(xùn)練出的模型最后會把指導(dǎo)價格變?yōu)榱?!如果該房間某天被成功預(yù)訂,價格為P,并且P≥指導(dǎo)價格,那么這個指導(dǎo)價格就沒什么用了。預(yù)訂反悔率就抓住了這之中的利潤。BR按以下方法計算:對于所有被成功預(yù)訂的日子,取零和預(yù)定價格與指導(dǎo)價格之間的百分比之中的最大值。然后從這些值中取中位數(shù)。
例如:
BR就是(14,5,6,0,0)的中位數(shù),5%。
現(xiàn)在我們把這些思想合到一個單一的損失函數(shù)中,看起來是這樣:
給定參數(shù)xi,fθ(xi)是輸出的建議價格,L是下限函數(shù),U是上限函數(shù)。
對于預(yù)訂出去的日期,下限是預(yù)定價格Pi,對于沒有預(yù)定出去的日子,是c1Pi,其中c1是0到1之間的常數(shù)。
對于沒有被預(yù)訂出去的日子,上限是價格日歷中的價格Pi。對于預(yù)訂出去的日子,上限是c2Pi,其中c2是大于1的常數(shù)。
當建議價格在上下限之間時,損失是零,否則損失就是建議價格和界限之間的距離。
在論文中,作者提到:
“我們并不用相同的常數(shù)表示價格增加和減少,因為我們想讓訓(xùn)練系統(tǒng)非對稱地學(xué)習(xí)比率。這樣一來,建議價格可以反映需求的敏感度?!?/p>
參數(shù)θ1和θ2是在Airbnb上400多萬個有效房源中訓(xùn)練出的,訓(xùn)練更關(guān)注最近的預(yù)定行為,從而更好地反映季節(jié)信號。
評估
和直接從預(yù)定概率模型中的需求估計曲線定價的簡單策略相比,定價策略模型顯著改善了PDR和BR。
除了定量評估,論文作者還檢查了2018年2月8日生成的未來120晚的價格,下圖分別是針對日本東京和美國加州太浩湖的房源價格走勢:
可以看到,兩地房間的價格都在周末有所上升,并且東京在三月末到四月初的房價也相對較高,因為那正是賞櫻的好時節(jié)?!皬倪@兩個案例中,我們看到模型的確能捕捉到時間帶來的房價波動”,研究者說。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7256瀏覽量
91883 -
模型
+關(guān)注
關(guān)注
1文章
3521瀏覽量
50427 -
Airbnb
+關(guān)注
關(guān)注
0文章
14瀏覽量
5500
原文標題:KDD 2018 | Airbnb用機器學(xué)習(xí)實現(xiàn)動態(tài)定價
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
如何建立動態(tài)電阻模型?
如何對5G進行定價
基于動態(tài)描述邏輯的UCON授權(quán)模型
一種改進的動態(tài)服務(wù)路由模型:P-RSR模型
面向模型的動態(tài)架構(gòu)
基于多模型的動態(tài)矩陣控制Dynamic Matrix Con
遞歸網(wǎng)絡(luò)模型在傳感器動態(tài)補償中的應(yīng)用
空間動態(tài)模型建模方法分析

基于角色的多約束動態(tài)權(quán)限管理模型

Airbnb機器學(xué)習(xí)和數(shù)據(jù)科學(xué)團隊經(jīng)驗分享
使用嵌入來做個性化的搜索推薦:來自Airbnb

評論