[英]How to calculate arrival rate per hour using poisson distribution in R?
我有一個包含 66K 行和 4 列的數據框,即客戶 ID、客戶簽到時間、客戶簽到時間和客戶結帳時間。
First 6 rows of the data:
cust_ID cust_checkin_time cust_checkout_time checkin hour
12345 2019-01-01 07:02:50 2019-01-01 07:23:22 07AM_08AM
65789 2019-01-01 07:22:15 2019-01-01 07:26:02 07AM_08AM
90876 2019-01-01 07:25:21 2019-01-01 07:35:27 07AM_08AM
34567 2019-01-01 07:27:22 2019-01-01 07:38:56 07AM_08AM
36754 2019-01-01 07:44:41 2019-01-01 07:55:20 07AM_08AM
59876 2019-01-01 07:45:10 2019-01-01 07:58:42 07AM_08AM
我想知道每小時到達率來預測使用泊松分布的等待時間。
我無法計算 lambda 即每小時到達率。如何使用泊松分布或任何其他方法計算。
請幫我解決這個問題。我花了將近一個星期的時間搜索谷歌,但我沒有得到任何滿意的答案。
首先:這不完全是堆棧溢出問題。
check-in hour num_customer
7 am - 8 am 10
8 am - 9 am 7
10 am - 11 am 11
...
6 pm - 7 pm 6
lambda
的估算器是通過匯總您的客戶 (10+7+11+...+6) 得出的,然后除以觀察次數(入住小時數,即 12)。
使用dplyr
:
data %>%
count(checkin_hour) %>%
summarise(lamba=sum(n)/n())
給出你想要的 output。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.