簡體   English   中英

如何使用 R 中的泊松分布計算每小時到達率?

[英]How to calculate arrival rate per hour using poisson distribution in R?

我有一個包含 66K 行和 4 列的數據框,即客戶 ID、客戶簽到時間、客戶簽到時間和客戶結帳時間。

First 6 rows of the data:
cust_ID  cust_checkin_time      cust_checkout_time        checkin hour
12345    2019-01-01 07:02:50    2019-01-01 07:23:22        07AM_08AM
65789    2019-01-01 07:22:15    2019-01-01 07:26:02        07AM_08AM
90876    2019-01-01 07:25:21    2019-01-01 07:35:27        07AM_08AM
34567    2019-01-01 07:27:22    2019-01-01 07:38:56        07AM_08AM
36754    2019-01-01 07:44:41    2019-01-01 07:55:20        07AM_08AM
59876    2019-01-01 07:45:10    2019-01-01 07:58:42        07AM_08AM

我想知道每小時到達率來預測使用泊松分布的等待時間。

我無法計算 lambda 即每小時到達率。如何使用泊松分布或任何其他方法計算。

請幫我解決這個問題。我花了將近一個星期的時間搜索谷歌,但我沒有得到任何滿意的答案。

首先:這不完全是堆棧溢出問題。

  • 假設您的客戶在早上 7 點到晚上 7 點之間到達,即 12 小時。
  • 每小時統計客戶數:
check-in hour   num_customer
 7 am -  8 am      10
 8 am -  9 am       7
10 am - 11 am      11
     ...
 6 pm -  7 pm       6

lambda的估算器是通過匯總您的客戶 (10+7+11+...+6) 得出的,然后除以觀察次數(入住小時數,即 12)。


使用dplyr

data %>%
  count(checkin_hour) %>%
  summarise(lamba=sum(n)/n())

給出你想要的 output。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM