[英]R - correct way to specify a logistic regression with fixed effects?
假設我有美國籃球比賽百萬次傳球的數據。 數據如下例所示:
data <- data.frame(same_team = c(0,0,1,0,1,0),
length_pass= c(1,2,5,7,1,3),
year= c(1,1,1,2,2,2),
mean_length_pass_team= c(15,15,9,14,14,8),
team= c('A', 'A', 'B', 'A', 'A', 'B'))
data
same_team length_pass year mean_length_pass_team team
1 0 1 1 15 A
2 0 2 1 15 A
3 1 5 1 9 B
4 0 7 2 14 A
5 1 1 2 14 A
6 0 3 2 8 B
每個觀察結果都是從X隊的一名玩家到另一名玩家的傳遞。 因變量記錄同一團隊(0/1)中球員之間的傳球是否完成。
我想估計length_pass
對same_team
傳遞的影響,控制year
和mean_length_pass_team
。 我也想控制team
固定效果。
以下具有固定效應的logit回歸模型規格正確嗎?
我尤其不確定團隊固定效果是否正確指定。
library(bife)
bife(same_team ~ length_pass + year + mean_length_pass_team | team, data=data)
library(survival)
clogit(same_team ~ length_pass + year + mean_length_pass_team + strata(team), data=data)
值得看看完整模型(我認為您不需要mean_length_pass_team
),
m1 <- glm(same_team ~ year * length_pass * team, data = data, family = binomial)
summary(m1)
看看你是否得到了重要的互動? 由於您想控制mean_length_pass_team
,這是length_pass
, team
和year
的函數, length_pass
我想說您隱含地期望它們。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.