[英]R - correct way to specify a logistic regression with fixed effects?
假设我有美国篮球比赛百万次传球的数据。 数据如下例所示:
data <- data.frame(same_team = c(0,0,1,0,1,0),
length_pass= c(1,2,5,7,1,3),
year= c(1,1,1,2,2,2),
mean_length_pass_team= c(15,15,9,14,14,8),
team= c('A', 'A', 'B', 'A', 'A', 'B'))
data
same_team length_pass year mean_length_pass_team team
1 0 1 1 15 A
2 0 2 1 15 A
3 1 5 1 9 B
4 0 7 2 14 A
5 1 1 2 14 A
6 0 3 2 8 B
每个观察结果都是从X队的一名玩家到另一名玩家的传递。 因变量记录同一团队(0/1)中球员之间的传球是否完成。
我想估计length_pass
对same_team
传递的影响,控制year
和mean_length_pass_team
。 我也想控制team
固定效果。
以下具有固定效应的logit回归模型规格正确吗?
我尤其不确定团队固定效果是否正确指定。
library(bife)
bife(same_team ~ length_pass + year + mean_length_pass_team | team, data=data)
library(survival)
clogit(same_team ~ length_pass + year + mean_length_pass_team + strata(team), data=data)
值得看看完整模型(我认为您不需要mean_length_pass_team
),
m1 <- glm(same_team ~ year * length_pass * team, data = data, family = binomial)
summary(m1)
看看你是否得到了重要的互动? 由于您想控制mean_length_pass_team
,这是length_pass
, team
和year
的函数, length_pass
我想说您隐含地期望它们。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.