[英]python : linear regression with fixed effects (adapting Stata code)
我正在尝试从估计线性回归模型的 Stata 复制代码。
问题是有 2 个固定效应变量(Domaine d'étude EF Université EF)。
这是我目前拥有的:
import statsmodels.formula.api as smf
results = smf.ols('discriminant ~ diff_eval_formfr + presse + trav_sup + recrut_seul + proced_auditions + taux_insertion_30mois + taux_stable_30 + taux_plei_30 + sal_med', data=da).fit()
我不知道如何添加固定效果,或者即使有可能。
任何建议将被认真考虑。
如果固定效应变量是分类字符串变量,您可以将其包含在等式中。 statsmodels
会将每个字符串值转换为虚拟变量并将其包含在回归中。
如果固定效应变量是数字,您必须通过将名称放在C()
中来告诉statsmodels
将数值解释为类别而不是数字。
假设您有一个字符串固定效应变量 ( fe1
) 和一个数字固定效应变量 ( fe2
)。 然后你可以像这样添加它们:
import statsmodels.formula.api as smf
results = smf.ols('discriminant ~ diff_eval_formfr + presse + trav_sup + recrut_seul + proced_auditions + taux_insertion_30mois + taux_stable_30 + taux_plei_30 + sal_med + fe1 + C(fe2)', data=da).fit()
请注意,这包括作为每个值的一组虚拟变量的固定效应变量。 这就是固定效应在数学上包含在回归中的方式。 这在 Stata 中是相同的,但 Stata 中的大多数固定效应选项都会从结果表中删除对固定效应的估计。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.