繁体   English   中英

计算面板数据和线性概率的 ROC Model

[英]Calculating ROC for panel data and Linear Probability Model

我有来自 102 个国家/地区的外部资产的面板数据,时间超过 20-40 年,具体取决于国家/地区。 我尝试根据 log(total_liabilities) 预测金融危机的概率,看看外国投资和其他资本头寸的增加是否有助于预测危机。

plm1 <- plm(crisis ~ log_total_liabilities + lag1_log_tot_lia + lag2_log_tot_lia + lag3_log_tot_lia
                        + factor(year) + factor(country), data = dt2, index=c("year", "country"), model="pooling")
summary(plm1)

我开始估计 plm model,回归我的危机虚拟人。 为了估计预测能力,我想生成一个 ROC 和 AUC 值,给定回归

# Plot of True Positive Rate Against the False Positive Rate
pred1 <- predict(plm1)
pred2 <- prediction(pred1,as.numeric(plm1$crisis))
plot(performance(pred2,"tpr","fpr"), las=0, main="plm1")

我收到如下错误:

错误:不适合 arguments / 变量”(翻译自德语)或“所有参数/变量需要具有相同的长度”(翻译自德语)。

另一种获取 Roc 值的方法将从 When changing pred1 <- predict(plm1, dt2) (dt2 是我的数据框,还包含一些我没有在 plm1 回归中使用过的变量)开始,错误不同:预测的格式是无效的。 它不能被强制列入清单。

PLM 是否根本不是为 ROC 计算而设计的? 如果是这样,为什么所附的论文会给出具有固定效应的线性概率 model 的 AUROC 值? (见倒数第二行)如果不是,我做错了什么?

我附上了论文的截图和我的数据集。

CSV 带数据卫星的文件

带有OLS AUROC值的论文截图

AUC-ROC 仅适用于二元分类问题。 当您使用固定效应回归时,在 plm1 之后产生的预测值 pred1 是连续的。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM