繁体   English   中英

如何在rmarkdown文档中对Latex表输出中的回归系数进行十进制对齐

[英]How to decimal-align regression coefficients in Latex table output in rmarkdown document

rmarkdown文档中,我正在创建一个带有标准误差的回归系数Latex表,以比​​较单个表中的几个回归模型。 我想垂直对齐每个模型的系数,以便系数的小数点垂直向下排列。

我正在使用texreg来创建表。 默认情况下,系数不是十进制对齐的(相反,每个字符串都在其列中居中),我正在寻找一种方法来获得十进制对齐的系数。 我不是执着于texreg ,所以如果你使用了一个解决方案xtablepanderstargazer或任何其他方法,我很感兴趣的是为好。 理想情况下,我想要一个可以在rmarkdown文档中以编程方式实现的解决方案,而不是在将文档呈现为.tex文件后调整latex标记。

作为奖励,我还希望能够在表格标题中添加换行符。 例如,在texreg您可以使用custom.model.names参数来设置每个回归模型的列名。 在下面的例子中,我想将"Add Horsepower and AM"分成两行,这样列就不需要那么宽。 我尝试了"Add Horsepower \\newline and AM"但只是将“ewline”添加到最后一个列标题中,并忽略“\\ n”。

这是一个可重复的例子:

---
title: "Regression Table"
author: "eipi10"
date: "August 15, 2016"
header-includes:
    - \usepackage{dcolumn}
output: pdf_document
---

```{r, echo=FALSE, message=FALSE, results="asis"}
library(texreg)

m1 = glm(mpg ~ wt + factor(cyl), data=mtcars)
m2 = glm(mpg ~ wt + factor(cyl) + hp + factor(am), data=mtcars)

texreg(list(m1,m2),
       single.row=TRUE, 
       custom.model.names=c("Base Model", "Add Horsepower and AM"),
       custom.coef.names=c("Intercept", "Weight","Cyl: 6", "Cyl: 8", "Horsepower","AM: 1"))
```

这是输出表的样子:

在此输入图像描述

这是使用broom的尝试。 你仍然需要清理标签。

library(broom)
library(dplyr)
library(pander)
library(tidyr)

m1 = glm(mpg ~ wt + factor(cyl), data=mtcars)
m2 = glm(mpg ~ wt + factor(cyl) + hp + factor(am), data=mtcars)
base <- tidy(m1) %>% select(term, estimate) %>% mutate(type = "base_model")
with_am_hp <- tidy(m2) %>% select(term, estimate) %>% mutate(type = "Add_Horsepower_and_AM")
models <- bind_rows(base, with_am_hp)
formatted_models <- models  %>% spread(type, estimate)

m1_glance <- glance(m1) %>% mutate(type = "base_model")
m2_glance <- glance(m2) %>% mutate(type = "Add_Horsepower_and_AM")
glance_table <- data.frame("Add_Horsepower_and_AM" = unlist(glance(m2)), "base_model" = unlist(glance(m1))) %>% mutate(term = row.names(.))

full_results <- bind_rows(formatted_models, glance_table)
pandoc.table(full_results, justify = "left")

这需要相当多的争论,但我认为这会让你接近你想要的。 我用过xtable 主要思想是为每个模型创建两列,一列对齐(系数),另一列左对齐(标准错误)。 因此,对于具有两个模型的表,我们有五列。 标题和摘要统计信息显示在跨越两列的单元格中。

首先,我们有header.tex ,在p上绘图 xtable插图中的27个

\usepackage{array}
\usepackage{tabularx}
\newcolumntype{L}[1]{>{\raggedright\let\newline\\
\arraybackslash\hspace{0pt}}m{#1}}
\newcolumntype{C}[1]{>{\centering\let\newline\\
\arraybackslash\hspace{0pt}}m{#1}}
\newcolumntype{R}[1]{>{\raggedleft\let\newline\\
\arraybackslash\hspace{0pt}}m{#1}}
\newcolumntype{P}[1]{>{\raggedright\tabularxbackslash}p{#1}}

.Rmd文件。 我从这个答案中学到了add.to.row

---
title: "Regression Table"
author: "eipi10"
date: "August 15, 2016"
header-includes:
    - \usepackage{dcolumn}
output: 
  pdf_document:
    includes:
      in_header: header.tex
---

```{r, echo=FALSE, message=FALSE, results="asis"}
library(xtable)
library(broom)   

m1 = glm(mpg ~ wt + factor(cyl), data=mtcars)
m2 = glm(mpg ~ wt + factor(cyl) + hp + factor(am), data=mtcars)

p_val <- c(0, 0.001, 0.01, 0.05, 1)
stars <- sapply(3:0, function(x) paste0(rep("*", x), collapse=""))

make_tbl <- function(model) {
  coefs <- summary(model)$coefficients
  coef_col <- round(coefs[,1], 2)
  se_col <- round(coefs[,2], 2)
  star_col <- stars[findInterval(coefs[,4], p_val)]
  tbl <- data.frame(coef=coef_col)
  tbl$se <- sprintf("(%0.2f)%s", se_col, star_col)
  tbl
}

make_addtorow <- function(row.name, terms) {
  # xtable allows the addition of custom rows. This function
  # makes a row with a one column (which is used for the row
  # names for the model statistics), 
  # followed by two columns that each span two columns.
  paste0(row.name, 
  paste0('& \\multicolumn{2}{C{3cm}}{', 
         terms, 
         '}', 
        collapse=''), 
  '\\\\')
}

tbl1 <- make_tbl(m1)
tbl2 <- make_tbl(m2)
combo <- merge(tbl1, tbl2, by = "row.names", all = TRUE)[,-1]
rownames(combo) <- c("Intercept", "AM: 1", "Cyl: 6", "Cyl: 8", "Horsepower", "Weight")
sum_stats <- round(rbind(glance(m1), glance(m2)), 2)

addtorow <- list()
addtorow$pos <- list(0, 6, 6, 6, 6, 6)
addtorow$command <- c(
  make_addtorow("", c("Base model", "Add Horsepower and AM")),
  make_addtorow("\\hline AIC", sum_stats$AIC), # Draw a line after coefficients
  make_addtorow("BIC", sum_stats$BIC),
  make_addtorow("Log Likelihood", sum_stats$logLik),
  make_addtorow("Deviance", sum_stats$deviance),
  make_addtorow("Num. obs.", sum_stats$df.null + 1)
  )

xtbl <- xtable(combo, add.to.row = addtorow, include.colnames = FALSE,  
               comment = FALSE)
# Specify column alignment for tabularx environment
# We're using the custom column types we created in header.tex
# \hskip specifies the width between columns
align(xtbl) <- c("L{2.5cm}", "R{1.5cm}@{\\hskip 0.1cm}", "L{1.5cm}", 
                           "R{1.5cm}@{\\hskip 0.1cm}","L{1.5cm}")

print(xtbl, 
      tabular.environment = "tabularx", # tabularx takes two arguments
      width = ".60\\textwidth",         # width, and alignment (specified above)
      add.to.row = addtorow, 
      include.colnames = FALSE,
      comment = FALSE)
```

在此输入图像描述

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM