长列名称的更好data.frame格式

Question

设定

我有一个充满一些垃圾的data.frame ：

> set.seed(12345)
> d <- data.frame(x=rnorm(100), y=rnorm(100), z=rnorm(100)) %>% tbl_df
> d %>% head(3)
Source: local data frame [6 x 3]

           x          y          z
1  0.5855288  0.2239254 -1.4361457
2  0.7094660 -1.1562233 -0.6292596
3 -0.1093033  0.4224185  0.2435218

现在，我想看看我的变量之间的一些关系：

> '%cor%' <- function(x,y) round(100 * cor(x,y, use='pairwise'), 1)
> d %>% summarize(x %cor% y, y %cor% z, lag(x) %cor% z)
Source: local data frame [1 x 3]

  x %cor% y y %cor% z lag(x) %cor% z
1      10.4     -12.7            7.8

问题

我的列的名称大于数据本身。

错误的解决方案＃1：手册名称

我可以做的一件事就是自己为列命名，但这需要额外的簿记，因此很快就很烦人：

 > d %>% summarize(x2y=x %cor% y, y2z=y %cor% z, Lx2y=lag(x) %cor% z)
 Source: local data frame [1 x 3]

    x2y   y2z Lx2y
 1 10.4 -12.7  7.8

错误的解决方案2：移调

我可以做的另一件事是转置：

 > d %>% summarize(x %cor% y, y %cor% z, lag(x) %cor% z) %>% t
                 [,1]
 x %cor% y       10.4
 y %cor% z      -12.7
 lag(x) %cor% z   7.8

问题是，当我开始分组时，它会向下转换列：

 > d %>% mutate(group=cut(z, c(-Inf,0,Inf))) %>% 
         group_by(group) %>% 
         summarize(x %cor% y, y %cor% z, lag(x) %cor% z) %>% t
                [,1]       [,2]      
 group          "(-Inf,0]" "(0, Inf]"
 x %cor% y      " 6.9"     "14.9"    
 y %cor% z      "-19.8"    "-17.3"   
 lag(x) %cor% z " 3.9"     "-6.3"

有没有办法告诉print.data.frame(...)我希望它水平显示系列而不是垂直显示？

错误的解决方案3：grid.table

我尝试过的另一件事是使用gridExtra::grid.table进行渲染，这gridExtra::grid.table ，但是如果我可以垂直旋转列名，那就太好了：

> gt <- function(df) { 
          grid.newpage()
          df %>% grid.table(core.just='right', show.rownames=F)
        }
> d %>% summarize(x %cor% y, y %cor% z, lag(x) %cor% z) %>% gt

在此处输入图片说明

有什么办法吗？

Answer 1

有几种可能的解决方案来解决您的问题。 对于您在问题中提出的每个建议，我都列出了一种完成该想法的方法。 我个人认为移调解决方案（＃2）是最好的解决方案。

解决方案1：手册名称

您可以使用功能对首选名称进行编码（例如， naming_convention ），而不是真正的人工名称。 然后调用此函数以重命名整个data.frame 。

# use this function to define all naming you would like to use
naming_convention <- function(data){
  colnames(data) <- gsub(' %cor% ', '2', colnames(data)) # rename %cor% with 2
  colnames(data) <- gsub('lag', 'L', colnames(data))     # rename lag with L
  colnames(data) <- gsub(' |[(]|)', '', colnames(data))  # remove () 
  return(data)
}
# call function
d %>% summarize(x %cor% y, y %cor% z, lag(x) %cor% z) %>%
  naming_convention
## Source: local data frame [1 x 3]
## 
##    x2y   y2z Lx2z
## 1 10.4 -12.7  7.8

解决方案2：移调

将matrix转换回data.frame以进行正确打印。

d %>% mutate(group=cut(z, c(-Inf,0,Inf))) %>% 
  group_by(group) %>% 
  summarize(x %cor% y, y %cor% z, lag(x) %cor% z)%>% 
  t %>% 
  data.frame
##                      X1       X2
## group          (-Inf,0] (0, Inf]
## x %cor% y           6.9     14.9
## y %cor% z         -19.8    -17.3
## lag(x) %cor% z      3.9     -6.3

解决方案3：grid.table

这可能不是一个好主意，但是您可以将前两种策略与对grid.table的调用一起使用。

# manual rename
gt1 <- function(df) { 
  grid.newpage()
  nm <- gsub(' %cor% ', '2', colnames(df)) # rename %cor% with 2
  nm <- gsub('lag', 'L', nm)     # rename lag with L
  nm <- gsub(' |[(]|)', '', nm)  # remove () 
  df %>% grid.table(core.just='right', theme=list(cols=nm))
}
d %>% mutate(group=cut(z, c(-Inf,0,Inf))) %>% 
  group_by(group) %>% 
  summarize(x %cor% y, y %cor% z, lag(x) %cor% z)%>% 
  gt1
# transpose
gt2 <- function(df) { 
  grid.newpage()
  df %>% t %>% grid.table(core.just='right')
}
d %>% mutate(group=cut(z, c(-Inf,0,Inf))) %>% 
  group_by(group) %>% 
  summarize(x %cor% y, y %cor% z, lag(x) %cor% z)%>% 
  gt2

Answer 2

summarized.correlation = function(d) {
    correlations = cor(d) * 100
    s.correlations = correlations[upper.tri(correlations)]

    namez = apply(combn(colnames(correlations), 2), 2, function(pairs) { do.call(function(...) { paste(..., sep="2")}, as.list(pairs)) })
    names(s.correlations) = namez
    s.correlations
}

长列名称的更好data.frame格式

问题描述

设定

问题

错误的解决方案＃1：手册名称

错误的解决方案2：移调

错误的解决方案3：grid.table

2 个解决方案

解决方案1
1 已采纳 2015-01-27 16:25:53

解决方案1：手册名称

解决方案2：移调

解决方案3：grid.table

解决方案2
0 2015-01-26 18:36:20

长列名称的更好data.frame格式

问题描述

设定

问题

错误的解决方案＃1：手册名称

错误的解决方案2：移调

错误的解决方案3：grid.table

2 个解决方案

解决方案1 1 已采纳 2015-01-27 16:25:53

解决方案1：手册名称

解决方案2：移调

解决方案3：grid.table

解决方案2 0 2015-01-26 18:36:20

解决方案1
1 已采纳 2015-01-27 16:25:53

解决方案2
0 2015-01-26 18:36:20