使用数据框列表将功能应用于列名称

Question

我正在尝试将非常复杂的功能应用于50多个数据帧的列表。 为了清楚起见，让我们使用一个非常简单的函数来小写名称和3个数据帧，但是我的通用方法编码如下

[EDITED NAMES]
# Data Sample. Every column name is different accross Data Frames


quality <- data.frame(FIRST=c(1,5,3,3,2), SECOND=c(3,6,1,5,5))
thickness <- data.frame(THIRD=c(6,0,9,1,2), FOURTH=c(2,7,2,2,1))
distance <- data.frame(ONEMORE=c(0,0,1,5,1), ANOTHER=c(4,1,9,2,3))


# list of dataframes

dfs <- list(quality, thickness, distance)


# a very simple function (just for testing)
# actually a very complex one is used on real data

BetterNames <- function(x) {
    names(x) <- tolower(names(x))
  x
}


# apply function to data frame list

dfs <- lapply(dfs, BetterNames)

# I know the expected R behaviour is to modify a copy of the object,
# instead of the original object itself. So if you get the names
# you get the original version, not the needed one

names(quality)

[1] "FIRST"  "SECOND"

有没有办法在循环内使用任何函数或“应用”大量数据帧？
结果，我们必须获得修改后的数据，以替换列表（大列表）中的每个数据帧的原始数据。

我知道使用数据表有一个技巧，但是我想知道是否可以使用基数R。

预期成绩：

 names(quality)

    [1] "first"  "second"

[编辑]指出了这个答案：重命名多个数据框中的列，R

但是没有用。 在我的情况下，您不能使用字符串名称的向量，因为我的新名称不是固定的字符串列表。[编辑数据]

for(df in dfs) {
  df.tmp <- get(df)
  names(df.tmp) <- BetterNames(df)
  assign(df, df.tmp)
}

> names(quality)
[1] "quality" NA

谢谢

Answer 1

您已经有了最好的情况：

让我们为列表添加一些名称：

names(dfs) <- c("quality", "thickness", "distance")
dfs <- lapply(dfs, BetterNames)

dfs[["quality"]]
#   first second
# 1     1      3
# 2     5      6
# 3     3      1
# 4     3      5
# 5     2      5

这很好。 而且所有数据都在列表中，因此，如果要对所有数据框执行其他操作，这非常容易。

如果您完成了对这些数据帧的类似处理，并且确实希望它们在全局环境中可以单独使用，则可以使用

list2env(dfs, envir = .GlobalEnv)

我建议，虽然他们留在列表---在大多数情况下，如果你有你正在使用50个的数据帧，在list很容易使用lapply或for循环使用它们，而是作为单独的对象，你会抄/粘贴代码并犯错误。

我甚至会考虑从工作空间中的50个数据帧开始，这是一个问题-请参阅如何制作数据帧列表？ 有关查找上游修补程序的建议：从头开始直接查找列表。

Answer 2

我会使用一种简单而有效的解析与评估方法。

让我们使用一个for循环来编写适合您需求的命令：

for(df in dfs) {

command <- paste0("names(",df,") <- BetterNames(",df,")")
# print(command)
eval(parse(text=command))

}

names(quality)
[1] "first"  "second"

names(thickness)
[1] "third"  "fourth"

names(distance)
[1] "onemore"  "another"

Answer 3

这肯定不是最佳选择，我希望能有更好的结果，但是可以解决：

BetterNames <- function(x, y) {

    names(x) <- tolower(names(x))
    assign(y, x, envir = .GlobalEnv)

}

dfs <- list(quality, thickness, distance)
dfs2 <- c("quality", "thickness", "distance")
mapply(BetterNames, dfs, dfs2)

> names(quality)
[1] "first"  "second"

使用数据框列表将功能应用于列名称

问题描述

3 个解决方案

解决方案1
2 2016-11-03 00:00:22

解决方案2
2 已采纳 2016-11-03 06:46:11

解决方案3
0 2016-11-02 23:31:51

使用数据框列表将功能应用于列名称

问题描述

3 个解决方案

解决方案1 2 2016-11-03 00:00:22

解决方案2 2 已采纳 2016-11-03 06:46:11

解决方案3 0 2016-11-02 23:31:51

解决方案1
2 2016-11-03 00:00:22

解决方案2
2 已采纳 2016-11-03 06:46:11

解决方案3
0 2016-11-02 23:31:51