根据 R 中数据帧中的现有行分配标头

Question

转换数据框后，我想根据现有行为列分配标题/名称。 我的标题目前是：

row.names   X2  X3  X4  X5  X6  X7  X8  X9  ...

我想摆脱它并使用以下行作为列标题（因为我有很多，所以不必输入它们）。

我对此的唯一解决方案是导出并重新加载数据（使用 header=T）。

Answer 1

这里的关键是首先取消列出该行。

colnames(DF) <- as.character(unlist(DF[1,]))
DF = DF[-1, ]

Answer 2

试试这个：

colnames(DF) = DF[1, ] # the first row will be the header
DF = DF[-1, ]          # removing the first row.

但是，请查看数据是否已正确读取。 如果 data.frame 有数字变量，但第一行是字符，则所有数据都被读取为字符。 为避免此问题，最好按照您的建议保存数据并使用 header=TRUE 再次读取。 您还可以查看这个问题： Reading a CSV file同盟。

Answer 3

最干净的方法是使用专为此目的而构建的janitor包的功能。

janitor::row_to_names(DF,1)

如果要使用除第一行之外的任何其他行，请将其传递到第二个参数中。

Answer 4

与毗湿奴的回答非常相似，但使用 lapply 将所有数据映射到字符，然后将它们分配为标题。 如果您的数据作为因子导入，这真的很有帮助。

DF[] <- lapply(DF, as.character)
colnames(DF) <- DF[1, ]
DF <- DF[-1 ,]

请注意，如果您有大量想要的数字数据或因子，则需要将它们转换回来。 在这种情况下，存储字符数据框，提取所需的行，然后将其应用于原始数据框可能是有意义的

tempDF <- DF
tempDF[] <- lapply(DF, as.character)
colnames(DF) <- tempDF[1, ]
DF <- DF[-1 ,]
tempDF <- NULL

Answer 5

使用 dplyr 和 tidyr 的新答案：

提取所需的列名并转换为列表

library(tidyverse)

col_names <- raw_dta %>% 
  slice(2) %>%
  pivot_longer(
    cols = "X2":"X10", # until last named column
    names_to = "old_names",
    values_to = "new_names") %>% 
  pull(new_names)

删除不正确的行并添加正确的列名

dta <- raw_dta %>% 
  slice(-1, -2) %>% # Removes the rows containing new and original names
  set_names(., nm = col_names)

根据 R 中数据帧中的现有行分配标头

问题描述

5 个解决方案

解决方案1
66 2016-05-20 08:10:52

解决方案2
60 2014-01-06 17:59:06

解决方案3
3 2020-09-26 16:53:50

解决方案4
2 2017-08-06 23:18:21

解决方案5
-1 2020-02-16 21:25:44

根据 R 中数据帧中的现有行分配标头

问题描述

5 个解决方案

解决方案1 66 2016-05-20 08:10:52

解决方案2 60 2014-01-06 17:59:06

解决方案3 3 2020-09-26 16:53:50

解决方案4 2 2017-08-06 23:18:21

解决方案5 -1 2020-02-16 21:25:44

解决方案1
66 2016-05-20 08:10:52

解决方案2
60 2014-01-06 17:59:06

解决方案3
3 2020-09-26 16:53:50

解决方案4
2 2017-08-06 23:18:21

解决方案5
-1 2020-02-16 21:25:44