[英]What the command is for extracting 2 columns from existing data.frame
我创建了一个包含 5 列的 data.frame,并希望将其中的两列提取到一个单独的 data.frame 中。
现在我希望为每个性别创建 2 个数据框(因此是先前数据的子集)
我已经提取了性别和身高列,但希望使用(女性和身高)和(男性和身高)创建 2 个数据框
我强烈建议将来包含示例代码,但我想我理解你的目的。
有很多方法可以做到这一点,所以我会提到一些以及为什么你会选择这种方法。
方法1(我最有可能使用的一种):
library(dplyr)
library(purrr)
data %>% nest_by(gender)
你留下了一个包含 2 列的 tibble(如 data.frame),其中 1 是性别,另一列是包含您想要的高度的数据。 现在,您可以使用lapply
或map
等函数遍历数据列。 然后得到你需要的东西并减少它。 把所有东西放在一起,可以减少打字量。
方法2(只是它的子集方法):
data_female <- data[data$gender == "Female", ]
data_male <- data[data$gender == "Male" , ]
这样做的缺点是您不能使用 lapply 或 map 函数来迭代两组数据。 如果您要完全分开对待它们并用数据做完全不同的事情,这可能是您最好的选择
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.