[英]What the command is for extracting 2 columns from existing data.frame
我創建了一個包含 5 列的 data.frame,並希望將其中的兩列提取到一個單獨的 data.frame 中。
現在我希望為每個性別創建 2 個數據框(因此是先前數據的子集)
我已經提取了性別和身高列,但希望使用(女性和身高)和(男性和身高)創建 2 個數據框
我強烈建議將來包含示例代碼,但我想我理解你的目的。
有很多方法可以做到這一點,所以我會提到一些以及為什么你會選擇這種方法。
方法1(我最有可能使用的一種):
library(dplyr)
library(purrr)
data %>% nest_by(gender)
你留下了一個包含 2 列的 tibble(如 data.frame),其中 1 是性別,另一列是包含您想要的高度的數據。 現在,您可以使用lapply
或map
等函數遍歷數據列。 然后得到你需要的東西並減少它。 把所有東西放在一起,可以減少打字量。
方法2(只是它的子集方法):
data_female <- data[data$gender == "Female", ]
data_male <- data[data$gender == "Male" , ]
這樣做的缺點是您不能使用 lapply 或 map 函數來迭代兩組數據。 如果您要完全分開對待它們並用數據做完全不同的事情,這可能是您最好的選擇
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.