該命令用於從現有 data.frame 中提取 2 列

Question

我創建了一個包含 5 列的 data.frame，並希望將其中的兩列提取到一個單獨的 data.frame 中。

現在我希望為每個性別創建 2 個數據框（因此是先前數據的子集）

我已經提取了性別和身高列，但希望使用（女性和身高）和（男性和身高）創建 2 個數據框

Answer 1

我強烈建議將來包含示例代碼，但我想我理解你的目的。

有很多方法可以做到這一點，所以我會提到一些以及為什么你會選擇這種方法。

方法1（我最有可能使用的一種）：

library(dplyr)
library(purrr)
data %>% nest_by(gender)

你留下了一個包含 2 列的 tibble（如 data.frame），其中 1 是性別，另一列是包含您想要的高度的數據。 現在，您可以使用lapply或map等函數遍歷數據列。 然后得到你需要的東西並減少它。 把所有東西放在一起，可以減少打字量。

方法2（只是它的子集方法）：

data_female <- data[data$gender == "Female", ]
data_male   <- data[data$gender == "Male"  , ]

這樣做的缺點是您不能使用 lapply 或 map 函數來迭代兩組數據。 如果您要完全分開對待它們並用數據做完全不同的事情，這可能是您最好的選擇