循環遍歷 r 列的優雅方式

Question

假設我有一個 dataframe：

set.seed(10)

    col_a <- (c("mouse", "dog", "rabbit", "cat", "horse", "monkey", "pig", "shark", "flea","ant"))
    col_b <- (c(round(rnorm(10), digits=0)))
    col_c <- (c(round(rnorm(10), digits=0)))
    col_d <- (c(round(rnorm(10), digits=0)))
    col_e <- (c(round(rnorm(10), digits=0)))
    
df <- data.frame(col_a, col_b, col_c, col_d, col_e)

df
           col_a col_b col_c col_d col_e
    > 1   mouse     0     0     0     0
    > 2     dog     0     0     0     1
    > 3  rabbit    -2     0    -1    -1
    > 4     cat     0     0     1     0
    > 5   horse     1     2     0     0
    > 6  monkey     1     1    -1     1
    > 7     pig     0    -1     0     1
    > 8   shark    -2     0     0    -1
    > 9    flea     0     1     0     0
    > 10    ant     0     2     1     1

>

我想用“鼠標”的值替換“鯊魚”對應的“col_b”和“col_d”中的值。 我想使用列標題和 col_a 中的值進行索引。

我可以通過以下兩個步驟完成此操作：

df[df$col_a == “shark”, “col_b”] <- df[df$col_a == “mouse” , “col_b”]
df[df$col_a == “shark”, “col_d”] <- df[df$col_a == “mouse” , “col_d”]

對於許多列，代碼變得相當笨重。 有沒有辦法用 for 循環或應用 function 來簡化這個？

Answer 1

你可以這樣做：

library(tidyverse)
df %>%
  mutate(across(c(col_b, col_d), ~if_else(col_a == 'shark', .[col_a == 'mouse'], .)))

across csn，您可以非常靈活地定義要進行替換的列。

請注意，我使用與您相同的隨機種子得到不同的結果，所以我選擇了另一個，即 set.seed(110)

輸入數據：

    col_a col_b col_c col_d col_e
1   mouse     0     1     0     0
2     dog     1     1    -2     0
3  rabbit     1     2     1     0
4     cat     1    -1    -1    -1
5   horse     0     2     1    -1
6  monkey     1     0     2     0
7     pig     0    -2    -1     1
8   shark     1     1    -1     0
9    flea    -2     2     0    -1
10    ant     0    -2     0     0

Output 數據：

    col_a col_b col_c col_d col_e
1   mouse     0     1     0     0
2     dog     1     1    -2     0
3  rabbit     1     2     1     0
4     cat     1    -1    -1    -1
5   horse     0     2     1    -1
6  monkey     1     0     2     0
7     pig     0    -2    -1     1
8   shark     0     1     0     0
9    flea    -2     2     0    -1
10    ant     0    -2     0     0

Answer 2

如果您要處理許多要指定的情況，使用長數據可能會更容易。 下面，我制作了一個長版本的數據，一個要交換的名稱查找表，以及一個要在其中進行交換的列列表。

library(tidyverse)
df_long = pivot_longer(df, -col_a)
chg_tbl = tibble(col_a = c("shark", "mouse"), new   = c("mouse", "shark"))
cols <- c("col_b", "col_d")

然后這些可以應用於長表：

df_long %>%
  left_join(chg_tbl) %>%
  transmute(col_a = if_else(name %in% cols, coalesce(new, col_a), col_a), 
            name, value) %>%
  pivot_wider(names_from = name, values_from = value)

Answer 3

您不必為每一列單獨執行此操作。 您可以一起替換多個列。

cols <- c('col_b', 'col_d')
df[df$col_a == "shark", cols] <- df[df$col_a == "mouse" , cols]
df

這是一個簡化的示例，因為相同的set.seed給了我不同的值。

df <- data.frame(col1 = letters[1:5], col2 = 1:5, col3 = 5:1, col4 = 1:5)
df

#  col1 col2 col3 col4
#1    a    1    5    1
#2    b    2    4    2
#3    c    3    3    3
#4    d    4    2    4
#5    e    5    1    5

cols <- c('col2', 'col4')
df[df$col1 == "d", cols] <- df[df$col1 == "a" , cols]
df

#  col1 col2 col3 col4
#1    a    1    5    1
#2    b    2    4    2
#3    c    3    3    3
#4    d    1    2    1
#5    e    5    1    5

循環遍歷 r 列的優雅方式

問題描述

3 個解決方案

解決方案1
2 已采納 2022-02-16 23:46:06

解決方案2
0 2022-02-16 23:47:10

解決方案3
0 2022-02-17 01:38:21

循環遍歷 r 列的優雅方式

問題描述

3 個解決方案

解決方案1 2 已采納 2022-02-16 23:46:06

解決方案2 0 2022-02-16 23:47:10

解決方案3 0 2022-02-17 01:38:21

解決方案1
2 已采納 2022-02-16 23:46:06

解決方案2
0 2022-02-16 23:47:10

解決方案3
0 2022-02-17 01:38:21