根據不同 tibble 的截止值更改 tibble 中不同列的值

Question

我有一個 tibble，其中包含每天不同變量的值。

library(lubridate)
library(tidyverse)


df <- tibble::tibble(date = seq.Date(ymd('2019-01-01'), ymd('2019-03-31'), by = 1),
                     high = sample(-5:100, 90, replace = T),
                     low = sample(-25:50, 90, replace = T),
                     sd = sample(5:25, 90, replace = T))

這些變量需要受到在另一個小標題中找到的某些最小值和最大值的約束：

cutoffs <- tibble::tibble(var_name = c('high', 'low', 'sd'),
                      min = c(0, -5, 10),
                      max = c(75, 15, 15))

現在我想通過我的原始 df 並更改它，以便將低於 min 的每個值更改為 min，並將高於 max 的每個值更改為 max，其中 min 和 max 在截止值中找到。

我目前在 for 循環中執行此操作，但我覺得可以在這里使用 map 之類的函數，但我不確定如何使用它。

for (i in 1:3){


a <- cutoffs$var_name[[i]]
  print(a)
  min <- cutoffs$min[[i]]
  max <- cutoffs$max[[i]]

  df <- df %>%
    mutate(!!a := ifelse(!!as.name(a) < min, min, !!as.name(a)),
           !!a := ifelse(!!as.name(a) > max, max, !!as.name(a)))

}

感謝您幫助創建不使用 for 循環的解決方案。 謝謝：）

Answer 1

嘗試這個。 它長期旋轉您的數據框，連接到截止點，然后在適用的情況下使用 case_when 替換值：

library(lubridate)
library(tidyverse)


df <- tibble::tibble(date = seq.Date(ymd('2019-01-01'), ymd('2019-03-31'), by = 1),
                     high = sample(-5:100, 90, replace = T),
                     low = sample(-25:50, 90, replace = T),
                     sd = sample(5:25, 90, replace = T)) %>% 
  pivot_longer(-date, names_to = "var_name", values_to = "value")

df

cutoffs <- tibble::tibble(var_name = c('high', 'low', 'sd'),
                          min = c(0, -5, 10),
                          max = c(75, 15, 15))

df %>% 
  left_join(cutoffs) %>% 
  mutate(value_new = case_when(value > max ~ max,
                           value < min ~ min,
                           TRUE ~ as.double(value))) %>% 
  select(date, var_name, value, value_new, min, max)

根據不同 tibble 的截止值更改 tibble 中不同列的值

問題描述

1 個解決方案

解決方案1
3 已采納 2020-04-01 16:08:23

根據不同 tibble 的截止值更改 tibble 中不同列的值

問題描述

1 個解決方案

解決方案1 3 已采納 2020-04-01 16:08:23

解決方案1
3 已采納 2020-04-01 16:08:23