如何使用特定的函数和条件改变数据帧中的新列？ Tidyverse/R

Question

首先，我找不到与我的问题相关的问题，如果已经回答了这个问题，我深表歉意。

我有一个包含一些列的数据框，我想使用特定的 ecation 计算一个新值。 我想我必须使用 tidyverse 中的mutate() ，但我想避免有一个或多个 0 值的行/样本。 我不知道在使用mutate()时如何检查是否有 0 。 另外，我不知道如何应用我的特定公式来创建新列。

我在这里留下一个代码来创建一个数据框作为我的问题的一个例子。

set.seed(123)
df <- data.frame(
  time = seq(now(), now()+hours(11),by='hours'),
  a = sample(0:100,12),
  b = sample(0:100,12),
  c = sample((0:20)/1000,12))

df[1:3,]$a <- 0
df[3:5,]$b <- 0
df[3:4,]$c <- 0

# function: M = a*b+(1-e^(-c/2))
# if any 0 in the row -> M = NA
# else: apply function

函数可以写成

a*b*(1-exp(-c/2))

最终的 df 每小时（行）应该有 4 列（a、b、c 和新计算的 M），但是当a | b | c == 0, M = NA a | b | c == 0, M = NA a | b | c == 0, M = NA 。

我将非常感谢每一个小小的帮助。 干杯!

编辑：真正的函数比这个例子更复杂，所以如果一个术语 (a,b,c,...) 是 0，结果 M 是 0，这并不总是正确的。对不起，我没有意识到这个假设对于简化方程是正确的。 但我想避免任何 0 值，因为它们来自监测生理变量，我知道如果样本中的一个值是 0，那么样本是错误的，所以不适用。

Answer 1

如果a 、 b或c任何a为 0 ，则将M返回为 0 ，可以将其更改为NA 。

library(dplyr)

df %>%
  mutate(M = a*b*(1-exp(-c/2)), 
         M = na_if(M, 0))

#                  time  a  b     c         M
#1  2021-10-18 19:41:56  0 90 0.013        NA
#2  2021-10-18 20:41:56  0 56 0.016        NA
#3  2021-10-18 21:41:56  0  0 0.000        NA
#4  2021-10-18 22:41:56 13  0 0.000        NA
#5  2021-10-18 23:41:56 66  0 0.011        NA
#6  2021-10-19 00:41:56 41 71 0.014 20.305847
#7  2021-10-19 01:41:56 49 25 0.009  5.500115
#8  2021-10-19 02:41:56 42  6 0.012  1.507473
#9  2021-10-19 03:41:56 97 41 0.017 33.661237
#10 2021-10-19 04:41:56 24 97 0.008  9.293401
#11 2021-10-19 05:41:56 89 82 0.019 69.002718
#12 2021-10-19 06:41:56 68 35 0.015 17.783230

如何使用特定的函数和条件改变数据帧中的新列？ Tidyverse/R

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-10-18 11:47:35

如何使用特定的函数和条件改变数据帧中的新列？ Tidyverse/R

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-10-18 11:47:35

解决方案1
1 已采纳 2021-10-18 11:47:35