R：关于如何针对data.frame中的每一行在其他多个条件下计算新列的建议

Question

For every entry in rows i need to compute two variables as new columns in a data.frame depending conditional on more than 60 other columns. 对于行中的每个条目，我需要计算两个变量，作为data.frame中的新列，具体取决于其他60多个列。 I would like your recommendation on how to realize that elegant (while and for, with, ifelse, foreach, by or ddply?). 我想就如何实现这种优雅提出建议（同时使用forifelse，foreach，by或ddply）。 I don't like to do that manually like i did for the first cases in the example code and i don't care for performance. 我不喜欢像示例代码中的第一种情况那样手动进行操作，并且我不关心性能。

Further: Probably i would not need to ask if i would have understood how to use functions like transform (with ddply or by) and what they do. 进一步：也许我不需要问我是否已经了解如何使用诸如transform（通过ddply或by）之类的函数以及它们的作用。 Thus i hope you can recommend good tutorials on that, maybe relating to my case. 因此，我希望您可以为此推荐好的教程，也许与我的情况有关。 I found a lot but in different context and was not able to comprehend it entrily or transcribe it for my case. 我发现了很多东西，但是在不同的情况下，无法根据自己的情况理解或抄写它。

My case: I have three columns for each of 20 events representing the kind and date of that event. 我的情况：对于20个事件，我分别有三列表示该事件的类型和日期。 For each row I need to compute (and save to that data.frame) the difference in time between one special event (depending on whether a special kind happened before or after another) and a date fixed for every entry in rows. 对于每一行，我需要计算（并保存到data.frame中）一个特殊事件（取决于一种特殊事件是发生在另一事件之前还是之后）与为行中每个条目确定的日期之间的时间差。 Furthermore i need to save the date of that event. 此外，我需要保存该事件的日期。

This is how i did (it works, but it is running only through the first cases): 这就是我的工作方式（它可以工作，但仅在前一种情况下运行）：

#event.2 (1. event month), event.3 (1. event year), event.4 (1. event kind), event.5 (2. event month), event.6 (2. event year), ...

df$dit[(!is.na(df$event.2) & !is.na(df$event.3) & !is.na(df$event.4) & !is.na(df$event.5) & !is.na(df$event.6) & !is.na(df$event.7)) 
             & ( 
               (df$event.4 == 3 & ((1/12*df$event.2)+df$event.3) > df$fixdate) & (df$event.7 == 1 | df$event.7 == 2)
               )] = ((1/12*df$event.2)+df$event.3) - df$fixdate
df$date[(!is.na(df$event.2) & !is.na(df$event.3) & !is.na(df$event.4) & !is.na(df$event.5) & !is.na(df$event.6) & !is.na(df$event.7)) 
             & ( 
               (df$event.4 == 3 & ((1/12*df$event.2)+df$event.3) > df$fixdate) & (df$event.7 == 1 | df$event.7 == 2)
             )] = ((1/12*df$event.2)+df$event.3)

df$dit[(!is.na(df$event.2) & !is.na(df$event.3) & !is.na(df$event.4) & !is.na(df$event.5) & !is.na(df$event.6) & !is.na(df$event.7))
             & ( 
                 (df$event.4 == 1 & ((1/12*df$event.2)+df$event.3) > df$fixdate)
               | (df$event.4 == 2 & ((1/12*df$event.2)+df$event.3) > df$fixdate)
               )] = 0
df$date[(!is.na(df$event.2) & !is.na(df$event.3) & !is.na(df$event.4) & !is.na(df$event.5) & !is.na(df$event.6) & !is.na(df$event.7))
             & ( 
               (df$event.4 == 1 & ((1/12*df$event.2)+df$event.3) > df$fixdate)
               | (df$event.4 == 2 & ((1/12*df$event.2)+df$event.3) > df$fixdate)
             )] = df$fixdate

df$dit[(!is.na(df$event.2) & !is.na(df$event.3) & !is.na(df$event.4) & !is.na(df$event.5) & !is.na(df$event.6) & !is.na(df$event.7)) 
             & ( 
                (
                    (df$event.4 == 1 & ((1/12*df$event.2)+df$event.3) < df$fixdate)
                  & (  
                      (df$event.7 == 1 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                    | (df$event.7 == 2 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                    )
                )
               | 
                (
                     (df$event.4 == 2 & ((1/12*df$event.2)+df$event.3) < df$fixdate)
                   & (  
                       (df$event.7 == 1 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                     | (df$event.7 == 2 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                     )
                )
              )] = ((1/12*df$event.5)+df$event.6) - df$fixdate
df$date[(!is.na(df$event.2) & !is.na(df$event.3) & !is.na(df$event.4) & !is.na(df$event.5) & !is.na(df$event.6) & !is.na(df$event.7)) 
             & ( 
               (
                 (df$event.4 == 1 & ((1/12*df$event.2)+df$event.3) < df$fixdate)
                 & (  
                   (df$event.7 == 1 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                   | (df$event.7 == 2 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                 )
               )
               | 
                 (
                   (df$event.4 == 2 & ((1/12*df$event.2)+df$event.3) < df$fixdate)
                   & (  
                     (df$event.7 == 1 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                     | (df$event.7 == 2 & ((1/12*df$event.5)+df$event.6) > df$fixdate)
                   )
                 )
             )] = ((1/12*df$event.5)+df$event.6)

Answer 1

You can define your conditions as expressions and use them within transform . 您可以将条件定义为表达式，并在transform使用它们。 The idea is to factorize your conditions at most as possible . 这个想法是要尽可能地考虑您的情况。

COND1 <- expression(!is.na(event.2) & !is.na(event.3) & 
                    !is.na(event.4) & !is.na(event.5) & 
                     !is.na(event.6) & !is.na(event.7))
COND2 <- expression(event.4 == 3 & ((1/12*event.2)+event.3) > fixdate) & 
                                    (event.7 == 1 | event.7 == 2))
COND3 <- expression(event.4 == 1 & ((1/12*event.2)+event.3) > fixdate)
COND4 <- expression(event.4 == 2 & ((1/12*event.2)+event.3) > fixdate)
### you continue here with the rest of conditions....

Then using them within transform you can do something like: 然后在transform使用它们，您可以执行以下操作：

transform(df, date = ifelse(eval(COND1) & eval(COND2),((1/12*event.2)+event.3),NA),
transform(df, date = ifelse(eval(COND1) & (eval(COND3)|eval(COND4)),fixdate,NA))
## Note also that the seond "dit" variable is deduced from "date"
transform(df,dit=date-fixdate)

R：关于如何针对data.frame中的每一行在其他多个条件下计算新列的建议

问题描述

1 个解决方案

解决方案1
1 已采纳 2013-11-29 15:54:12

R：关于如何针对data.frame中的每一行在其他多个条件下计算新列的建议

问题描述

1 个解决方案

解决方案1 1 已采纳 2013-11-29 15:54:12

解决方案1
1 已采纳 2013-11-29 15:54:12