如何基於R中不同列中行上方/下方的行中的值創建列

Question

我一直在考慮這個問題並且無法提出解決方案。 我在列X中有數據，我想用它來創建Z列中的數據。我希望Z為1，直到X中連續有兩個0，然后全部為0。 此外，在列WI中，當從下往上看Y時，最終元素為1，Y連續包含兩個0。 希望有道理。 我已經列出了Z列和W列，他們最終應該如何看待。 我正在嘗試使用索引，但是我很難弄清楚如何引用Z行的行之后的行X（因為Z的第1行中的值是基於值的） X）中的第2行和第3行。 這些應該是兩個獨立的功能，一個用於查看開頭，另一個用於查看結尾。 它們將分別應用於每一行，因此列X將產生兩列，如下所示Z，以及另一列，在這種情況下將是全0。 謝謝你的幫助！

** * ** *我將列名從ABCD更改為XYZW以避免混淆。 對不起，當我輸入它的時候沒想到這個！

** * ** * ** * *我真的希望能夠在沒有函數或循環的情況下執行此操作，只需使用索引。 我想我可以使用函數解決它，但由於它是一個大型數據集，我希望它盡可能快。

code    X   Y   Z   W
A   1   0   1   0
A   1   0   1   0
A   0   0   1   0
A   1   0   1   0
A   1   0   1   0
A   1   0   1   0
A   1   0   1   0
A   0   0   1   0
A   1   0   1   0
A   0   0   0   0
A   0   0   0   0
A   1   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
B   0   0   0   0
B   0   0   0   0
B   0   0   0   0
B   0   0   0   0
B   1   1   0   0
B   0   0   0   0
B   1   0   0   0
B   0   0   0   0
B   1   0   0   0
B   0   0   0   0
B   0   0   0   0
B   1   0   0   0
B   0   1   0   0
B   0   0   0   0
B   0   0   0   0
B   0   1   0   1
B   0   1   0   1
B   0   1   0   1
B   0   0   0   1
B   0   1   0   1
B   0   1   0   1

與aggregate一起使用的以下函數應該給出我正在尋找的結果。 感謝Tyler開始這項功能。 我仍然覺得應該有一個更簡單的方法來做到這一點，但現在應該這樣做。 感謝大家的投入！

我想我已經根據Tyler的代碼弄清楚了，只是做了一些改動。 我將使用聚合應用此函數，它應該都可以解決。 感謝所有的投入！

pat.finder <- function(var, value=0, fill1=1, fill2=0, rev=FALSE, seq=2){

 if(var[1]==0 & rev==FALSE){

 j<- rep(0,length(var))} else if(var[length(var)]==0 & rev == TRUE){

 j<- rep(0,length(var))} else{

 x <- if(rev) rle(rev(var)) else rle(var)
 n <- which(x[[1]]>(seq-1) & x[[2]]==value)[1]-1
 i <- sum(x[[1]][1:n])
 j <- if(rev){
            rev(c(rep(fill1, i), rep(fill2, length(var)-i)))
       } else {
            c(rep(fill1, i), rep(fill2, length(var)-i))
       }
}

 return(j)
}

Answer 1

可能有更快的方法，但這就是我提出的方法：

dat <- read.table(text="code    A   B   C   D #read in your data
A   1   0   1   0
A   1   0   1   0
A   0   0   1   0
A   1   0   1   0
A   1   0   1   0
A   1   0   1   0
A   1   0   1   0
A   0   0   1   0
A   1   0   1   0
A   0   0   0   0
A   0   0   0   0
A   1   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
A   0   0   0   0
B   0   0   0   0
B   0   0   0   0
B   0   0   0   0
B   0   0   0   0
B   1   1   0   0
B   0   0   0   0
B   1   0   0   0
B   0   0   0   0
B   1   0   0   0
B   0   0   0   0
B   0   0   0   0
B   1   0   0   0
B   0   1   0   0
B   0   0   0   0
B   0   0   0   0
B   0   1   0   1
B   0   1   0   1
B   0   1   0   1
B   0   0   0   1
B   0   1   0   1
B   0   1   0   1", header=T)

現在的代碼：

A.rle <- rle(dat$A)
n <- which(A.rle[[1]]>1 & A.rle[[2]]==0)[1]-1
i <- sum(A.rle[[1]][1:n])
dat$C <- c(rep(1, i), rep(0, nrow(dat)-i))

B.rle <- rle(rev(dat$B))
n2 <- which(B.rle[[1]]>1 & B.rle[[2]]==0)[1]-1
i2 <- sum(B.rle[[1]][1:n2])
dat$D <- rev(c(rep(1, i2), rep(0, nrow(dat)-i2)))

編輯：我不完全理解你的想法，所以我試圖創建一個多功能的功能，以滿足您的需求。 使用rev=TRUE查看結尾：

pat.finder <- function(var, value=0, fill1=1, fill2=0, rev=FALSE, seq=2){
    x <- if(rev) rle(rev(var)) else rle(var)
    n <- which(x[[1]]>(seq-1) & x[[2]]==value)[1]-1
    i <- sum(x[[1]][1:n])
    j <- if(rev){
               rev(c(rep(fill1, i), rep(fill2, length(var)-i)))
          } else {
               c(rep(fill1, i), rep(fill2, length(var)-i))
          }
    return(j)
}

#TRY IT OUT
pat.finder(dat$B, rev=TRUE)

transform(dat, C=pat.finder(A), D = pat.finder(B, rev=TRUE)) #what I think you want

transform(dat, C=pat.finder(A, fill1='foo', fill2='bar'), 
    D = pat.finder(A, rev=TRUE))

transform(dat, C=pat.finder(A, value=1), D = pat.finder(B, rev=TRUE))

Answer 2

考慮sum(dat$A[i:(i+1)]) 。 如果你連續有兩個零，那就是零。 使用循環（或lapply ）或其中一個運行函數來查找返回零的最小“i”，並且您已經找到了將C列“從”切換到零的位置。

但我真的要問：“你要解決的問題是什么？” 我幾乎可以保證，如果你告訴我們A列和B列中的數據來自何處，我們可以向您展示一種更直接的方法來識別您在C列和D列中設置的斷點。

PS：一旦為dat$C設置了解決方案，只需執行相同操作，但從“imax”向下循環到1以獲取dat$D

Answer 3

這可能適合您的需求（僅A列）。 如果您可以更具體地了解您正在尋找什么，那么董事會可以進一步提供幫助。

## read in your data
df1 = read.table(text="code    A   B   C   D 
A   1   0   1   0
A   1   0   1   0
...
")

## create forward-lagged A column
require(taRifx)
df1$lagA = shift(df1$A,wrap=F,pad=T)

myfun1 = function(x,y) {
     BB = x + y
     BB = ifelse(BB > 0, 1, 0)
     BB
}

df1$A2 = apply(df1[,c(2,6)], 1, function(x,y) myfun1(x[1],x[2]))
tvec = rep(1,which(df1$A2 == 0)[1] -1)
bvec = vector(length = nrow(df1) - which(df1$A2 == 0)[1] + 1, mode="numeric")

## the column you are looking for:
df1$nA = c(tvec,bvec)

Answer 4

假設問題中顯示的數據框是DF 。 那么如果x的第i個和下一個元素是0，則pmax結果的第i個元素是0，否則結果的第i個元素是1。 我們在末尾追加1，因為'x'的最后一個元素沒有下一個元素。 然后，我們將其與0進行比較，然后cummin將此過程發現的前0個移動。

two0 <- function(x) cummin(c(pmax(x[-1], x[-length(x)]), 1) != 0)
DF.out <- transform(DF, Z = two0(X), W = rev(two0(rev(Y))))

!=0使得結果為2 two0 integer 。 如果我們希望我們可以刪除它，在這種情況下結果將是numeric 。

編輯：澄清整數/數字方面。

如何基於R中不同列中行上方/下方的行中的值創建列

問題描述

4 個解決方案

解決方案1
1 已采納 2012-02-23 19:35:30

解決方案2
1 2012-02-23 19:55:54

解決方案3
1 2012-02-23 20:05:42

解決方案4
1 2012-02-23 22:31:54

如何基於R中不同列中行上方/下方的行中的值創建列

問題描述

4 個解決方案

解決方案1 1 已采納 2012-02-23 19:35:30

解決方案2 1 2012-02-23 19:55:54

解決方案3 1 2012-02-23 20:05:42

解決方案4 1 2012-02-23 22:31:54

解決方案1
1 已采納 2012-02-23 19:35:30

解決方案2
1 2012-02-23 19:55:54

解決方案3
1 2012-02-23 20:05:42

解決方案4
1 2012-02-23 22:31:54