簡體   English   中英

從行的子集中隨機選擇

[英]Randomly selecting from a subset of rows

我有塊[[i]]中的數據,其中i = 4到6就像這樣

  Stimulus Response   PM
  stretagost     s  <NA>
  colpublo       s  <NA>
  zoning         d  <NA>
  epilepsy       d  <NA>
  resumption     d  <NA>
  incisive       d  <NA>

每個塊[[i]]中有440行。

目前我的腳本為每15個試驗中的一個隨機選擇的項目做了一些事情(除了前110個試驗每110個,我也設置好所以我永遠不能選擇小於2的行),每個塊[[i]] 。

我希望能做的是從每15個試驗中做1個項目,隨機選擇只有那些響應==“d”的項目。 也就是說,我不希望我的隨機選擇永遠做到響應==“s”的行。 我不知道如何實現這一點,但這是我到目前為止的腳本,它只是從每個15中隨機選擇1行:

PMpositions <- list()
for (i in 4:6){ 
  positions <- c() 
  x <- 0
  for (j in c(seq(5, 110-15, 15),seq(115, 220-15, 15),seq(225, 330-15, 15),seq(335,440-15, 15)))
  {  
    sub.samples <- setdiff(1:15 + j, seq(x-2,x+2,1))
    x <- sample(sub.samples, 1)
    positions <- c(positions,x)
  }  
  PMpositions[[i]] <- positions
  blocks[[i]]$Response[PMpositions[[i]]] <- Wordresponse
  blocks[[i]]$PM[PMpositions[[i]]] <- PMresponse 
  blocks[[i]][PMpositions[[i]],]$Stimulus <- F[[i]]
}

我最后這樣處理它

PMpositions <- list()
for (i in 1:3){ 
startingpositions <- c(seq(5, 110-15, 15),seq(115, 220-15, 15),seq(225, 330-15,    
15),seq(335, 440-15, 15))
positions <- c() 
x <- 0
for (j in startingpositions)
{  
sub.samples <- setdiff(1:15 + j, seq(x-2,x+2,1))
x <- sample(sub.samples, 1)
positions <- c(positions,x)
} 
repeat {
positions[which(blocks[[i]][positions,2]==Nonwordresponse)]<- 
startingpositions[which(blocks[[i]][positions,2]==Nonwordresponse)]+sample(1:15, 
size=length(which(blocks[[i]][positions,2]==Nonwordresponse)), replace = TRUE)
distancecheck<- which ( abs( c(positions[2:length(positions)],0)-positions ) < 2) 
if (length(positions[which(blocks[[i]][positions,2]==Nonwordresponse)])== 0  & length  
(distancecheck)== 0) break
 }
PMpositions[[i]] <- positions
blocks[[i]]$Response[PMpositions[[i]]] <- Wordresponse
blocks[[i]]$PM[PMpositions[[i]]] <- PMresponse 
blocks[[i]][PMpositions[[i]],]$Stimulus <- as.character(NF[[i]][,1])
Nonfocal[[i]] <- blocks[[i]]
}

我意識到什么時候卡在重復循環上,有時我連續響應15“s”! 衛生署。 很高興能夠解決這個問題但是我可以解決這個問題,當我遇到困難時我只是再次運行它(d / s的位置是隨機生成的)。

編輯:這是一種不同的方法,只采樣'd'行。 它是相當自定義的代碼,但主要思想是使用prob參數僅對“Response”==“d”的行進行采樣,並將所有其他行的采樣可能設置為零。

Response <- rep(c("s","d"),220)
chunk <- sort(rep(1:30,15))[1:440] # chunks of 15 up to 440

# function to randomly sample from each set of 15 rows
sampby15 <- function(i){
    sample((1:440)[chunk==i], 1, 
        # use the `prob` argument to only sample 'd' values
        prob=rep(1,length=440)[chunk==i]*(Response=="d")[chunk==i])
}
s <- sapply(1:15,FUN=sampby15) # apply to each chunk to get sample rows
Response[s] # confirm only 'd' values

# then you have code to do whatever to those rows...

所以你想要在每個塊上運行的真正基本功能是這樣的:

subsetminor <- function(dataset, only = "d", rows = 1) { 
  remainder <- subset(dataset, Response == only)
  return(remainder[sample(1:nrow(remainder), size = rows), ])
}

我們可以稍微修改它以避免彼此相鄰的行:

subsetminor <- function(dataset, only = "d", rows = 1) { 
  remainder <- subset(dataset, Response == only)
  if(rows > 1) {
    sampled <- sample(1:nrow(remainder), size = rows)
    pairwise <- t(combn(sampled, 2))
    while(any(abs(pairwise[, 1] - pairwise[, 2]) <= 2)) {
      sampled <- sample(1:nrow(remainder), size = rows)
      pairwise <- t(combn(sampled, 2))
    }
  }
  out <- remainder[sampled, ]
  return(out)
}

以上內容可以簡化/干掉很多,但它應該完成工作。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM