簡體   English   中英

如何遍歷變量列表並將值添加到 R 中的 output dataframe?

[英]How to loop through a variable list and add values to an output dataframe in R?

我正在嘗試編寫一個 function,它采用 dataframe、一個主變量和一個變量列表,並使用 cor.test function。 我正在尋找它返回帶有變量名稱和相關系數和 p 值的 dataframe。

我到目前為止的代碼是:

myCorTest = function(dat, mainVar, varlist)
{
  result = data.frame()
  mainV = dat[[mainVar]]
  for (i in 1:length(varlist)){
    var_select = dat[[varlist[i]]]
    x = cor.test(mainV, var_select)
    R = x$estimate
    p = x$p.value
    result = cbind(mainVar, varlist, R, p)
}
  return(result)
}

我希望 output 看起來像這樣:

> myCortest (chol, "bmi", c("sbp", "dbp", "vldl", "hdl", "ldl"))
    var1 var2     R             p
sbp  bmi sbp  0.14927952  3.877523e-02
dbp  bmi dbp  0.42636371  6.997094e-10
vldl bmi vldl 0.41033688  4.107925e-09
hdl  bmi hdl  -0.11984422 9.956239e-02
ldl  bmi ldl  0.03449137  6.366170e-01

但我的輸出是:

> myCorTest(chol, "bmi", c("sbp","dbp", "vldl", "hdl", "ldl"))
     mainVar varlist R                    p                  
[1,] "bmi"   "sbp"   "0.0344913724648321" "0.636617020943996"
[2,] "bmi"   "dbp"   "0.0344913724648321" "0.636617020943996"
[3,] "bmi"   "vldl"  "0.0344913724648321" "0.636617020943996"
[4,] "bmi"   "hdl"   "0.0344913724648321" "0.636617020943996"
[5,] "bmi"   "ldl"   "0.0344913724648321" "0.636617020943996"

您的代碼的問題是 cbind 創建一個矩陣,其中矩陣需要其中的所有值具有相同的數據類型。 你需要的是創建一個data.frame。 嘗試這個:

myCorTest = function(dat, mainVar, varlist)
{
# Create empty data.frame to store all results with its data types
  result = data.frame(var1=character(),
                      var2=character(),
                      R=numeric(),
                      p=numeric()
                      )
  mainV = dat[[mainVar]]
  for (i in 1:length(varlist)){
    var_select = dat[[varlist[i]]]
    x = cor.test(mainV, var_select)
    R = x$estimate
    p = x$p.value
    result_temp = data.frame(mainVar, varlist[i], R, p)
    row.names(result_temp) = varlist[i]
    result = rbind(result,result_temp)
}
colnames(result) = c("var1","var2","R","p")
  return(result)
}

myCorTest(chol, "bmi", c("sbp", "dbp", "vldl", "hdl", "ldl"))

在循環中增長對象/數據幀是低效的。 我會使用lapply

myCorTest = function(dat, mainVar, varlist) {
  mainV = dat[[mainVar]]
  do.call(rbind, lapply(varlist, function(x) {
    temp = cor.test(mainV, dat[[x]])
    R = temp$estimate
    p = temp$p.value
    data.frame(mainVar = mainVar, varlist = x, R, p)
  })) -> result
  rownames(result) <- NULL
  return(result)
}

myCorTest(mtcars, 'mpg', c('cyl', 'am'))

#  mainVar varlist      R        p
#1     mpg     cyl -0.852 6.11e-10
#2     mpg      am  0.600 2.85e-04

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM