簡體   English   中英

將數據集分為R中的回歸組和對照組

[英]separate a dataset into a regression group and a control group in R

這很可能是設計問題。 如果我打算進行回歸,則Y = X1 + X2 + X3 + X4 + X5,並且我的數據中有X1到X10以及Y。 將數據集分為回歸樣本和對照組的最佳方法是什么,因此我可以對回歸樣本進行回歸並使用對照組驗證模型? 我應該只創建一個包含隨機數的列並以這種方式分開嗎? 謝謝。

如果您有一個名為df的數據框,其中包含一排行和上面的列,則可以按以下方式對n個行(在本示例中為67%)進行采樣,並創建采樣組和對照組:

x <- sample(nrow(df), 0.67*nrow(df))
sampledf <- df[x, ]
controldf <- df[-x, ]

如果要重新排列行號,可以分配新的順序行號,如下所示:

row.names(sampledf) <- seq(1:nrow(sampled))
row.names(controldf) <- seq(1:nrow(controldf))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM