[英]Simulating data between correlated count variable and a continuous variable
有誰知道我如何模擬具有計數變量和連續變量之間相關性的數據? 現在,我最好的想法是只轉換計數變量以使其大致正常,然后使用此 R 代碼模擬數據:
set.seed(2018)
x = rnorm(n = 1000, mean = 0, sd = 1)
y = rnorm(n = 1000, mean = .29*x, sqrt(1-.3^2))
cor(x,y)
但是,我真的認為如果我實際上可以使 Y 成為計數變量會更好(因為它們通常傾向於右偏)。 另外,我希望能夠指定 x 和 y 之間的特定相關性。 例如,模擬 x 和 y 之間相關性為 0.5 的數據等。
編輯:我還在尋求幫助!
您可以使用runif
模擬連續變量,然后將結果作為 rpois 的rpois
(rate) 參數提供:
set.seed(1)
continuous <- runif(100, 0, 10)
counts <- rpois(100, continuous)
plot(continuous, counts)
cor(counts, continuous)
#> [1] 0.7852701
由代表 package (v0.3.0) 於 2020 年 12 月 11 日創建
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.