簡體   English   中英

模擬相關計數變量和連續變量之間的數據

[英]Simulating data between correlated count variable and a continuous variable

有誰知道我如何模擬具有計數變量和連續變量之間相關性的數據? 現在,我最好的想法是只轉換計數變量以使其大致正常,然后使用此 R 代碼模擬數據:

set.seed(2018) 
x = rnorm(n = 1000, mean = 0, sd = 1) 
y = rnorm(n = 1000, mean = .29*x, sqrt(1-.3^2))      
cor(x,y)

但是,我真的認為如果我實際上可以使 Y 成為計數變量會更好(因為它們通常傾向於右偏)。 另外,我希望能夠指定 x 和 y 之間的特定相關性。 例如,模擬 x 和 y 之間相關性為 0.5 的數據等。

編輯:我還在尋求幫助!

您可以使用runif模擬連續變量,然后將結果作為 rpois 的rpois (rate) 參數提供:

set.seed(1)

continuous <- runif(100, 0, 10)
counts <- rpois(100, continuous)
plot(continuous, counts)

cor(counts, continuous)
#> [1] 0.7852701

代表 package (v0.3.0) 於 2020 年 12 月 11 日創建

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM