[英]Point-Biserial Correlation in R
我有如下所示的示例數據(230 條記錄):
Salary Success - Failure
23,300 1
44,000 1
12,400 0
23,000 1
55,000 0
…
Success =1
Fail = 0
我正在嘗試將連續變量(薪水)與二進制變量(成功 - 失敗 - 相關)相關聯我需要使用點雙列相關的上述數據集的示例 R 代碼。
我想你的data.frame
是df
:
X = df$Salary
Y = df[,2]
a = sqrt(sum(Y)*(1-sum(Y))/(length(Y)**2))
point.bis.corr = a*(mean(X[Y==1])-mean(X[Y==0]))/sd(X)
如果數據框名稱是 df
biserial.cor(Salary,Success, level=2)
或者
X = df$Salary
Y = df$Success
a = sqrt(sum(Y)*(length(Y)-sum(Y))/(length(Y)**2))
point.bis.corr = a*(mean(X[Y==1])-mean(X[Y==0]))/sd(X)
point.bis.corr
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.