簡體   English   中英

R 中的點雙列相關

[英]Point-Biserial Correlation in R

我有如下所示的示例數據(230 條記錄):

Salary  Success - Failure
23,300  1
44,000  1
12,400  0
23,000  1
55,000  0
    …
Success =1  

Fail = 0    

我正在嘗試將連續變量(薪水)與二進制變量(成功 - 失敗 - 相關)相關聯我需要使用點雙列相關的上述數據集的示例 R 代碼。

我想你的data.framedf

X = df$Salary
Y = df[,2]

a = sqrt(sum(Y)*(1-sum(Y))/(length(Y)**2))

point.bis.corr = a*(mean(X[Y==1])-mean(X[Y==0]))/sd(X)

如果數據框名稱是 df

biserial.cor(Salary,Success, level=2)

或者

X = df$Salary
Y = df$Success

a = sqrt(sum(Y)*(length(Y)-sum(Y))/(length(Y)**2))

point.bis.corr = a*(mean(X[Y==1])-mean(X[Y==0]))/sd(X)

point.bis.corr

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM