[英]pearson correlation
我有一個 dataframe 如下:
x <- data.frame(Name=c("a", "b","c", "d", "e"),A=(1:5), B=(2:6), C=(7:11), D=c(1,1,1,1,1))
I want to get a dataframe including all the pearson coefficients of a vs b, a vs c, a vs d, a vs e, b vs a, b vs c, b vs d, b vs e....etc (excluding自我比較,即 aa、bb 等)。
換句話說,我想更改以下 dataframe
A B C D
a 1 2 7 1
b 2 3 8 1
c 3 4 9 1
d 4 5 10 1
e 5 6 11 1
結果 dataframe 像這樣
a b 0.989143436
a c 0.963282002
a d 0.93048421
a e 0.89585579
b c 0.9922798
b d 0.974216034
b e 0.951427811
c d 0.994675789
c e 0.982264673
d e 0.996357429
請指導有效的方法。
編輯
感謝 Michaelv2 的幫助。
根據建議的代碼,我發現結果如下:
X1 X2 value
1 A A 1
2 B A 1
3 C A 1
4 D A NA
5 A B 1
6 B B 1
7 C B 1
8 D B NA
9 A C 1
10 B C 1
11 C C 1
12 D C NA
13 A D NA
14 B D NA
15 C D NA
16 D D 1
錯誤消息是“警告消息:在 cor(x[2:5], method = "pearson"):標准偏差為零”
在我看來,我可能濫用了代碼,您能否進一步指導如何進一步解決這個問題? 謝謝你。
您可以使用以下內容:
require(reshape)
y <- as.data.frame(t(x[2:5]), stringsAsFactors=FALSE)
colnames(y) <- x[[1]]
yrho <- melt(cor(y, method="pearson"))
subset(yrho, yrho$X1 != yrho$X2)
結果:
X1 X2 value
2 b a 0.9891434
3 c a 0.9632820
4 d a 0.9304842
5 e a 0.8958558
6 a b 0.9891434
8 c b 0.9922798
9 d b 0.9742160
10 e b 0.9514278
11 a c 0.9632820
12 b c 0.9922798
14 d c 0.9946758
15 e c 0.9822647
16 a d 0.9304842
17 b d 0.9742160
18 c d 0.9946758
20 e d 0.9963574
21 a e 0.8958558
22 b e 0.9514278
23 c e 0.9822647
24 d e 0.9963574
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.