![](/img/trans.png)
[英]How to add the spearman correlation p value along with correlation coefficient to ggpairs?
[英]How to calculate p value and correlation coefficient for Spearman’s correlation of differential expression data with 40000 permutations?
我有 3 個組,我們稱它們為 g1、g2、g3。 它們中的每一個都是條件組之間的分析結果,g1看起來像這樣
geneSymbol logFC t P.Value adj.P.Val Beta
EXykpF1BRREdXnv9Xk MKI67 -0.3115880 -5.521186 5.772137e-07 0.008986062 4.3106665
0Tm7hdRJxd9zoevPlA CCL3L3 0.1708020 4.162115 9.109798e-05 0.508784638 0.6630544
u_M5UdFdhg3lZ.qe64 UBE2G1 -0.1528149 -4.031466 1.430822e-04 0.508784638 0.3354065
lkkLCXcnzL9NXFXTl4 SEL1L3 -0.2138729 -3.977482 1.720517e-04 0.508784638 0.2015945
0Uu3XrB6Bd14qoNeuc ZFP36 0.1667330 3.944917 1.921715e-04 0.508784638 0.1213335
3h7Sgq2i3sAUkxL_n8 ITGB5 0.3419488 3.938960 1.960886e-04 0.508784638 0.1066896
g2 和 g2 看起來一樣,每個都有 15568 個條目(基因)
對於 40000 個排列,如何計算該數據的 Spearman 相關性的 p 值和相關系數?
我加入了所有 3 個組,g1、g2、g3,並且只提取了 Beta (B)
我得到了這個數據框,匹配了 15568 個條目:
Beta1 Beta2 Beta3
EXykpF1BRREdXnv9Xk -4.970533 -4.752771 -5.404054
0Tm7hdRJxd9zoevPlA -4.862168 -5.147294 -3.909654
u_M5UdFdhg3lZ.qe64 -5.368846 -5.396183 -5.405330
lkkLCXcnzL9NXFXTl4 -4.367704 -4.847795 -5.148524
0Uu3XrB6Bd14qoNeuc -5.286592 -4.949305 -5.278798
3h7Sgq2i3sAUkxL_n8 -4.579528 -2.403240 -4.710600
要計算斯皮爾曼,我可以在 R 中使用:
> cor(d,use="pairwise.complete.obs",method="spearman")
Beta1 Beta2 Beta3
Beta1 1.000000000 0.234171932 0.002474729
Beta2 0.234171932 1.000000000 -0.005469126
Beta3 0.002474729 -0.005469126 1.000000000
有人可以告訴我使用什么方法來獲得考慮排列數的相關系數和 p 值? 我是否正確使用 Beta 來在這 3 個組之間進行相關性?
謝謝!
使用psych
package 訪問correlation coefficient
和p-value
的提示。 我將使用mtcars
數據集而不是重新鍵入您的數據集,因為它不是簡單的copy-paste (dput(df))
格式。
library(psych)
corr.test.col.1to4 <- corr.test(mtcars[1:4], method = "spearman", use = "complete.obs")
names(corr.test.col.1to4)
#1] "r" "n" "t" "p" "se" "sef" "adjust" "sym" "ci" "ci.adj"
# [11] "Call"
# -------------------------------------------------------------------------
# in your case you probably want to do
#cor.test.beta <- corr.test(d[c("Beta1","Beta2", "Beta3")], method = "spearman", use = "complete.obs")
# -------------------------------------------------------------------------
從names(corr.test.col.1to4)
的output中可以看出:
r:相關系數
n:觀察次數
p: p.值
se:標准誤差
ci:置信區間
所以,如果你想要相關系數,你可以使用
corr.test.col.1to4$r
# mpg cyl disp hp
# mpg 1.0000000 -0.9108013 -0.9088824 -0.8946646
# cyl -0.9108013 1.0000000 0.9276516 0.9017909
# disp -0.9088824 0.9276516 1.0000000 0.8510426
# hp -0.8946646 0.9017909 0.8510426 1.0000000
p-values
corr.test.col.1to4$p
# mpg cyl disp hp
# mpg 0.000000e+00 2.345144e-12 2.548135e-12 1.017194e-11
# cyl 4.690287e-13 0.000000e+00 1.365266e-13 5.603057e-12
# disp 6.370336e-13 2.275443e-14 0.000000e+00 6.791338e-10
# hp 5.085969e-12 1.867686e-12 6.791338e-10 0.000000e+00
標准錯誤
corr.test.col.1to4$se
# mpg cyl disp hp
# mpg 0.00000000 0.07537483 0.07614303 0.08156289
# cyl 0.07537483 0.00000000 0.06818175 0.07890355
# disp 0.07614303 0.06818175 0.00000000 0.09586909
# hp 0.08156289 0.07890355 0.09586909 0.00000000
置信區間
corr.test.col.1to4$ci
# lower r upper p
# mpg-cyl -0.9559077 -0.9108013 -0.8237102 4.690287e-13
# mpg-disp -0.9549362 -0.9088824 -0.8200941 6.370336e-13
# mpg-hp -0.9477078 -0.8946646 -0.7935207 5.085969e-12
# cyl-disp 0.8557708 0.9276516 0.9643958 2.275443e-14
# cyl-hp 0.8067919 0.9017909 0.9513377 1.867686e-12
# disp-hp 0.7143279 0.8510426 0.9251848 6.791338e-10
您可以將 output 保存在變量上,並進行進一步格式化以使報告更准確。
您的第二個問題我是否正確使用Beta
來在這 3 個組之間進行相關性? 是一個有效的問題,您需要根據您要回答的問題來回答/解決它,並以這樣一種方式報告它,即在變量Beta
上計算 corr 並證明在您的報告中選擇變量Beta
是合理的。
希望有幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.