簡體   English   中英

R中2個數據集之間相關性的統計函數

[英]Statistical functions for correlation between 2 data sets in R

這更多是我找不到的一般問題。 我試圖找到2個數據集之間的相關性,目的是將它們與某個相關性百分比匹配。 它們不會完全匹配,但通常會在1%以內,盡管可能會有一些異常值。 例如,每100個百分點可能會偏離5%,甚至更多。

我還試圖找到一個數據集可能與另一個匹配但大小不同的實例。 例如,如果將所有數據乘以一個乘數,則將得到一個匹配項。 循環遍歷大量可能的乘數顯然是沒有意義的。 我正在考慮嘗試將正斜率和負斜率匹配為+ 1 / -1,因為該斜率不起作用。 但是,在某些情況下,這是行不通的,因為數據非常細小,因此可能與數據的形狀匹配,但如果放大,則斜率將關閉。

R中有內置函數嗎? 我沒有統計背景,我的搜索主要是如何處理單個數據集以及其中的離群值。

對於基本的Pearson,Spearman或Kendall相關性,可以使用cor()函數:

x <- c(1, 2, 5, 7, 10, 15)
y <- c(2, 4, 6, 9, 12, 13)

cor(x, y, use="pairwise.complete.obs", method="pearson")

您將要根據數據調整“使用”和“方法”選項。 由於您未提供數據的性質,因此我無法為您提供任何更具體的指導。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM