簡體   English   中英

繪制R中差異的分布

[英]Plotting distribution of differences in R

我有一個數據集,其中的數字表示某種程度上的每日差異。

https://dl.dropbox.com/u/22681355/diff.csv

我想創建一個差異分布圖,特別強調稀有的大變化。

我嘗試使用hist()函數繪制每列,但實際上並沒有提供數據的詳細圖片。

例如,繪制數據集的第一列將產生以下圖:

https://dl.dropbox.com/u/22681355/Rplot.pdf

我的問題是,這很少提供很少的大偏差細節。

最簡單的方法是什么?

還有關於如何在表中匯總此數據的任何建議? 例如,除了顯示最小值,最大值和平均值之外,您還會查看分位數嗎? 還有其他想法嗎?

您可以使用可視化數據的分布:

sdiff <- read.csv("https://dl.dropbox.com/u/22681355/diff.csv")

boxplot(sdiff[,-1])

離群值打印為圓形。

在此處輸入圖片說明

我回來@斯文的建議識別異常值,但你可以通過指定一個更密集設置斷點比什么讓你的直方圖更細化hist選擇默認。

d <- read.csv('https://dl.dropbox.com/u/22681355/diff.csv', header=TRUE, row.names=1)
with(d, hist(a, breaks=seq(min(a), max(a), length.out=100)))

在此處輸入圖片說明

小提琴圖可能會有用:

df <- read.csv('https://dl.dropbox.com/u/22681355/diff.csv')
library(vioplot)
with(df,vioplot(a,b,c,d,e,f,g,h,i,j))

小提琴情節

我將在轉換后的數據上使用箱線圖,例如:

boxplot(df[,-1]/sqrt(abs(df[,-1])))

箱線圖(數據轉換)

顯然,直方圖在轉換后也會看起來更好。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM