[英]Plotting distribution of differences in R
我有一個數據集,其中的數字表示某種程度上的每日差異。
https://dl.dropbox.com/u/22681355/diff.csv
我想創建一個差異分布圖,特別強調稀有的大變化。
我嘗試使用hist()函數繪制每列,但實際上並沒有提供數據的詳細圖片。
例如,繪制數據集的第一列將產生以下圖:
https://dl.dropbox.com/u/22681355/Rplot.pdf
我的問題是,這很少提供很少的大偏差細節。
最簡單的方法是什么?
還有關於如何在表中匯總此數據的任何建議? 例如,除了顯示最小值,最大值和平均值之外,您還會查看分位數嗎? 還有其他想法嗎?
我回來@斯文的建議識別異常值,但你可以通過指定一個更密集設置斷點比什么讓你的直方圖更細化hist
選擇默認。
d <- read.csv('https://dl.dropbox.com/u/22681355/diff.csv', header=TRUE, row.names=1)
with(d, hist(a, breaks=seq(min(a), max(a), length.out=100)))
小提琴圖可能會有用:
df <- read.csv('https://dl.dropbox.com/u/22681355/diff.csv')
library(vioplot)
with(df,vioplot(a,b,c,d,e,f,g,h,i,j))
我將在轉換后的數據上使用箱線圖,例如:
boxplot(df[,-1]/sqrt(abs(df[,-1])))
顯然,直方圖在轉換后也會看起來更好。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.