[英]ratio of counts in R 2d plot
我有 2 個連續變量(X 和 Y),我想將它們合並到 2d 網格中。 與每個 (x,y) 對相關聯,我有一個通過或失敗的因素。 我想在二維網格中繪制 PASS/FAIL 的比率。
例如,使用 iris 數據集: ggplot(iris, aes(x=Sepal.Length , y=Petal.Length)) + geom_bin2d()
繪制每個 2d bin 中的總計數 - 如何更改它以繪制比例每個垃圾箱中維吉尼亞和雜色的數量?
通過使用stat_summary2d()
,數據預處理(將二進制因子轉換為數據幀中的數字)並使用與stat_summary2d()
函數關聯的 z 參數。
iris$tf <- as.numeric(as.logical(round(runif(nrow(iris)))))
ggplot(iris, aes(x=Sepal.Length , y=Petal.Length,z=tf)) +
stat_summary2d(bins = 10,binwidth = c(2)) +
labs(title = "Ratio of T/F of Factor by Petal.Length and Sepal.Length") +
scale_fill_continuous(name = "Ratio")
注意:如果您將二進制因子轉換為數字,默認情況下它會強制為 1/2(而不是 0/1),因此減去一個。 如果這是一個邏輯,那么這將是不必要的。
編輯:向stat_summary2d()
添加了 default fun='mean'
參數以明確這是該函數的默認行為。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.