[英]Ranked Frequency Distributions from Nominal Variables in R
我搜索了網站,但一直無法找到問題的解決方案。 我有一個樣本數據集如下:
id,l1
1,3
2,5
3,6
1,5
2,4
3,6
id是名義變量,表示唯一用戶,另一個是計數變量。
我想要的是找出用戶的l1分布。 因此,查看我給定的數據集,id = 1總共l1 = 8; id = 2總l1 = 9,id = 3總l1 = 12。
我試圖根據id找出l1的分布,但我被卡住了。 我無法弄清楚如何將相關列組合在一起,然后找到分布或至少構建直方圖。 我可以構建一個帶有一個變量的直方圖,但我不能通過一個名義變量構建一個排名的頻率分布。
base
R
方法是使用tapply
如果你的data.frame被稱為aa
sumById <- with(aa, tapply(l1,id, sum)))
barplot(sumById)
如果您想在沒有明確推測的情況下繪制結果,那么您可以使用ggplot2
和stat_summary
library(ggplot2)
ggplot(aa, aes(x = id, y = l1)) + stat_summary(fun.y = 'sum', geom = 'bar')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.