簡體   English   中英

R中名義變量的頻率分布排序

[英]Ranked Frequency Distributions from Nominal Variables in R

我搜索了網站,但一直無法找到問題的解決方案。 我有一個樣本數據集如下:

id,l1
1,3
2,5
3,6
1,5
2,4
3,6

id是名義變量,表示唯一用戶,另一個是計數變量。

我想要的是找出用戶的l1分布。 因此,查看我給定的數據集,id = 1總共l1 = 8; id = 2總l1 = 9,id = 3總l1 = 12。

我試圖根據id找出l1的分布,但我被卡住了。 我無法弄清楚如何將相關列組合在一起,然后找到分布或至少構建直方圖。 我可以構建一個帶有一個變量的直方圖,但我不能通過一個名義變量構建一個排名的頻率分布。

base R方法是使用tapply

如果你的data.frame被稱為aa

sumById <- with(aa, tapply(l1,id, sum)))

barplot(sumById)

在此輸入圖像描述

如果您想在沒有明確推測的情況下繪制結果,那么您可以使用ggplot2stat_summary

library(ggplot2)
ggplot(aa, aes(x = id, y = l1)) + stat_summary(fun.y = 'sum', geom = 'bar')

在此輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM