[英]R plot numbers of factor levels having n, n+1, .... counts
我有一个非常大的数据集(> 200000 行),有 6 个变量(仅显示前两个)
>head(gt7)
ChromKey POS
1 2447 25
2 2447 183
3 26341 75
4 26341 2213
5 26341 2617
6 54011 1868
我已将 Chromkey 变量转换为由 > 55000 个级别组成的因子变量。
> gt7[1] <- lapply(gt7[1], factor)
> is.factor(gt7$ChromKey)
[1] TRUE
我可以进一步制作一个包含 ChromKey 级别计数的表格
> table(gt7$ChromKey)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
88 88 44 33 11 11 33 22 121 11 22 11 11 11 22 11 33
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
22 22 44 55 22 11 22 66 11 11 11 22 11 11 11 187 77
35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51
77 11 44 11 11 11 11 11 11 22 66 11 22 11 44 22 22
... outut cropped
我可以以表格格式保存
> table <- table(gt7$ChromKey)
> head(table)
1 2 3 4 5 6
88 88 44 33 11 11
我想知道是否有可能有一个包含特定计数数字的级别数的表格(和直方图)。 从上面的例子中,我希望
88 44 33 11
2 1 1 2
我非常感谢任何提示。
我们可以在输出上再次应用table
以获得频率的频率计数
table(table(gt7$ChromKey))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.