繁体   English   中英

R 绘制具有 n, n+1, .... 计数的因子水平数

[英]R plot numbers of factor levels having n, n+1, .... counts

我有一个非常大的数据集(> 200000 行),有 6 个变量(仅显示前两个)

>head(gt7)
      ChromKey  POS
    1     2447   25
    2     2447  183
    3    26341   75
    4    26341 2213
    5    26341 2617
    6    54011 1868

我已将 Chromkey 变量转换为由 > 55000 个级别组成的因子变量。

> gt7[1] <- lapply(gt7[1], factor)
> is.factor(gt7$ChromKey)
[1] TRUE

我可以进一步制作一个包含 ChromKey 级别计数的表格

> table(gt7$ChromKey)

   1    2    3    4    5    6    7    8    9   10   11   12   13   14   15   16   17 
  88   88   44   33   11   11   33   22  121   11   22   11   11   11   22   11   33 
  18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34 
  22   22   44   55   22   11   22   66   11   11   11   22   11   11   11  187   77 
  35   36   37   38   39   40   41   42   43   44   45   46   47   48   49   50   51 
  77   11   44   11   11   11   11   11   11   22   66   11   22   11   44   22   22 
... outut cropped

我可以以表格格式保存

> table <- table(gt7$ChromKey)
> head(table)

 1  2  3  4  5  6 
88 88 44 33 11 11  

我想知道是否有可能有一个包含特定计数数字的级别数的表格(和直方图)。 从上面的例子中,我希望

  88  44  33  11
   2   1   1   2                   

我非常感谢任何提示。

我们可以在输出上再次应用table以获得频率的频率计数

table(table(gt7$ChromKey))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM