[英]R incorrect y-axis in ggplots geom_bar()
我有一个带有Wikipedia编辑的数据框,其中包含有关用户的编辑数量(第一次编辑,第二次编辑等),进行编辑的时间戳记以及添加了多少个单词的信息。
在实际数据集中,每个用户最多可以进行20.000次编辑,在某些编辑中,它们总共可以增加30.000个单词。
但是, 这是一个可下载的小型示例数据集,用于例证我的问题。 标头看起来像这样:
我试图绘制添加单词在整个编辑进度和时间上的分布情况。 如果我使用常规的R barplot,则可以像预期的那样工作:
barplot(UserFrame3$NoOfAdds,UserFrame3$EditNo)
但是我想在ggplot中完成它,以获得更好的图形和更多的自定义选项。
如果将其绘制为散点图,则会得到相同的结果:
ggplot(data = UserFrame3, aes(x = UserFrame3$EditNo, y = UserFrame3$NoOfAdds)) + geom_point(size = 0.1)
折线图也一样:
ggplot(data = UserFrame3, aes(x = UserFrame3$EditNo, y = UserFrame3$NoOfAdds)) +geom_line(size = 0.1)
但是当我尝试将其绘制为ggplot中的条形图时,我得到以下结果:
ggplot(data = UserFrame3, aes(x = UserFrame3$EditNo, y = UserFrame3$NoOfAdds)) + geom_bar(stat = "identity", position = "dodge")
X轴上似乎有很多孔,并且最大孔距应有的位置不远(y = 317)。
我怀疑ggplot以某种方式对条形进行分组并使用均值而不是实际值,尽管使用了“ dodge”参数? 如何避免这种情况? 以及如何将时间进程绘制为条形图而不将ggplot的平均值平均多次编辑?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.