繁体   English   中英

R: plot 分布的连续变量

[英]R: plot distribution of a continuous variable

我有一个数据集,其中包含人们填写在线问卷所需的采访时长。
有人可以告诉我,我怎么能 plot 一个连续变量( geom_line )的分布,所以我可以说

  • 10% 的参与者有 10 秒或更短的时间
  • 20% 的参与者有 20 秒或更短的时间

...

  • 100% 的参与者有 100 秒或更短的时间

假设时间是正态分布的:

df <- data.frame(length = rnorm(n = 8000, mean = 100, sd = 20) )

x 轴上应该是参与者的比例,y 轴上应该是持续时间。

谢谢你的帮助!

您可以使用ecdf将比例作为长度的 function :

plot(ecdf(df$length))

在此处输入图像描述

反过来按要求在 x 轴上获得比例:

f <- ecdf(df$length)
df$proportion <- f(df$length)

ggplot(df)+geom_line(aes(proportion,length))

在此处输入图像描述

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM