繁体   English   中英

如何在r中生成概率密度函数和期望值?

[英]How to generate a probability density function and expectation in r?

任务:

Eric the fly有一个朋友,Ernie。 假设两只苍蝇坐在独立的位置,均匀分布在地球表面。 设D表示Eric和Ernie之间的欧几里德距离(即,穿过地球内部的直线)。

对D的概率密度函数进行猜想,并给出其期望值E(D)的估计。

到目前为止,我已经完成了在地球表面生成两个点的功能,但我不确定下一步该做什么:

sample3d <- function(2)
  {
  df <- data.frame()
  while(n > 0){
    x <- runif(1,-1,1)
    y <- runif(1,-1,1)
    z <- runif(1,-1,1)
    r <- x^2 + y^2 + z^2
    if (r < 1){
      u <- sqrt(x^2+y^2+z^2)
      vector = data.frame(x = x/u,y = y/u, z = z/u)
      df <- rbind(vector,df)
      n = n- 1
    }
  }
  df
}
E <- sample3d(2)

这是一个有趣的问题。 我将概述一种计算方法; 我会把数学留给你。

  1. 首先,我们修复随机种子以获得可重复性。

     set.seed(2018); 
  2. 我们从单位球面采样10^4个点。

     sample3d <- function(n = 100) { df <- data.frame(); while(n > 0) { x <- runif(1,-1,1) y <- runif(1,-1,1) z <- runif(1,-1,1) r <- x^2 + y^2 + z^2 if (r < 1) { u <- sqrt(x^2 + y^2 + z^2) vector = data.frame(x = x/u,y = y/u, z = z/u) df <- rbind(vector,df) n = n- 1 } } df } df <- sample3d(10^4); 

    请注意, sample3d效率不高,但这是一个不同的问题。

  3. 我们现在从df随机抽取2个点,计算这两个点之间的欧几里德距离(使用dist ),并重复此过程N = 10^4次。

     # Sample 2 points randomly from df, repeat N times N <- 10^4; dist <- replicate(N, dist(df[sample(1:nrow(df), 2), ])); 

    正如@JosephWood指出的那样, N = 10^4的数字有些随意。 我们使用bootstrap来推导经验分布。 对于N -> infinity可以证明经验自助分布与(未知)种群分布(Bootstrap定理)相同。 经验和人口分布之间的误差项为1/sqrt(N) ,因此N = 10^4应导致1%左右的误差。

  4. 我们可以将得到的概率分布绘制为直方图:

     # Let's plot the distribution ggplot(data.frame(x = dist), aes(x)) + geom_histogram(bins = 50); 

在此输入图像描述

  1. 最后,我们可以得到平均值和中位数的经验估计值。

     # Mean mean(dist); #[1] 1.333021 # Median median(dist); #[1] 1.41602 

    这些值接近理论值:

     mean.th = 4/3 median.th = sqrt(2) 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM