[英]Creating a probability distribution in Excel
给了我三个数据点,并告诉我进行分配。 以下是我完成任务的说明:
排名最低的20%人口本月将产生13个单位。 数据的中位数显示我们本月应该生产23个单位。 最好的情况是,排名前20%的地区显示本月我们生产了30个单位。
这是指试图找出一个月内生产一定数量零件的可能性百分比。
我正在使用的数据(从上面老板的指示中汇总)如下:
| Serial Number | Median Projected Finish Date | Median In July | Best Case Projected Finish Date | Best In July | Worst Case Projected Finish Date | Worst In July |
|:-------------:|:----------------------------:|:--------------:|:-------------------------------:|:------------:|:--------------------------------:|:-------------:|
| 8473 | 7/18/2019 | 1 | 6/28/2019 | 1 | 8/2/2019 | 0 |
| 11963 | 6/30/2019 | 1 | 6/28/2019 | 1 | 7/28/2019 | 1 |
| 15165 | 6/27/2019 | 1 | 6/27/2019 | 1 | 6/28/2019 | 1 |
| 28023 | 7/1/2019 | 1 | 6/29/2019 | 1 | 7/3/2019 | 1 |
| 14355 | 9/1/2019 | 0 | 7/11/2019 | 1 | 9/13/2019 | 0 |
| 14388 | 7/3/2019 | 1 | 7/1/2019 | 1 | 7/7/2019 | 1 |
| 796 | 7/18/2019 | 1 | 6/28/2019 | 1 | 8/2/2019 | 0 |
| 20574 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/19/2019 | 1 |
| 6518 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/19/2019 | 1 |
| 19969 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/18/2019 | 1 |
| 10244 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/19/2019 | 1 |
| 9980 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/19/2019 | 1 |
| 26056 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/19/2019 | 1 |
| 8849 | 7/18/2019 | 1 | 7/2/2019 | 1 | 8/2/2019 | 0 |
| 7409 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/19/2019 | 1 |
| 1386 | 7/11/2019 | 1 | 7/9/2019 | 1 | 7/19/2019 | 1 |
| 13971 | 7/17/2019 | 1 | 6/27/2019 | 1 | 8/1/2019 | 0 |
| 21974 | 7/25/2019 | 1 | 7/19/2019 | 1 | 8/12/2019 | 0 |
| 20546 | 7/25/2019 | 1 | 7/19/2019 | 1 | 8/12/2019 | 0 |
| 10055 | 6/30/2019 | 1 | 6/27/2019 | 1 | 7/28/2019 | 1 |
| 22766 | 7/17/2019 | 1 | 6/27/2019 | 1 | 8/1/2019 | 0 |
| 12679 | 7/18/2019 | 1 | 7/2/2019 | 1 | 8/2/2019 | 0 |
| 28837 | 7/26/2019 | 1 | 6/30/2019 | 1 | 8/14/2019 | 0 |
| 12509 | 7/31/2019 | 1 | 7/4/2019 | 1 | 8/18/2019 | 0 |
| 1624 | 8/5/2019 | 0 | 7/29/2019 | 1 | 8/21/2019 | 0 |
| 5689 | 8/1/2019 | 0 | 7/4/2019 | 1 | 8/19/2019 | 0 |
| 29315 | 8/2/2019 | 0 | 7/5/2019 | 1 | 8/29/2019 | 0 |
| 10618 | 8/2/2019 | 0 | 7/5/2019 | 1 | 8/29/2019 | 0 |
| 16235 | 8/2/2019 | 0 | 7/5/2019 | 1 | 8/29/2019 | 0 |
| 12079 | 8/2/2019 | 0 | 7/5/2019 | 1 | 8/29/2019 | 0 |
| | | 23 | | 30 | | 13 |
上面的数据源概述了零件的唯一标识符,该序列号的预计完成日期,预计完成日期(如果完成该步骤的最佳/最差时间是20%)和“ 7月”列以查看是否在7月份完成(用于对最后一行的总数进行总计)。
我已尝试关注此资源,但无法这样做。 如何使用数据创建概率分布?
目标将是找出给定月份内完成的x
单位数量的可能性百分比(例如2019年7月)。 我只能使用上面的数据。 能够显示(或接近显示)的图表11% probability of finishing 32 units in 2019
(任意)的11% probability of finishing 32 units in 2019
。 理想情况下,概率分布将向我们显示完成x
数量单位的概率。 我想象地板将为0,天花板将为30
(因为仅列出了30个项目)。
您可以将每个单元的完成日期视为一个随机变量。 对于每个单元,您将获得三个概率。 对于第一个单位,P(U 1 <6/28)= 0.2,P(U 1 > 8/2)= 0.2,P(U 1 <7/18)= 0.5,其中7/18是中位数。
如果我们假设U 1是正态分布的,则其中位数和平均值等于7/18,并且概率p(U 1 <k 1 )= 0.2和P(U 1 > k 2 )= 0.2对于k 1和k 2等距平均数7/18。 对于U 1并非如此,这表明U 1最有可能不是正态分布的。 您可能需要考虑其他偏斜的概率分布,并且中位数为0.5概率。 有指数修改过的高斯分布 , 偏态正态分布等。 无论您对单位生产有什么了解,都可以帮助选择概率分布。
假设我们要使用正态分布。 除了使用日期,我们还将使用第1天为7/1的日期编号。 我们需要为每个单位估计其正态分布的参数,即在给定三个概率点的情况下的均值和标准差。 由于正态分布是对称的,因此平均值是最差/最好的20%天之间的中间天。 对于U 1而言 ,平均值为m 1 =(33-(-2))/ 2 + -2 = 15.5。 我们知道P(U 1 > 33)= 0.2。 当N(0; 1)> 0.84时会发生这种情况。 因此,标准偏差s 1 =(33-15.5)/ 0.84 = 20.8。 知道米1和s 1,我们可以计算出U 1将在7月完成的概率,即,P(U 1〜N(M 1; S 1)<32)。 对所有N个单位进行相同的估算。 这给了我们N个概率,即单元在7月完成的概率。
要计算N个单位中的R个单位在7月完成的可能性,请参考以下答案。
最后,假设单位的生产是独立的。 如果不是这种情况(例如,两个单元依赖于共同的零件供应商),则计算出的概率可能不好。 但是我认为最好的改进是找到一种比正常分布更能代表您的数据的分布。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.