cost 61 ms
将简单的 df 转换为按年聚合的 ts object - converting a simple df to a ts object that is aggregated by year

我有以下 df: 我已经按年份和类型有效地聚合了一个更大的数据集。 我现在想使用统计库使用 ts() function 将 dataframe 转换为时间序列 object。 不幸的是,我一直遇到错误,因为 function 似乎喜欢有一年的时间序列,有人对我如何让它工作有任何建议吗? 非常感谢任 ...

将 t 检验应用于来自 Python 的 random.randint(0,1) 的随机硬币翻转时,p 值的分布不均匀 - The distribution of p-values is not uniform when applying t-test to random coin flips from Python's random.randint(0,1)

理论上,p 值在 null 假设下均匀分布。 因此,当我使用 Python 的random.randint(0,1)将其应用于一些随机硬币翻转模拟时,我希望 G 检验或卡方检验的 p 值能够检验相等的比例以提供均匀分布的 p 值,这应该是无偏随机硬币,即伯努利 (0.5)。 同样,如果 n*p 足够 ...

虚拟变量操作 - Dummy Variable manipulation

假设我有以下数据集: 年国家税 2000 奥地利 5个 2005年比利时 21 2006年奥地利 10 2001年奥地利 5个 2002年奥地利 6个 2006年比利时 22 我想做这样的事情: 年国家税假的 2000 奥地利 5个 0 2005年比利时 21 0 2006年奥地利 10 ...

2023-01-31 09:01:33   2   20    r / statistics  
如何模拟一段时间内发生的次数 - How to simulate number of occurences over a time period

我有一个平均每 x 秒发生一次的事件。 在 Python 中,我希望“模拟”一个特定的时间间隔 t 秒,并得到一个合理的随机采样 integer n 表示该时间段内事件发生的次数。 我怎样才能做到这一点? (不,在你问之前,这不是我的作业,我在这里问经验丰富的统计学家编码员,而不是计算出我需要的 ...

将百分比密度列添加到 r dataframe - Adding a percentage density column to a r dataframe

我想在下面as dataframe 中的频率列旁边添加一个百分比密度列。 以及频率和百分比密度列的总和值。 百分比密度列显示每个序列的百分比权重,因此如果总共有 10 个序列并且该序列的频率为 3,则百分比密度将为 3/10 = 0.3。 百分比密度之和应为 1.0。 ...

用于不均匀间隔的顺序分类数据的无监督聚类算法? - Unsupervised clustering algorithm for unevenly spaced sequential categorical data?

我正在寻找一种能够处理时间相关数据的技术/方法/算法(每个样本有 20 个时间步长,但在大多数情况下它们在样本之间出现不均匀,即一个样本的值可能为 0.4 秒而另一个样本可能不会)。 时间步长的值本身对应于发生肌肉激活的身体上的分类 position(范围从 1-20)。 所以数据类似于,(时间, ...

R如何计算特异度、敏感性、预测值和ROC曲线? - How to calculate specificity, sensibility, predictive values and ROC curve in R?

我有一个相当小的数据集,该数据集是由两个不同数据集之间的链接产生的。 我想知道如何计算特异性、敏感性、预测值和 plot ROC 曲线。 这是我第一次在 R 中使用这种统计数据,所以我什至不知道如何开始。 部分数据如下所示: 两种方式的表将是以下内容的组合: 其中 NMM_TOTAL 和 CPAV ...

2023-01-28 18:09:02   1   32    r / statistics  
Python除以numpy arrays时如何保持小数 - How to maintain decimals when dividing with numpy arrays in Python

因此,我正在努力在 Python 中实现我自己的同质性统计测试版本,用户将提交列表列表,函数将计算相应的 chi 值。 我发现的一个问题是我的 function 在执行除法时删除了小数点,导致小样本量的 chi 值有些不准确。 这是代码: 打印结果时,我看到b[x][y]值为[[33 29 23] ...

将均值和标准差添加到联合图边距 - Adding mean and std to jointplot margins

我有一个 seaborn.jointplot 与我附上的图非常相似(来自 seaborn 图库)。 但是,我想知道是否可以在每个边际图上添加一条彩色线来标记均值,并在其周围的一个标准偏差的区间内添加一个范围标记。 我喜欢海图人物的整体设计,但我有点需要那条额外的信息。 生成附加 plot 的库中的代 ...

关于Python中计算T统计量差异的问题 - Question regarding differences in calculating T statistics in Python for the difference in means

我正在重新学习介绍性统计数据,并想尝试实现我自己的通用和未合并公式版本来找到 T 值。 我以两种方式实现它,一种是按原样复制公式 Python 函数。 另一种是使用 Python 生成正态分布的能力,并用它来找出均值差异。 但我注意到我的价值观在两个版本中都大不相同。 所以我的问题是为什么会有区别? ...

表示没有“经典”热图的相关矩阵 - Representing a correlation matrix without a "classical" heatmap

我正在对 complex.network 进行一些分析。 我已经计算了度相关矩阵,它看起来像这样: 我想 plot 它获得类似于此的东西: 我试过使用 ggplot 但结果并不令人满意,这是我的代码: 这就是我得到的: 有什么办法可以解决吗? PS对不起,如果我不能直接发布图像,但我的声誉不够高编 ...

我可以创建包含计数和百分比的摘要报告吗? - can I create a summary report with count and percentage?

我正在生成描述性统计数据 - 我想知道如何使用 R 来获取百分比。 我目前正在将数字转换为因子变量,然后使用摘要。 这给了我计数,但我如何得到 R 来计算百分比? 很明显我是 R 的新手,永远不会成为专家。 谢谢。 EEB$PBDpl.net_import<-as.factor(EEB$P ...

2023-01-26 18:57:24   1   24    r / statistics  

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM