标签[quantile] - 堆栈内存溢出

大型 RasterStack 上的错误计算分位数 - Error computing quantiles on large RasterStack

我想在 R 上的一组堆叠的 RasterLayers 上跨层获取每个单元格的分位数。我的 RasterStack 看起来像这样尺寸：721、1440、1038240、18628（nrow、ncol、ncell、nlayers）我运行以下行以获得每个单元格的值为第 25 个和第 75 个百分位数的 ...

ggpubr如何模拟QQ plot - How to emulate QQ plot from ggpubr

这里有很多关于使用 QQ plot 的话题，但我正在尝试弄清楚如何手动计算一个，并且在这个过程中我想模拟ggpubr中使用的那个，因为它看起来比基本的 R 版本更好。到目前为止，我至少似乎使用这种方法在 base R 中生成了一个 QQ plot：结果和base R版本大同小异，只是QQ线我还 ...

Python 按分位数过滤较大的文本 - Python filter larger text by quantile

假设我正在处理一个非常大的文本文件，我有以下伪代码注意文件很大，可能来自一个pipe，不想看两遍。我们必须先读取整个文件才能获得过滤文件的截断值上面的方法可以，但是memory的消耗太大了，有没有什么算法优化可以提高效率，减少memory的消耗？ ...

使用 R 使用调查包按分位数创建虚拟变量。 findInterval 函数有问题 - Using R to create a dummy variable by quantile using the survey package. Trouble with findInterval function

我目前正在处理需要调查加权的公共使用微数据，因此我已经相当熟悉调查包和 srvyr 的汇总统计数据。我正在尝试找出一种方法来为调查对象数据表中的每个观察结果创建一个指示变量，该数据表在使用分位数函数时对应于该观察结果的分位数。例如，我可能想在计算“高度”时根据观察的分位数为每个观察创建一个虚拟对 ...

为什么我无法删除异常值？ - Why am I not able to remove outliers?

为什么我无法按预期过滤掉异常值？我的数据集有 299 个观察值。我试过改变标志，但我不认为这是错误的。也许这可能是我的括号？ [Q3+(1.5)IQR] 以上的所有异常值是我试图在serum_creatinine和creatine_phosphokinase中删除的数据 ...

创建对前两列进行排序的新列 - Create new column which orders two previous columns

我希望创建一个基于其他两个列的顺序的新列，最好使用 Tidyverse 函数，但我们欢迎任何建议。我有一个包含大约 1300 个条目和几列的表格，但我的数据样本类似于：人数总订单总分位数 12 1个 1个 19 2个 1个 21 3个 2个 45 5个 2个 53 5个 3个 55 ...

按十分位数分布变量 - Distribute a variable by deciles

我有一个包含许多观察值和变量的数据集，我正在尝试使用ingressosmensualsllar变量（代表月收入）创建一个十分位数。我正在寻找的 output 是在我的数据集中添加一个新变量，以便每个观察值都有其相应的十分位数。我的目标是拥有一个geom_bar ，其中income十分位数作为 x ...

类别比较 - Category comparison

我有以下数据框：我试图尽可能简单地形象化Extra与Standard的整体优势（即：' Extra相对于Standard的优势是什么？） ...

显示变量 A 的百分位数，而百分位数的分类基于变量 B - Show percentiles of Variable A, while the classification of percentiles is based on Variable B

我有一个如下所示的数据集：收入财富 10.000 100000 15.000 111000 14.200 123456 12.654 654321 我还有很多行。我现在想知道特定 WEALTH 百分位的家庭有多少收入。以下分位数是相关的：我一直使用以下代码来获取特定的百分位数 ...

Pandas qcut ValueError：输入数组必须是一维的 - Pandas qcut ValueError: Input array must be 1 dimensional

我试图将我的值分类为 10 个箱子，但我遇到了这个错误。我怎样才能避免这个错误并顺利地将它们装箱？附件是数据和代码示例。数据代码 ...

如何根据值将记录平均分为N组？ - How can I evenly divide records into N groups based on the values?

对于如下表，如何根据“factor_value”的值将这些记录平均分为3组？ sym date factor_value ------ ---------- ------------ 100000 2022.04.27 1 100001 2022.04.27 2 100002 2022.04.2 ...

分位数 function 如何在 pandas 中工作 - how does quantile function works in pandas

我正在使用 pandas 来计算系列的分位数根据我的理解，要计算 0.25 分位数，公式为：现在我可以找到这个pos值的两个解释：解释A：pos表示分位数值应该更接近第二个数字，那么分位数值应该是：解释B：小数部分表示分位数的25%应该来自第2个数，75%来自第3个数，那么分位数的值应该是： ...

扩展 Window 并结合 PySpark 上的百分位数操作？ - Expanding Window combined with Percentile operation on PySpark?

我有一个 PySpark DataFrame ，每次车辆行程都有一个“速度”列，我想在新列中计算 0.95 扩展（1）分位数。也就是说，在 Python 中，以：并申请给出（在对新 df 的索引和列进行一些操作之后）：最后一列代表“SPEED”列的 .95 分位数，以扩展 window 方 ...

在 Julia 与 Python 中使用分位数时出现意外结果 - Unexpected result when using quantile in Julia vs Python

我刚从 Julia 开始，我正在尝试做一些简单的统计。我正在使用 StatsBase package 并尝试计算分位数。并得到我假设 Q_1 = 3.25 和 Q_2 = 7.75 在 python 上运行类似的代码：产量：其中 Q_1 = 2.75 和 Q_3 = 8.25。根据我对统 ...

9 种分位数的虚拟示例 - Dummy example of the 9 types of Quantiles

我们都知道R软件通过function分位数(x,probs,type=1,2,3,4...)有9种分位数的计算方式。我正在为我的学生寻找一个简单而愚蠢的特殊示例，其中每种类型的分位数计算方法都会返回一个不同的值，样本大小至少为 20 个值。最好的例子是它们都为分位数 0.5（即中位数）返回不同的 ...

如何在 R 中将四分位数保存在不同的组中 - How to save quartiles in separate groups in R

我有几门课程的学生成绩清单。我想 select 第一个四分位数（保存在一个名为 A 的组中）和第三个四分位数（保存在一个名为 B 的组中）和学生的 rest 保存在一个名为 Z411250F8384DFCAD31D 的组中我的问题是如何将他们的成绩保存在那个单独的组中？我怎样才能找到每个四分位数 ...

RuntimeError: quantile() q 张量必须与 pytorch-forecasting 中的输入张量具有相同的 dtype - RuntimeError: quantile() q tensor must be same dtype as the input tensor in pytorch-forecasting

PyTorch-预测版本：0.10.2 PyTorch版本：1.12.1 Python版本：3.10.4 操作系统：windows 预期行为没有错误实际行为错误是文件 c:\Users\josepeeterson.er\Miniconda3\envs\pytorch\lib\site-pac ...

Pandas Groupby 使用“分位数”计算按列分位数的问题 - Pandas Groupby Problems with Calculating Column-Wise Quantiles with "quantile"

在我的情况下，我需要计算跨列或沿行或“月”列的大型 DF 的分位数。显然，仅在 df 上应用的分位数 function 使用关键字“axis”工作，但如果您尝试使用 groupby 应用分位数，则会因错误而被拒绝：以下是分位数与这样的数据一起使用的情况：但是，如果我使用 groupby 语句添 ...

为什么 R 中的分位数 function 在每组中给出不相等的值计数 - Why do quantile function in R gives unequal count of values in each group

我正在尝试将连续值数据分组为三分位数。我正在使用 function quantile来执行此操作。以下是我的代码难道不应该在每组中给出相等的值计数吗？我在组中得到不同的计数。这是值的输入有人可以请帮助可能是什么原因 ...

ntile() 等效于相等范围 - ntile() equivalent for equal ranges

我想将数据框的一列拆分为相同大小的箱。例如，我可以看一个向量 c.f. 我不想要的是相同大小的组，例如如果有一种有效且干净的方法来做到这一点，我将不胜感激。从向量我可能可以概括它，但为了增加上下文，我的实际用例更类似于我使用第一节中等效的 function 而不是ntile 。这可能是最 ...