我想在 R 上的一组堆叠的 RasterLayers 上跨层获取每个单元格的分位数。 我的 RasterStack 看起来像这样尺寸:721、1440、1038240、18628(nrow、ncol、ncell、nlayers) 我运行以下行以获得每个单元格的值为第 25 个和第 75 个百分位数的 ...
我想在 R 上的一组堆叠的 RasterLayers 上跨层获取每个单元格的分位数。 我的 RasterStack 看起来像这样尺寸:721、1440、1038240、18628(nrow、ncol、ncell、nlayers) 我运行以下行以获得每个单元格的值为第 25 个和第 75 个百分位数的 ...
这里有很多关于使用 QQ plot 的话题,但我正在尝试弄清楚如何手动计算一个,并且在这个过程中我想模拟ggpubr中使用的那个,因为它看起来比基本的 R 版本更好。 到目前为止,我至少似乎使用这种方法在 base R 中生成了一个 QQ plot: 结果和base R版本大同小异,只是QQ线我还 ...
假设我正在处理一个非常大的文本文件,我有以下伪代码 注意文件很大,可能来自一个pipe,不想看两遍。 我们必须先读取整个文件才能获得过滤文件的截断值上面的方法可以,但是memory的消耗太大了,有没有什么算法优化可以提高效率,减少memory的消耗? ...
我目前正在处理需要调查加权的公共使用微数据,因此我已经相当熟悉调查包和 srvyr 的汇总统计数据。 我正在尝试找出一种方法来为调查对象数据表中的每个观察结果创建一个指示变量,该数据表在使用分位数函数时对应于该观察结果的分位数。 例如,我可能想在计算“高度”时根据观察的分位数为每个观察创建一个虚拟对 ...
为什么我无法按预期过滤掉异常值? 我的数据集有 299 个观察值。 我试过改变标志,但我不认为这是错误的。 也许这可能是我的括号? [Q3+(1.5)IQR] 以上的所有异常值是我试图在serum_creatinine和creatine_phosphokinase中删除的数据 ...
我希望创建一个基于其他两个列的顺序的新列,最好使用 Tidyverse 函数,但我们欢迎任何建议。 我有一个包含大约 1300 个条目和几列的表格,但我的数据样本类似于: 人数总订单总分位数 12 1个 1个 19 2个 1个 21 3个 2个 45 5个 2个 53 5个 3个 55 ...
我有一个包含许多观察值和变量的数据集,我正在尝试使用ingressosmensualsllar变量(代表月收入)创建一个十分位数。 我正在寻找的 output 是在我的数据集中添加一个新变量,以便每个观察值都有其相应的十分位数。 我的目标是拥有一个geom_bar ,其中income十分位数作为 x ...
我有以下数据框: 我试图尽可能简单地形象化Extra与Standard的整体优势(即:' Extra相对于Standard的优势是什么?) ...
我有一个如下所示的数据集: 收入财富 10.000 100000 15.000 111000 14.200 123456 12.654 654321 我还有很多行。 我现在想知道特定 WEALTH 百分位的家庭有多少收入。 以下分位数是相关的: 我一直使用以下代码来获取特定的百分位数 ...
我试图将我的值分类为 10 个箱子,但我遇到了这个错误。 我怎样才能避免这个错误并顺利地将它们装箱? 附件是数据和代码示例。 数据 代码 ...
对于如下表,如何根据“factor_value”的值将这些记录平均分为3组? sym date factor_value ------ ---------- ------------ 100000 2022.04.27 1 100001 2022.04.27 2 100002 2022.04.2 ...
我正在使用 pandas 来计算系列的分位数 根据我的理解,要计算 0.25 分位数,公式为: 现在我可以找到这个pos值的两个解释:解释A:pos表示分位数值应该更接近第二个数字,那么分位数值应该是: 解释B:小数部分表示分位数的25%应该来自第2个数,75%来自第3个数,那么分位数的值应该是: ...
我有一个 PySpark DataFrame ,每次车辆行程都有一个“速度”列,我想在新列中计算 0.95 扩展(1)分位数。 也就是说,在 Python 中,以: 并申请 给出(在对新 df 的索引和列进行一些操作之后): 最后一列代表“SPEED”列的 .95 分位数,以扩展 window 方 ...
我刚从 Julia 开始,我正在尝试做一些简单的统计。 我正在使用 StatsBase package 并尝试计算分位数。 并得到 我假设 Q_1 = 3.25 和 Q_2 = 7.75 在 python 上运行类似的代码: 产量: 其中 Q_1 = 2.75 和 Q_3 = 8.25。 根据我对统 ...
我们都知道R软件通过function分位数(x,probs,type=1,2,3,4...)有9种分位数的计算方式。 我正在为我的学生寻找一个简单而愚蠢的特殊示例,其中每种类型的分位数计算方法都会返回一个不同的值,样本大小至少为 20 个值。 最好的例子是它们都为分位数 0.5(即中位数)返回不同的 ...
我有几门课程的学生成绩清单。 我想 select 第一个四分位数(保存在一个名为 A 的组中)和第三个四分位数(保存在一个名为 B 的组中)和学生的 rest 保存在一个名为 Z411250F8384DFCAD31D 的组中我的问题是如何将他们的成绩保存在那个单独的组中? 我怎样才能找到每个四分位数 ...
PyTorch-预测版本:0.10.2 PyTorch版本:1.12.1 Python版本:3.10.4 操作系统:windows 预期行为没有错误实际行为错误是文件 c:\Users\josepeeterson.er\Miniconda3\envs\pytorch\lib\site-pac ...
在我的情况下,我需要计算跨列或沿行或“月”列的大型 DF 的分位数。 显然,仅在 df 上应用的分位数 function 使用关键字“axis”工作,但如果您尝试使用 groupby 应用分位数,则会因错误而被拒绝: 以下是分位数与这样的数据一起使用的情况: 但是,如果我使用 groupby 语句添 ...
我正在尝试将连续值数据分组为三分位数。 我正在使用 function quantile来执行此操作。 以下是我的代码 难道不应该在每组中给出相等的值计数吗? 我在组中得到不同的计数。 这是值的输入 有人可以请帮助可能是什么原因 ...
我想将数据框的一列拆分为相同大小的箱。 例如,我可以看一个向量 c.f. 我不想要的是相同大小的组,例如 如果有一种有效且干净的方法来做到这一点,我将不胜感激。 从向量我可能可以概括它,但为了增加上下文,我的实际用例更类似于 我使用第一节中等效的 function 而不是ntile 。 这可能是最 ...