cost 58 ms
如何获取 R 中 dataframe 中每一列的三分位数的平均值? - How to get the mean of the tertiles for each column in a dataframe in R?

我正在尝试获取 dataframe 中所有变量的三分位数的长期平均值。基本上,我想要每个变量的三个三分位数的平均值。 以下是第二个三分位数的示例。 数据结构: 我现在做的是: 我获得了一个充满 NaN 和一些值的 dataframe,我不明白我定义的 function 在 group_by() 和 ...

当我尝试使用 sf package 中的汇总 function 来溶解多边形的边界时,R 返回错误。如何解决? - R returns an error when I try to dissolve polygons' boundaries using the summarize function in the sf package. How to solve it?

我在sf package 中使用 R 的summarize function 来消除一些多边形的边界,但我遇到了问题,因为它在某些情况下会返回错误。 举一个具体的例子,当我试图在第 80 届美国国会的形状文件中溶解加利福尼亚州 state 的地区边界时,我得到以下错误: 使用的代码如下: 它在其他 ...

POWER BI 根据关系向现有计算表添加新列 - POWER BI adding a new column to existing calculated table based on relation

我想请您帮助解决以下问题: 我有一个名为 IncomeTable 的表,其中包含三列:Team、Income (Value)、Date (month + year) 我有另一个具有非常相似结构的表 CostsTable: 我想做的是创建一个新的计算表,如下所示: Date 列上的这两个表之间存在关 ...

为 R 中每一列的某些值的出现创建一个汇总表 - Create a summary table for occurrences of certain values for each column in R

我正在尝试生成一个通用脚本,我可以将其应用于多个数据集以检查丢失的数据,这些数据可能已输入为 NA、输入为 999 或输入为 0。示例: 我也想产生一个看起来像这样的最终结果: 我可以使用 NA 值轻松地执行此操作 结果 我现在只想对 999 和 0 值做类似的事情。 同样需要注意的是,需要输入每个 ...

2023-01-06 09:39:19   2   35    r / summarize  
在单个步骤中分组并添加股票类型和另一种类型的变量? - Group and add variable of type stock and another type in a single step?

我想按地区对每个季度的“传入”值求和进行分组,只需一个步骤即可获得最后一个季度 (3) 的“库存”值。 “存量”不能通过季度求和。 我的例子 dataframe: 实际的 dataframe 有大约 45.000 行和 41 个变量,其中 8 个是股票类型。 结果应该是: 我知道如何得到结果,但 ...

折叠行,将所有唯一变量值保留在一列中,将所有值保留在另一列中 - collapse rows, keep all unique variable values in one column and all values in other column

我需要获取此数据并将所有匹配值分组到ESVId列中,同时保留match列中的每个唯一值; 以及与列match中的每个值关联的列Form中的所有值(可能有重复项。)。 当我试过 它以match相同的方式填充Form列,这根本不是我想要的。 我还需要在Form列中保留任何 NA 值。 理想情况下,这会看 ...

在数据框列表中按组计算观察值 - Count observations by group in a list of dataframes

问题我有一个数据框列表。 所有数据框都具有相同的列名,但行数不同。 一列称为pred具有以下四个因素。 苹果樱桃橙子梨我想数一数有多少行是“苹果”、“樱桃”等。 如果我挑出一个数据帧 (dataframe1),并使用以下方法执行计数: 我得到了想要的输出: 这就是我希望列表中包含的多个数据帧的输出方 ...

dplyr 总结了动态数量的统计/条件 - dplyr summarize with a dynamic number of stats/conditions

我想以不同的方式总结我的数据,具体来说,我想计算有多少值大于或等于某个阈值。 我可以很容易地用 eg 做到这一点 但是,我如何通过使用多个动态此类阈值来使用 summarize ? 例如,使用my_thresholds <- c(15, 20)之类的输入,我想获得以下输出: 我认为一种方法是使 ...

基于2个事实表的计算(计划/实际比较) - Calculation based on 2 fact tables (plan/actual comparison)

我必须链接两个表(计划与执行),它们具有:日期、班次、SKU 和数量,以计算计划和执行之间的匹配(以 % 为单位)。 换句话说,我需要使用 3 个字段作为参考(日期、班次、SKU)创建两个表的比较,比较将使用编程与执行生产。 我的表是这样的: 计划表日期程序转移存货单位数量程式 2022/12/0 ...

汇总列中的值,如果它们包含某些字符则为基数 - Summaries values from column, bases if they contain certain characters

我有一个数据集: 我需要根据人们来自的国家/地区是否是瑞士人来总结数据集。 因此,按 Gemeinde 分组,区分该国家/地区是否为瑞士,然后获得 Gemeinde -Swiss 与否的计数总和。 我尝试了什么: 所有国家 “法兰克福、德国和瑞士” 应该成为瑞士人,其余的都应该是“外国”。 我需要的 ...

如何离散化数字列并对其进行汇总,边界不重叠(相当于 Google 表格的“数据透视组规则”)? - How to discretize a numeric column and summarize by it, with boundaries that don't overlap (equivalent to Google Sheets' "Pivot Group Rule")?

我正在尝试找到与 Google 表格的Pivot Group Rule等效的R程序。 也就是说,我想通过用我决定的固定间隔大小离散化一个数值列来总结这些数据。 我几乎得到了想要的输出,但在使用"(a,b]"间隔符号时遇到了问题。 例子df <- data.frame( num ...

n() 计数和 geom_col 图的差异可能是由 group_by() 引起的,但为什么以及如何? - Difference in n() count and geom_col graph likely resulted from group_by(), but why and how?

提前抱歉,我是 R 新手。 所以我正在研究 Divvy Bike Share 数据(详情请参见此处。这是我的 df 的一个子集: 我想可视化一周内压缩和显示的总乘车人数(使用自行车的次数)。 我尝试了两个代码块,唯一的区别是 summarize() - 第二个代码块在函数内部有“月”。 我不明白是 ...

R 代码对多代码问题响应进行分组 - R code to group multicode question responses by

如果在其他地方已经回答了这个问题,请提前致歉 - 我想是的,但经过数小时的搜索,我决定只问一下。 本质上,我有一个 df,其中包含按月对多代码问题的回答(其中 1=是,0=否):我之后的输出是一个列联表(带有 %s),详细说明了 1(“是”)回答的比例每个多代码列按月: 示例数据: 月多码 COL1 ...

如何使用汇总函数从百分比计算中排除 NA 值 - How to exclude NA values from a percentage calculation with summarize function

我是 R 的初学者,我想计算数据框(ileagedata)中值的百分比。 这是我使用的: 这是我的结果: 我不想考虑百分比的 NA 值。 我尝试了 na.rm、na.omit 等几种方法,但我无法使其正常工作。 我不知道将它放在公式中的什么位置。 有人可以帮我说说怎么做吗? 谢谢 ...

如何计算表格中 TRUE 的百分比构成? - How do I count the percentage makeup of TRUES in a table?

这是用于派生我的问题中的第一个表的代码。 ATT_ID 汽车==“B” 数数一错误的 1个二真的 1个三真的 3个三错误的 5个四个错误的 2个五真的 4个六真的 8个六错误的 4个我怎样才能让上面的表格看起来像: ATT_ID “B”的百分比一 0% 二 100% 三 37.5% 四个 0 ...

尝试在向量中 purrr:::map a function,出现“非数字参数”错误 - Trying to purrr:::map a function across a vector, getting `non-numeric argument` error

我想要 map 和 function 跨已定义的列向量生成摘要统计信息。 当我单独运行 function 时,它工作正常,但是当我运行 map 时,我得到一个non-numeric argument to mathematical function 。 这是 function 一些示例数据: fu ...

R 无法汇总 - Cannot summarize in R

我不知道为什么 summarize function 不起作用。 这是我的数据集: https://onedrive.live.com/?authkey=%21AMGFcNnnBmsa3Js&id=B09F9559F6A16B6C%2171378&cid=B09F9559F6A16B ...

2022-11-30 03:42:34   1   23    r / summarize  
plot 没有重叠 geom_text 的条形图的平均值 - plot the mean on barplot without overlaping geom_text

很简单的问题。 我正在尝试为下面的条形图上的每个变量添加方法。 问题是:我无法做到这一点,每当我尝试获得 mean(varUnlist) 的单个值或row 的一堆重复值时。 顺便问一下,错误是正确的吗? 他们对所有types都是一样的吗? plot: 代码: 数据: ...

是否有用于汇总列的自动管道? - Is there an automated pipeline for summing columns?

我需要对多行中的数据求和以创建跨多列的单行。 我处理了一个包含 52 个样本(列)的数据集并手动将它们全部输入,但我很快就要处理一个更大的数据集,其中手动输入是不合理的。 这是我所做的一个小例子。 我相信有一个简单而优雅的解决方案。 ...


 
粤ICP备18138465号  © 2020-2025 STACKOOM.COM