我正在尝试获取 dataframe 中所有变量的三分位数的长期平均值。基本上,我想要每个变量的三个三分位数的平均值。 以下是第二个三分位数的示例。 数据结构: 我现在做的是: 我获得了一个充满 NaN 和一些值的 dataframe,我不明白我定义的 function 在 group_by() 和 ...
我正在尝试获取 dataframe 中所有变量的三分位数的长期平均值。基本上,我想要每个变量的三个三分位数的平均值。 以下是第二个三分位数的示例。 数据结构: 我现在做的是: 我获得了一个充满 NaN 和一些值的 dataframe,我不明白我定义的 function 在 group_by() 和 ...
我在sf package 中使用 R 的summarize function 来消除一些多边形的边界,但我遇到了问题,因为它在某些情况下会返回错误。 举一个具体的例子,当我试图在第 80 届美国国会的形状文件中溶解加利福尼亚州 state 的地区边界时,我得到以下错误: 使用的代码如下: 它在其他 ...
我想请您帮助解决以下问题: 我有一个名为 IncomeTable 的表,其中包含三列:Team、Income (Value)、Date (month + year) 我有另一个具有非常相似结构的表 CostsTable: 我想做的是创建一个新的计算表,如下所示: Date 列上的这两个表之间存在关 ...
我正在尝试生成一个通用脚本,我可以将其应用于多个数据集以检查丢失的数据,这些数据可能已输入为 NA、输入为 999 或输入为 0。示例: 我也想产生一个看起来像这样的最终结果: 我可以使用 NA 值轻松地执行此操作 结果 我现在只想对 999 和 0 值做类似的事情。 同样需要注意的是,需要输入每个 ...
我想按地区对每个季度的“传入”值求和进行分组,只需一个步骤即可获得最后一个季度 (3) 的“库存”值。 “存量”不能通过季度求和。 我的例子 dataframe: 实际的 dataframe 有大约 45.000 行和 41 个变量,其中 8 个是股票类型。 结果应该是: 我知道如何得到结果,但 ...
我需要获取此数据并将所有匹配值分组到ESVId列中,同时保留match列中的每个唯一值; 以及与列match中的每个值关联的列Form中的所有值(可能有重复项。)。 当我试过 它以match相同的方式填充Form列,这根本不是我想要的。 我还需要在Form列中保留任何 NA 值。 理想情况下,这会看 ...
问题我有一个数据框列表。 所有数据框都具有相同的列名,但行数不同。 一列称为pred具有以下四个因素。 苹果樱桃橙子梨我想数一数有多少行是“苹果”、“樱桃”等。 如果我挑出一个数据帧 (dataframe1),并使用以下方法执行计数: 我得到了想要的输出: 这就是我希望列表中包含的多个数据帧的输出方 ...
我想以不同的方式总结我的数据,具体来说,我想计算有多少值大于或等于某个阈值。 我可以很容易地用 eg 做到这一点 但是,我如何通过使用多个动态此类阈值来使用 summarize ? 例如,使用my_thresholds <- c(15, 20)之类的输入,我想获得以下输出: 我认为一种方法是使 ...
我必须链接两个表(计划与执行),它们具有:日期、班次、SKU 和数量,以计算计划和执行之间的匹配(以 % 为单位)。 换句话说,我需要使用 3 个字段作为参考(日期、班次、SKU)创建两个表的比较,比较将使用编程与执行生产。 我的表是这样的: 计划表日期程序转移存货单位数量程式 2022/12/0 ...
我有一个数据集: 我需要根据人们来自的国家/地区是否是瑞士人来总结数据集。 因此,按 Gemeinde 分组,区分该国家/地区是否为瑞士,然后获得 Gemeinde -Swiss 与否的计数总和。 我尝试了什么: 所有国家 “法兰克福、德国和瑞士” 应该成为瑞士人,其余的都应该是“外国”。 我需要的 ...
我正在尝试找到与 Google 表格的Pivot Group Rule等效的R程序。 也就是说,我想通过用我决定的固定间隔大小离散化一个数值列来总结这些数据。 我几乎得到了想要的输出,但在使用"(a,b]"间隔符号时遇到了问题。 例子df <- data.frame( num ...
提前抱歉,我是 R 新手。 所以我正在研究 Divvy Bike Share 数据(详情请参见此处。这是我的 df 的一个子集: 我想可视化一周内压缩和显示的总乘车人数(使用自行车的次数)。 我尝试了两个代码块,唯一的区别是 summarize() - 第二个代码块在函数内部有“月”。 我不明白是 ...
如果在其他地方已经回答了这个问题,请提前致歉 - 我想是的,但经过数小时的搜索,我决定只问一下。 本质上,我有一个 df,其中包含按月对多代码问题的回答(其中 1=是,0=否):我之后的输出是一个列联表(带有 %s),详细说明了 1(“是”)回答的比例每个多代码列按月: 示例数据: 月多码 COL1 ...
我是 R 的初学者,我想计算数据框(ileagedata)中值的百分比。 这是我使用的: 这是我的结果: 我不想考虑百分比的 NA 值。 我尝试了 na.rm、na.omit 等几种方法,但我无法使其正常工作。 我不知道将它放在公式中的什么位置。 有人可以帮我说说怎么做吗? 谢谢 ...
几个国家的咖啡进口数据问题背景*Element *col 有两个分类值:Import Quantity 和 Import Value item col 有五个分类值:Coffee Green, Coffee Extracts, Coffee husks and skins, Coffee subs ...
这是用于派生我的问题中的第一个表的代码。 ATT_ID 汽车==“B” 数数一错误的 1个二真的 1个三真的 3个三错误的 5个四个错误的 2个五真的 4个六真的 8个六错误的 4个我怎样才能让上面的表格看起来像: ATT_ID “B”的百分比一 0% 二 100% 三 37.5% 四个 0 ...
我想要 map 和 function 跨已定义的列向量生成摘要统计信息。 当我单独运行 function 时,它工作正常,但是当我运行 map 时,我得到一个non-numeric argument to mathematical function 。 这是 function 一些示例数据: fu ...
我不知道为什么 summarize function 不起作用。 这是我的数据集: https://onedrive.live.com/?authkey=%21AMGFcNnnBmsa3Js&id=B09F9559F6A16B6C%2171378&cid=B09F9559F6A16B ...
很简单的问题。 我正在尝试为下面的条形图上的每个变量添加方法。 问题是:我无法做到这一点,每当我尝试获得 mean(varUnlist) 的单个值或row 的一堆重复值时。 顺便问一下,错误是正确的吗? 他们对所有types都是一样的吗? plot: 代码: 数据: ...
我需要对多行中的数据求和以创建跨多列的单行。 我处理了一个包含 52 个样本(列)的数据集并手动将它们全部输入,但我很快就要处理一个更大的数据集,其中手动输入是不合理的。 这是我所做的一个小例子。 我相信有一个简单而优雅的解决方案。 ...