cost 114 ms
如何分别提供来自分类列的日期分组

我有一个事务表,其中列出了在一个列中开始的每个人的性别,以及他们在另一列中开始的日期。 我想执行一个 groupby,它会生成一个按日期计算每个性别的数据框。 任何想法? 应该导致 我想我需要在一个列表上运行一个 groupby,然后是一个 pivot,但是我的 groupby 正在生成一个 ...

2022-07-02 15:58:02 3 25
SQL group_map 保留重复键

当我尝试使用 collect_list(group_map['key']) 某些表时,如何保留重复的 id 行? 当我选择 my_map_select 时,我必须按 ID 排序,但我想保持重复! 我期望返回的是类似于: ID 乙 一个 控制 ...

2022-07-01 23:29:08 0 20
将 grouby dict_keys 转换为带有键值的字典

对于下面给出的示例文件,如何将groupby键转换为字典,然后将整数分配给键? 我希望最终能够遍历字典,从字典中为每个相应的键提取数字。 到目前为止,这是我的代码: 分配的整数可以在[5, 3, 7, 7, 2]之类的数组中吗 这是我的数据文件: ...

2022-07-01 16:54:02 1 20
带有“特定分区”的行号/排名

桌子是这个 这里的 row_number 是错误的,我想计算它以便按实际周(从星期一到星期日)对日期进行分组,即前 4 行为 1,第 5 到第 8 行为 2,第 9 行为 3到 13 以此类推。 也许这可以通过排名来解决,但请注意,所需的列并不总是由 year_week 的变化决定。 结果表将是: ...

2022-07-01 16:24:24 1 24
过滤和计算组内的平均值ggplot2

我正在使用一个大型df,试图通过不同的感兴趣属性过滤数据来制作一些图。 假设我的 df 看起来像: df(站点=c(A,B,C,D,E), 子站点=c(w,x,y,z), 日期=c(01/01/1985, 05/01/1985, 16/03/ 1995, 24/03/1995), 种=c(1,2 ...

2022-07-01 16:02:38 1 12
跨多年按月和年分组

寻求帮助,我确信这是一个简单的新手错误。 我查询中的 GROUP BY 函数不区分不同年份。 所有年份的 7 月数据都包含在同一行中,而不是按月+年。 我错过了什么? 这是除 GROUP BY 函数以外的查询正常工作: 输出格式如下: 月 维护 修 ...

2022-07-01 09:39:08 0 20
反转R中数据中每个“id”的行顺序

我正在使用 R 并遇到以下问题。 我有一个名为data 。 data的列包括id和date 。 id代表个人身份证号码。 在每个id中,有几行按date排列。 但是, date顺序相反,所以我想再次反转行。 我不知道该怎么做。 我尝试使用group_by(id) ...

2022-07-01 02:37:43 1 18
Python pandas根据卡片中转系统中的组比较前几行

对于上下文化,在此数据框中,城市公交系统中的每张卡验证都是一行。 在这个城市,有一条规定:如果下一次验证在90分钟内完成,将获得50%的票价折扣。 这就是我们所说的INTEGRACAO = True。 但是,它仅对两个验证组有效,在第三个验证中您无法获得任何折扣。 无论如何,如果第四次验证也在 9 ...

2022-06-30 22:55:45 0 22
如何根据组条件进行过滤

应根据标志列过滤后续 DataFrame。 如果基于列id和cod的组没有任何值与None不同的行,则需要只维护一个唯一行,否则,需要删除列flag中具有None值的行。 如何使用 PySpark 基于上一个 DataFrame 获取下一个 DataFrame? ...

2022-06-30 19:28:40 3 35
简化 SQL 查询

我正在使用https://www.bixi.com/en/open-data上的 Bixi 公共数据集,并被要求查找“数据集中每个年月组合的平均每日出行次数”。 这是我要查询的表的示例: ID 开始日期 start_station_code ...

2022-06-30 18:51:19 2 50
SQL Group by/聚合函数不包括记录

我正在尝试从多个不同的表中提取一个月内发生的所有交易的综合报告。 我构建的查询始终排除 96 个交易 ID,所有交易 ID 都具有相同的帐户 ID。 我无法弄清楚为什么会这样。 这是我在下面使用的代码。 有什么想法吗? ...

2022-06-30 16:17:00 0 21
出现在 Group By 子句中或在聚合函数中使用

计算第一个实际购买的项目并填充 tr2_invoice 中的 first_actual_item 列。 错误:列“tr_invoice.total_amount”必须出现在 GROUP BY 子句中或用于聚合函数第 1 行:SELECT cust_id、total_amount、items、 ...

2022-06-30 09:26:33 1 18
如何搜索包含特定数据对的数据帧子组?

我有一个数据集,其中包含订单和这些订单中的项目。 我想找到的是哪些项目对一起存在于哪个组中。 例如,我想查找同时具有 6395477 和 6391546 的订单,在这种情况下,订单 20220627-0015 和 20220627-0014 有它们。 我使用以下代码从items列表中创建了项目对 ...

2022-06-30 06:19:47 3 69
(熊猫)如何按功能重复熊猫分组中的项目标签?

我有以下数据(df): 我想制作一个简单的枢轴(如下所示的嵌套枢轴),其中标签像黄色单元格一样重复。 但是,我得到了这个 我的代码: 请告诉我如何重复标签,就像我们在 Excel 数据透视表中所做的那样。 谢谢 ...

2022-06-30 05:23:53 2 19

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM