
[英]Groupby operation from DataFrame
我对以下使用groupby的情况感到困惑。 情况1和2有什么区别? 我明白DataFrame.groupby会返回DataFrameGroupby object。但是情况1怎么还停留在DataFrame类型呢? 数据是 DataFrame 从 pandas sql 结合几张表查询 我将数据分组并删除 ...
[英]Groupby operation from DataFrame
我对以下使用groupby的情况感到困惑。 情况1和2有什么区别? 我明白DataFrame.groupby会返回DataFrameGroupby object。但是情况1怎么还停留在DataFrame类型呢? 数据是 DataFrame 从 pandas sql 结合几张表查询 我将数据分组并删除 ...
[英]Putting NaN when a day in a DataFrame doesn't return a value
我想获取数据框中每一天的“15:30:00.0”行中的最后一个,但正如您在 16 号看到的那样,我们没有获取从 13:00:00.0 到 15 的任何行: 30:00.0 我的DataFrame: 如果我使用下面的代码来尝试拉间隔: Output: 是否可以将 Nan 或其他东西放在那里,以便它识 ...
[英]SQL-find the ratings with the max complete_date with group by
请在 sqlfiddle 上运行 DDL 和 DML。 我正在尝试提出一个查询来查找具有最大 complete_date 的 FID 的评级动态链接库: 动态语言: 我的查询是: 它没有返回我想要的东西。 理想的 output 将是: 评级 FID complete_date 中型 182 2022 ...
[英]Use UNION ALL and GROUP BY to combine 3 TSQL statements into one query
我有 3 个单独工作的 TSQL 查询,但我需要将它们组合成一个查询。 在 Microsoft Access 中,它们使用以下 SQL 语句成功组合; 但是,我正在尝试使用 TSQL 对所有数据进行逆向工程。我怎样才能在 TSQL 中做同样的事情? 请记住ap.property_id和af1.pro ...
[英]SQL: how to get sum of grouped items for a given corhort
我有以下orders表: 这是一个小提琴: http://sqlfiddle.com/#!17/71698/3 我想在那些曾经购买过travel产品的客户中获得按product分类的revenue总和。 本例中,客户1、3、4、5、6购买了travel产品。 因此,所需的结果集将如下所示: 客户ID ...
[英]Arrange the dataframe in increasing or decreasing order based on specific group/id in Python
我有这样的 dataframe: 上面的 dataframe 看起来是这样的: 这里, id 'A' 为 11 周期 id 'B' 为 6 周期 id 'C' 为 6 周期 id 'D' 为 4 周期 id 'E' 为 9 周期我需要根据以下两种情况对 dataframe 进行重组: 案例一:循 ...
[英]Remove rows with all NA values after groupby r
我想在使用 group_by 后删除所有具有 NA 的行。 这是一个示例数据集: 如果列值全部为 NA,我想按 Col1 分组并删除行。 所以所需的 output 是: 列1 列2 列3 列4 乙 8个 7 北美 C 北美 6个 7 丁 9 8个 7 P1 10 北美北美 P2 8个 7 ...
[英]How to get SO and group by user_id and last created_at in Mysql
我正在尝试获取用户和操作系统数据,但不是数据列表,而是按上次创建日期对其进行分组。 这是我的数据示例。 我的 SQL 是: 结果是: 但是我想要的是例如从用户 50 返回我最后一个创建并根据操作系统添加以这种方式留下结果。 预期结果: 如何更改 SQL 以获得预期结果? ...
[英]Python groupby: Custom analysis of each group
我有一个包含排名数据的 excel 文件。 这些列是 ID、日期和等级。 我想找出从一个级别移动到另一个级别所需的平均时间。 为此,我想按 ID 对我的 dataframe 进行分组,然后按时间排序,然后对于每对连续的条目,计算一个三元组 (rankA, rankB, timeDiff) 例如对于以 ...
[英]Nested Group by with count and average
我有这个数据集: 协议年规定1 规定2 规定3 罗马 2012 1个 1个 0 纽约 2012 1个 1个 1个巴黎 2013 1个 0 1个东京 2013 1个 1个 0 我想分组以获得 output: 年每年计算协议每年计算规定每年平均拨款 2012 2个 5个 2.5 2013 ...
[英]Sort the products based on the frequency of changes in customer demand
想象一下给出以下 dataframe。 我有产品列、custome_demand_date(每周都有新的客户对未来几个月的产品需求)和数量需求的月份。 如何确定哪个产品在几个月内客户需求变化最频繁,并按照变化频率从高到低的顺序对产品进行排序? 我曾尝试按产品分组,累积需求数量,但没有一个可以横向(每 ...
[英]Python Pandas - How to group by one column, and combine the data of two other columns on each group on certain conditions
我有一个 dataframe 如下 主键姓名价值 123 美国广播公司值 1 123 定义值 2 123 志值 3 456 美国广播公司值 4 789 钠盐值 5 789 钠盐值 6 147 钠盐价值 7 我想应用以下逻辑: 按“主键”列的值分组如果名称列不是 NaN,则创建一个新列“d ...
[英]PARTITION BY and COUNT function not returning thesame value
我需要有关 Postgres 上此分区命令的更多信息。 因为它们不返回相同的值。 假设这是一张桌子序列号性别 1个男生 2个男生 3个男生 4个女孩我使用计数命令: 我得到: 性别数数男生 3个女孩 1个但是当我使用分区方法时: 我得到: 性别数数男生 1个女孩 1个请问我错过了什么?? ...
[英]Draw rows based on probabilities in R
我有两个数据集。 我想根据第一个数据集的“概率”为第二个数据集的每一行分配第一个数据集中的“组”。 我想做的逻辑如下: 按时期和社会演示对第一和第二数据集进行分组。 对于第一个数据集中的每个社会演示概率,从具有相同时期和社会的第二个数据集中随机抽取行数相应地分配一个“组”(有 4 个组) 我的数据集 ...
[英]Find consecutive indices of common values in a group
对于下面的DataFrame : df 对于每个Name列组,我试图在其他列中找到相应的连续公共值的start index和end index 。 如果值连续重复,则应将其视为常见值,并将其存储到以键为起始索引、值为结束索引的字典中。 例如Tesla在Type列中有Model X common,所以 ...
[英]How to group by overlapping one-hot encoded categorical data in Pandas?
我有一个游戏数据集,其中包含评论评分和游戏是否在出版物中出现的分类数据——将以下内容作为数据集的简化版本: mediaAppearances 是一个分类特征,对任何记录都有多个潜在值 - 它捕获游戏是否出现在给定发布者的报告中。 该功能经过单热编码,为每个发布者生成离散的 boolean 列(即 ...
[英]Pandas: insert a number for the unique value in each group
我的 DataFrame 是: 我通过df['Dense_Rank'] = df.groupby('ID')['Country'].rank(method='dense')添加了一个附加列但是,我不喜欢 27637 组,因为英国被标记为 2.0,而波兰被标记为 1.0。 由于英国首先出现,我希望它被 ...
[英]I can't create this PostgreSQL Query: Grouping by a different condition to the "order by" condition
我需要以不同的方式对我的查询进行排序我需要对表进行分组。 我需要计算每个部门有多少男性,但按每个部门的人数(不仅是男性,还有女性)以降序方式组织查询。 这是表格的图表和代码: 表的关系 model 我尝试了这两个查询,它们以不同的方式给出了预期的结果: 我只需要一个查询就可以得到这些结果 ...
[英]Select mode of each group and assign back to the original dataframe on a condition
我有一个这样的 dataframe:df = pd.DataFrame({ 'id_vector': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'D', 'D', 'D', 'D', 'E', 'E' ...
[英]Apply function on dataframe by specific group in R
我有一个 dataframe,看起来像这样: 我想要我的 dataframe 中某些特定列的dist摘要。 到目前为止,我使用了自定义 function: 并将其应用于我目前想要的任何特定列: 几周前我试过了,会得到这样的东西> 当我现在尝试时,出现错误: 发生了什么变化,我该如何解决这个问 ...