我有一个 dfs 列表,例如: 我想通过所有的DF创建一个后续的ID。 我想要的 Output 应该是这样的: ...
我有一个 dfs 列表,例如: 我想通过所有的DF创建一个后续的ID。 我想要的 Output 应该是这样的: ...
row_number 查询问题。 要获取 rn 为 1 的数据,您可以包装下面的查询并使用 where rn = 1 导入它。 有没有办法只获取当前查询中 rn 为 1 的那些? ...
我有一个表,其中列id 、 score 、 parent_id按score排序。 我在这里问了一个场景。 与上一个问题不同的是 parent_id 可能出现在多行而不是必要的序列行上。 更新后的表: ID 分数 parent_id 5859 10 5859 2157043 9 585 ...
在 pyspark 中使用 SQL,我无法拼凑使用同一个表的多个 select 语句的逻辑: Select 选择所需列的语句 Select 按时间对数据进行行排序的语句 Select 选择行等级的语句 = 2 对于同一张桌子上的所有人。 有没有简单的实现这个逻辑? 我尝试使用WITH和UNION连 ...
我有一个表,其中列id 、 score 、 parent_id按score排序。 ID 分数 parent_id 5859 10 5859 2157043 9 5859 21064154 8个 21064154 51992 7 51992 34384599 6个 5199 ...
select 查询需要显示除具有特定条件的列的第一条记录之外的所有记录当前数据: 预期数据: 使用的查询: 但是此查询不足以提供所需的数据,因为 RN 将对所有类型进行分区,但我需要为同一 CallID 仅获取类型 0 的 RN。 除第一个Type=0 for same CallID外,在最后的s ...
需要以下逻辑的帮助: 我有一个包含以下数据的订单表: 订单号创建日期卖方 001 01-01-2022 xx 001 02-01-2022 xx 001 03-01-2022 xx 001 04-01-2022 yy 我想要 output 作为: 订单号创建日期卖方序数词 R ...
我想将 row_number 列添加到现有数据框中。 每个行号都需要是唯一的并且递增(最好是连续递增)。 这些 ID 可以在分布在不同工作实例之间的分区之间重复。 此外,我想避免将所有分布在工作人员之间的分区放入单个实例的 memory 中。 由于此处描述的共振, montonically_incr ...
我有两个包含 2 列的表。 我交叉连接并减去值。 然后我找到按减法排序的 row_number 并选择 row = 1 的位置。我正在寻找与 t1.id 最接近的 val 的 t2.id 这些桌子很大。 row_number 函数是否通过在 1 之后对所有内容进行排序来做很多额外的不必要的工作? ...
这是我正在尝试做的事情的简化版本。 我试图根据用户总体步行的英里数对用户进行排名。 此数据存储在名为walks的表中。 每次用户散步时,都会添加一个条目。 填写表格: 如您所见,对于 ID 为 2 和 3 的用户,四舍五入是错误的。发生了什么事? 就像我说的,这是一个简化的例子。 在我的真实情况 ...
我有这张桌子: 我想要的是计算连续出现的事件数,以检查事件“OCT”是否连续发生了 4 次。 例如: 理想的输出: 我试过的是行号()但它给了我: 你看? 我不希望它把 5 月 12 日和 15 日的事件“OCT”算作 5 和 6。我只想看看每个事件是否连续发生 4 次(按日期) 谢谢! ...
这是查询: 执行时间是1分16秒,也许你能帮我优化一下? 这个查询只是一小段代码,但我发现正是这一部分减慢了这个过程。 当我尝试从链接服务器的这些表中获取我的行号时,我试图认为问题可能出在子选择中,数据在几秒钟内执行,我认为问题出在功能上。 我希望可以优化此查询。 ...
一个用户最多可以有一个有效的服务记录(或没有),但是可以有许多以前取消的服务记录。 我正在尝试为每个用户选择最近取消的服务记录,或者如果最后的服务记录没有被取消,则不选择任何内容。 我认为 ROW_NUMBER 是必需的,但我无法找出正确的 SELECT 语句。 这是详细信息。 ...
有一个很大的头脑停止问题。 需要将 sql 结果集从每个 EMPLOYEECODE 的多个记录扁平化为一个。 保留每条记录的最短开始时间并显示最长结束时间。 希望图像是解释性的。 很想知道如何交付它。 谢谢! 原始结果集必需的结果集 ...
所以我有一个看起来像这样的表: 学生卡入学日期 23 03/01 23 05/01 23 07/05 23 08/11 23 03/01 我需要 select 这些记录,这样我得到以下记录: 学生卡入学日期 23-1 03/01 23-2 05/01 23-3 07/0 ...
问题用 position 号码、球员姓名和最佳成绩组成一个记分牌。 如果两个玩家的分数相同,则他们共享 position 并且名字按字母顺序排列。 (参见示例。) 我有两张桌子 预期结果是: 命令姓名分数 1个丽莎 200 1个迈亚 200 3个卡勒皮 100 3个乌莱维 100 5个科 ...
我有一个 Snowflake 查询,当前输出结果如下: ID 城市水果数量 123 洛杉矶香蕉 1个 123 洛杉矶草莓 1个 124 洛杉矶香蕉 3个 125 纽约苹果 2个我希望它只返回一个包含水果最大值的 ID 行,所以在这种情况下,它看起来像: ID 城市水果数量 123 洛杉矶草莓 1 ...
对于 google BigQuery 中的查询,我想用一个较短的数字唯一标识符替换一个长的 hash,以便之后保存一些 memory,所以我这样做: 我什至不需要 id 中的订单,但ROW_NUMBER()需要一个ORDER BY 。 当我在我的数据集(> 10 亿行)上尝试此操作时,出现 m ...
我有以下问题。 我通过使用 rownumber() function 和 over(paritation by 子句生成了以下 RowNumber 列。每次列出新的 part_no 时,计数都从“1”开始: 序列号零件编号行号等级 110 珠三角101 1个 1个 120 珠三角101 2个 ...
我想用 case 条件配置 row_number。 查看“time_diffs”列并检查 - 如果有 1 的 go 一个一个,那么它就是一组。 如果有 0,则每个 0 本身就是一组。 在 1 和 0 之间的每次迭代之后,行结果将在 +1 上增长。 当前查询结果: session_id playe ...