cost 109 ms
类似aj(asof join)的function如何返回给定日期之前右表中的所有记录? - How to return all records in the right table before the given date with a function similar to aj (asof join)?

在 DolphinDB 中, asof join返回右表中给定时间之前的最新记录。 是否有类似于aj的 function ,但返回给定日期之前的所有先前记录和 forms 一个新表? 我有以下两个表,tb1 和 tb2。 在 tb2 中,日期列中的每个值都是一个月的第一天,每个目标(A、B 和 C ...

Pandas 合并判断Value是否存在 - Pandas Merge to Determine if Value exists

我有一份清单表格数据进入电子表格,我试图确定是否未检查特定值并提供基于此的信息。 我的第一个想法是拥有一个主列表/df,其中所有表单值然后对每个响应进行左/右合并以确定不存在的值。 示例数据和脚本。 对于第二组中缺少的地址响应,期望nan/NA ,有 6 行而不是原来的 5 行。 ...

合并 Pandas Dataframe 中的行,填充 NaN 值并删除重复项 - Merge rows in a Pandas Dataframe filling NaN values and removing duplicates

我正在尝试清理包含带有“重复”(但不完全重复)人员信息的脏数据的 Python Pandas dataframe 。 不幸的是,我没有明确的“主键”,因为列id并不总是设置,而且我有一个不同名称( name , name2 , name3 )的列表,它们并不总是匹配(有时我有相同的name但不同na ...

合并后在数据框中填充na值 - Fill na values in dataframe after merge

我有 2 个数据框,我想合并名字并联系电子邮件,返回 df2 中的所有值。 数据样本: 合并 合并的输出 问题是由于两个表中名称和电子邮件之间的差异,某些行无法匹配,因此我想对名字和姓氏执行另一次合并以填充缺失的 nan 值。 我尝试使用 combine_first 函数,但由于索引不同 ...

如何查看DF1中的id是否在过去30分钟内出现在DF2中? 使用 Pandas - How to check if id in DF1 appeared within the past 30 minutes in DF2? using Pandas

我有带 customer_id、datetime 和 fruites 购买的 DF1,以及带 customer_id、datetime 和 Veggies 购买的 DF2,如何检查在购买水果的过去 30 分钟内客户是否购买了 Veggies? 客户ID 购买日期水果项目 1个 2019-08-01 ...

Python:动态地从多列中选择列值 - Python: Selecting column values from multiple columns dynamically

我有 2 个数据框。 第一个是汇总表,汇总了每个行业及其来源的准确性(按降序排列)。 在第二张表中,Source A 和 B 中有字符串列表,它们可以是空值: 对于每一行/公司,我应该 select 第一个具有最高精度的非空源,如下表所示: 例如,对于 company1 和 2,尽管它们都来自“化工 ...

识别导致两个数据帧之间不匹配的列 - Identify columns which cause non match between two dataframes

我比较了两个数据帧( df1和df2 ),对于给定的键组合,每个数据帧都应具有唯一的行。 这意味着Col1和Col2等键没有重复项。 首先,我天真地确定哪些行不匹配 然后我想找出导致这种不匹配的列,考虑到唯一性键(?)。 因此,例如,要知道Col2导致与键Col1 = 'A'和Col3 = '2'不 ...

按日期更新另一个 DataFrame 中的值 - Update values in a DataFrame by values in another by date

我试图制作一个代码来输入项目的版本。 有两个数据框,一个包含项目,一个包含版本信息。 这是我制作的虚拟数据和代码: 所以我尝试的是这段代码。 实际上这段代码有效,但我认为它效率不高,因为它在大约 1~2 分钟内给了我一个结果。 (200 个项目)。 ...

在 python 中使用 df.loc 时出现 AssertionError - AssertionError when use df.loc in python

我创建了一个脚本来加载数据、检查 NA 值并填充所有 NA 值。 这是我的代码: 但它没有用。 我检查了我的代码,发现这个问题来自 loc()。 例如: 我得到的是: 我不知道为什么 df[column_name] 可用,但 df.loc[index,columns_name] 是错误的。 你可以 ...

将一个 dataframe 中的列值作为列表附加到另一个 - Appending column values from one dataframe to another as a list

我有几十个非常相似的数据框。 我想要的是将每个列的所有“VALUE”列值组合到列表中,并返回一个 dataFrame,其中“VALUE”列由这些列表组成。 我只想对“PV”包含子字符串列表中的 substring 的行执行此操作。 我想出了一种我认为可行的方法,但它真的很讨厌而且无论如何都不起作用( ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM