cost 87 ms
根据条件对多列应用定义 - python - Apply definition on multiple columns based on conditions- python

我有 dataframe,当一列等于“02”时,我想要将定义应用于其他 5 列。 这是我的代码: 我收到此错误:“ValueError:使用可迭代设置时必须具有相等的 len 键和值” 但是当我只在 2 列上应用 def 时,这段代码有效: 我该如何解决这个错误? 提前致谢。 ...

使用 dataframe 中的 4 列创建层次结构 - pandas - Creating hierarchy using 4 columns in dataframe - pandas

Dataframe在下方 我需要像这样添加一个额外的列层次结构: 我正在查看的规则如下: 只为填充了过滤器值的行填充层次结构列,行的 rest 不需要完成层次结构。 当找到过滤值不是 null 的行时,查找其 parentID,然后在 ID 列中搜索此 parentid。 当发现隐居继续往上走时 ...

如何用常规 dataframe 中的值替换 multiIndex dataframe 中的级别 2? - How to replace level 2 in a multiIndex dataframe with values from a regular dataframe?

我正在编写一个算法来处理工作中的客户以进行一些数据分析,我按用户 ID 将数据分组为我的级别 1,然后按月份分组为我的级别 2。 然后我按用户对数据进行一些处理工作,这涉及到每月的时间序列。 除了最后一步,我下面的代码完全符合我的需要。 如何用 output 中处理后的时间序列数据重载原始数据? ...

确保连续观察之间的最小时间间隔 Pandas dataframe - Ensuring a minimum time interval between successive observations in a Pandas dataframe

我有一个按日期列排序的 pandas dataframe。 但是,我希望确保观察之间的最小时间间隔。 为简单起见,这个 window 是 10 分钟,这意味着如果我的第一次观察发生在上午 8:05,那么第二次观察必须至少发生在上午 8:15。 必须从 dataframe 删除在上午 8:05-8: ...

如何使用列名未知的 f 字符串模板在 pandas dataframe 中创建新列? - How can I create a new column in a pandas dataframe using a f-string template with unknown column names?

我想编写一个脚本/函数来处理一个相当通用的 pandas dataframe。数据帧是两个数据帧之间pd.merge()操作的结果,其中一个由用户以 CSV 文件的形式提供具有任意列。 我知道所有的值都是文本,但仅此而已。 我想根据其他列的组合值在 dataframe 中创建一个新列。 当列名已知 ...

使用 MultiIndex 缓慢搜索大型 DataFrame - Searching a large DataFrame with a MultiIndex slow

我有一个大的 Pandas DataFrame(~800M 行),我在一个MultiIndex上建立了索引,它有两个索引,一个 int 和一个日期。 我想根据我拥有的整数列表(大约 10k)检索 DataFrame 行的子集。 整数与多索引的第一个索引匹配。 多索引是唯一的。 我尝试的第一件事是对 ...

seaborn 热图中的自定义 xticks - Custom xticks in seaborn heatmap

我有以下热图(只是一个最小的工作示例,我的数据量很大!) 我怎样才能把 xticks 只放在那些所有rows>=2的地方? 在此示例中,它意味着仅放置“1”xtick 因此,在此图像中不应出现“0”和“2”列名称,只能出现“1”,因为这是所有值都大于或等于 2 的列。 问题是 x 轴变得太拥 ...

将文本字段中的多个日期/时间值提取到新的变量列中 - Extract multiple date/time values from text field into new variable columns

我有 dataframe - 见下文。 这只是完整日期框架的一个片段,每个行/IDS 中都有更多文本和日期/时间。 如您所见,每个日期/时间前后的文本是随机的。 我想从 RESULT 列中提取格式为MM/DD/YYYY HH:MM的所有日期/时间,并将每个相应的日期/时间放入它们自己的列中。 ...

当 DataFrame 中的一天不返回值时将 NaN 放入 - Putting NaN when a day in a DataFrame doesn't return a value

我想获取数据框中每一天的“15:30:00.0”行中的最后一个,但正如您在 16 号看到的那样,我们没有获取从 13:00:00.0 到 15 的任何行: 30:00.0 我的DataFrame: 如果我使用下面的代码来尝试拉间隔: Output: 是否可以将 Nan 或其他东西放在那里,以便它识 ...

fillna 仅在一列中,其中其他两列来自不同的数据框 python - fillna in one column only where two other columns are equal from different data frames python

我正在尝试使用自定义表中的信息更新我的主人 data.table。 其中 mt.type 为 null 当 mt.item = ct.item 时更新 mt.type 在 inte.net 上,我找不到根据与主数据框和另一列不同的匹配列来更新数据框中的一列的解决方案。 我想也许我需要这样的东西,但 ...

Python pandas 较低的数据 AttributeError: 'Series' object has no attribute 'lower' - Python pandas lower data AttributeError: 'Series' object has no attribute 'lower'

我想降低从 pandas 工作表中获取的数据并修剪所有空格,然后寻找相等性。 代码如上。 它说 pandas 系列没有较低的方法。 但我需要通过 pandas 框架在 A 列内搜索数据,同时将所有字母降低为小号和空格修剪。 任何其他想法,我怎样才能在 pandas 中实现? ...

根据最接近的索引匹配行 - Match rows based on closest index

我有两个不同的数据框: 数据框1: Dataframe 2: 现在,我正在尝试根据两个索引(芯片和核心)之间的直接匹配以及与时钟速度的最接近匹配来匹配这两个数据帧,以获取“平均瓦特空闲”列。 基本上,dataframe1 中的第一行有 ['PhysicalWindows1', 1, 8, 3400 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM