cost 119 ms
根据列表中的元素在 dataframe 中添加行

[英]Add rows in a dataframe based on a elements in a list

我有以下列表 & dataframe: 我需要每个 ID 都具有“lis”中列出的所有功能。 ID1 有“颜色”、“材质”、“手柄”,但 ID2 没有“材质”,ID3 没有“手柄”。 我需要我的 output 如下所示: 我尝试遍历 dataframe 的行并为每一行创建一个字典,但是因为 ...

如何根据选定的列使用 pandas DataFrame 将行聚合在一起

[英]How can I aggregate rows together according to a selected column using a pandas DataFrame

这是我在 Stack Overflow 中的第一个问题。 我会淡化我目前遇到的问题。 我正在尝试为基于用户的协同过滤推荐系统清理数据集。 这是我对所有用例的数据集的过度简化 从我获取数据的方式来看,我知道即使 John、Jane 和 Joe 可能会重复自己多次,但他们对任何给定电影的评分永远不会超过 ...

根据条件从另一个 Dataframe 添加新数据到 Dataframe

[英]Adding new data to a Dataframe from another Dataframe based on condition

所以我的问题是如何根据另一个 dataframe 的条件将新列中的数据添加到 dataframe。这很难说,所以我在这里举个例子 我想在这里做的是将另一列 f 添加到 df2,它的值来自 df1 这样如果 d[i] 在 a[j] 和 b[j] 之间,则将值 c[j] 复制到df2 中的新列 f[i ...

使用用户输入过滤 Pandas dataframe

[英]Filter Pandas dataframe with user input

我正在尝试开发此代码,其中我将为不同的变量提供某些输入,这些将使过滤器发生并返回过滤后的 dataframe,此输入将始终只接收一个值,用户将选择更少的选项,如果输入为空,则该过滤器必须带入所有数据。 我没有输入用户输入,因为我先测试了 function,但是,function 总是返回一个空的 ...

从线性模型创建 dataframe 的 r2、残差和系数

[英]create dataframe of r2, residuals, and coeff from linear models

完全像这个问题,但你如何也得到每个 model 的 R 平方值? 关联样本数据 此处对我正在处理的数据进行了更深入的解释,但我相信上面提供的样本数据就足够了data 。 理想情况下,我想使用 utc_datetime 作为 x 轴/IV 值,但我尝试过的代码都无法使用它,所以我创建了 hrs_si ...

如何根据条件返回值 pandas DataFrame?

[英]How to return values based on conditions with a pandas DataFrame?

我有一个名为 m_salary_df 的 DataFrame,如下所示: 月薪水一月。 100 美元二月 200美元行进 200美元四月 150 美元您如何只返回工资与前一个月相比有所增加的月份? 上面的DataFrame,返回的应该是2月份而已。 自从 2 月的工资与 1 月的工资相比有所增加 ...

使用 case when 为原始列中的每个 notNull 分配 1 的 spark df 的每一列添加相应的列

[英]add corresponding columns for every column of the spark df that assigns 1 for every notNull in the original column using case when

我有一个样本 dataframe: 我的用例有 15 列我想做的是使用 case when 和循环,添加与原始列中除前两列之外的每一列相对应的新列。 在这些新列中,如果不是 Null,它将给出 1 的值,否则为 0。 我的目标是获得如下内容: 前五列是原始列,最后三列将添加来自“col1”、“col ...

只在 dataframe 中留下重复的行,与 R

[英]Only leave duplicated rows in a dataframe, with R

我有一个 dataframe,看起来像这样: col1 列2 列3 tn1 一种 b tn1 一种 c tn2 d b tn3 一种 b 我只想保留那些为 col1 和 col2 重复的行,保留两行: col1 列2 列3 tn1 一种 b tn1 一种 c 我一直在尝试通过使 ...

删除包含所有“nan”值的 pandas dataframe 列

[英]Drop pandas dataframe columns containing all 'nan' values

我有这个 dataframe 我如何获得这些是通过在 tkinter GUI 中上传用户选择的 excel 文件。 我想删除包含所有“nan”值的列。 即使它们包含所有“nan”,这些行也很好。 我只想删除列。 到目前为止,我已经尝试过这些命令。 DFT = DFT.dropna(axis=1, ...

如何用一行代码连接两个数据框

[英]How to connect two dataframes with one line Code

我正在解决 Titanic Kaggle 代码并使用 pandas 进行数据分析。数据在这里 ( https://www.kaggle.com/competitions/titanic/data ) 我有两个 Dataframe,我想用聚合代码连接它们。 而我将这些代码与列方向联系起来的结论就是这样 ...

如何使用 if/elif/else 和列中的最小值计算数据?

[英]How to calculate data using if/elif/else and minimum value in columns?

例如,我有 DataFrame: 我正在尝试计算df['color_4']列的值,并且我正在尝试用一行代码来完成。 但也许这是不可能的。 计算逻辑如下,对df['name'] == 'A' and 'B'有效,对df['name'] == 'C'无效,需补充 需要继续计算,如果值在df['col_ ...

如何找到多索引 dataframe 的两个键之间的重叠行数?

[英]How to find the overlapping count of rows between two keys of a multindex dataframe?

两个数据帧已与具有相同索引的不同键(多索引数据帧)连接。 日期是索引。 每个 dataframe 中有不同的产品作为列名称及其价格。 我基本上必须找到这两个数据帧和重叠周期数之间的相关性。 相关性已完成,但如何找到每个 dataframe 中每个产品的重叠行数,并生成 dataframe 的结果, ...

如何匹配 R 中的线性回归结果与 group_by dplyr 相同的 output?

[英]How can I match the result of linear regression in R to be the same output as group_by dplyr?

我在 R 有一个数据集: 如果我想计算每个 char1 变量的列向量的平均值,可以这样做: 对于 char2 变量: 结果分别与这两种情况的线性回归系数相匹配。 但是,如果我想计算每个 char1 和 char2,我会在 R 中执行: 这两个变量的线性回归等价物是多少? 有什么帮助吗? ...

使用 .loc 从 Dask 访问一个值

[英]Accessing a value from Dask using .loc

对于我的生活,我不知道如何组合这两个数据框。 我使用的是所有软件的最新版本,包括 Python、Pandas 和 Dask。 我的 dask dataframe 有一个字符串作为其访问索引,但是当我执行daskframe.loc[index_str]它返回一个 dask dataframe,但我认为 ...

如何通过汇总列中的信息将“事件”数据转换为国家/地区年份数据? 使用蟒蛇/熊猫

[英]How to convert "event" data into country-year data by summating information in columns? Using python/pandas

我正在尝试转换一个 dataframe,其中每一行都是一个特定的事件,每一列都有关于该事件的信息。 我想把它变成数据,其中每一行都是一个国家和年份,其中包含有关给定年份事件的数量和特征的信息。在这个数据集中,每个事件都是恐怖主义的发生,我想总结列 nkill、nhostage 和 nwounded ...

将 dataframe 中的小时-分钟-秒持续时间转换为分钟

[英]Convert hours-minutes-seconds duration in dataframe to minutes

我有一个 csv,其中有一列表示两个离散事件的持续时间。 我想将该持续时间分成两个不同的列,并始终以minutes为单位表示时间。 现在,它以hours 、 minutes和seconds显示,例如S: 3h0s, P: 18m0s 。 所以 output 应该是这样的: 但是当我在str.repl ...

使用 to_csv() function 导入的已保存 DataFrame 的索引问题

[英]issue with index on a saved DataFrame imported with to_csv() function

嗨,我已经通过 csv 以这种方式创建了一个 DataFrame 和 pandas 看起来像这样 当我使用 to_csv() 保存此表并使用to_csv() read_csv()其导入另一个项目时,表的索引被视为一列,但它是索引 或者 我该如何解决:) ...

使用组合键合并 pandas 中的数据框

[英]Merge dataframes in pandas with a combination of keys

我有两个数据框,我需要根据一个键(一个“事件编号”)将它们组合在一起。 然而,关键是重复的,因为它们将被摄取的数据库需要特定的坐标格式。 如何根据键的组合加入必要的列? 例如,这两个表如下所示: 事故编号纬度/经度 GPS坐标 AB123 纬度 32.123 AB123 长 120.123 CD ...

pandas dataframe 遍历行时根据当前行设置上一行值

[英]Set previous row value based on current row in pandas dataframe when iterating over rows

我有一个 dataframe,其中附加信息存储在新行中(从格式不正确的 PDF 中提取的数据)。 如果Amount列为空,我想将Transaction details中的值复制到上一行的Type列中。 如果它还可以修剪Purchase部分,那就太好了,因为我只想要Purchase标题并删除旧行。 当 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM