
[英]Extract specific columns and others columns containing certain characters in a for loop
假设对于 dataframe df如下: 出去: 我想在 for 循环中提取date列以及买卖价格的实际值和预测值: 出去: 另一种处理方法是通过grep搜索关键字,并添加date列: 但是,以上两种方案仍然存在BUG,如何处理呢? 谢谢! ...
[英]Extract specific columns and others columns containing certain characters in a for loop
假设对于 dataframe df如下: 出去: 我想在 for 循环中提取date列以及买卖价格的实际值和预测值: 出去: 另一种处理方法是通过grep搜索关键字,并添加date列: 但是,以上两种方案仍然存在BUG,如何处理呢? 谢谢! ...
[英]Calling variables with f-string inside concat for loop
我正在尝试使用pd.concat组合数据帧。 我有 7 个模型,根据年份(2021 年和 2022 年)分为 2 个,所以我总共有 14 个数据框,每个数据框包含 4 列。 它们可以通过以下命令创建: 现在,我想将这些组合成 8 个新数据框,每个数据框代表 1 年和 1 列,所以 2 年 * 4 列 ...
[英]Replacing strings in one column with the details of another column in a single dataframe
我需要能够在单个 dataframe 中将一列中的值替换为另一列中的值 我将此 excel 文件作为 pandas dataframe 导入,但如何将左列(自由城)中的值替换为 pandas dataframe 中连字符(Fluent)之前的右列中的值? ...
[英]Dropping rows that fall below a certain percentage threshold of the total rows/sum [Python]
我在过滤掉低于 dataframe 总行数的 5%(具体或通用解决方案会有所帮助,以便我可以根据需要重现/调整要求)的犯罪 -“OffenseDescription”时遇到问题。 到目前为止,这是我尝试过的方法,但它使 kernel 崩溃,并且本质上是在运行无限循环/执行。 我也在 VS Code ...
[英]scrape fiba stats box score
我在 python 只是一个初学者,我想要一个我最喜欢的当地篮球队的数据集,这就是为什么我搜索一个代码抓取 fiba 统计框得分,我在 stackoverflow 上找到了一个,我试图编辑标题但是它只是生成一个空的 csv 文件,想知道是否有人可以帮助我编辑下面的代码并抓取每个团队的 box 分数 ...
[英]Pandas Dataframe: Slice a part of read_html table into a dataframe
我想将 html 表的一部分导入到 dataframe 中。 这是表格:在下面,我只想导入“Total Electric Industry” 我在 Google colab 中运行以下代码: 目前output: ...
[英]Custom annotation of text in seaborn heatmap
我想在下面使用 seaborn 绘制的热图中为正值和负值分配不同的字体大小。 我尝试分两步指定最小值和最大值以及 plot,但 colors 和 fonts 未正确显示。 有关如何解决此问题的建议将有很大帮助。 ...
[英]How to group data by multiple columns in pandas?
我有一个茶叶出口公司的 CSV 文件,我已经导入到 Jupyter 中,文件的样本 output 如下所示。Date Type Weight Quantity Price 2016-01-01 black bags 1734136.51 1 ...
[英]Adding a percentage density column to a r dataframe
我想在下面as dataframe 中的频率列旁边添加一个百分比密度列。 以及频率和百分比密度列的总和值。 百分比密度列显示每个序列的百分比权重,因此如果总共有 10 个序列并且该序列的频率为 3,则百分比密度将为 3/10 = 0.3。 百分比密度之和应为 1.0。 ...
[英]Replace all strings in a dataframe using for loop
价格 $ C145 + 22.34 美元来自美国您好,这是我上面的 df 我基本上想删除所有特殊字符($、+ 和空格)。 然后我想移动它们,使它们看起来像下表中的整数,这样我就可以处理成 CSV 并分析超过 50 行的价格。 价格船运起源 145 22.34 来自美国我在想也许我需要把它放在一 ...
[英]Insert dictionary value from column according to its key into another column using pandas
我是 python 的新手,一段时间以来一直试图面对这堵墙。 我正在使用 pandas 数据帧。 我有两列:X 和 Y 情况:X 是一个字典列。 我正在尝试通过搜索 KEY 值来填充 Y 列。 示例:{'性别':'男性','工作':'木匠'} 目标:如果“性别”KEY 等于“男性”,则用其“工作”值 ...
[英]Pandas resample aggregation, intra month periods?
我正在尝试使用重采样跨时期聚合一些数据,到目前为止有这样的事情: 数据: 代码: 这完全符合我对月度或季度时间序列等的要求,但我也试图从数据集的开始获得滚动 window 例如,从 2022/01/13 开始的 4 个月期间:2022/ 01/13-2022/05/12、2022/05/13-20 ...
[英]Pandas dataframe groupby and aggreagate with conditions
有没有一种方法可以根据特定列对 dataframe 进行分组并包含空值,但前提是特定列的所有值都为空。 示例:我有一个 dataframe,如下所示: 我正在尝试根据名称和主题对 dataframe 进行分组。 我预期的 output 看起来像这样: 因此,如果一个人选择了多个主题但其中一个是空 ...
[英]retrieve cell string values in a column between two unknown indexes based on substrings location
我需要找到“then”一词出现在 Words 表上的第一个位置。 我正在尝试获取一个代码,以从该位置合并“文本”列上的所有字符串,直到其中包含 substring“666”或“999”的第一个文本(在本例中是它们的组合,stoma22、fe156、sligh334 ,pain666(所需的 subt ...
[英]Masking the Zip Codes
我正在上一门课程,我需要解决以下作业:“在这部分,你应该编写一个 for 循环,更新 df_users dataframe。 Go 通过每个用户,并更新他们的 zip 代码,以符合安全港规范: 如果用户来自“地理细分”小于等于 20,000 的 zip 代码,请将 df_users 中的 zip ...
[英]Parts of JSON data getting lost when read into Pandas DataFrame?
我想对从游戏研究中收集的数据进行一些分析。 我们存储时间戳、输入类型,然后是所玩的各个回合的元数据。 我们将其存储为 JSON,我想将其加载到 python 脚本中以使用 matplotlib 生成一些漂亮的图形。要使用 Pandas,我想将其转换为 dataframe8 的 .CSV,但是当 7 ...
[英]plotting a grouped bar chart with bins
我有一个类似于这样的 dataframe: 我想要一个 x 轴是一年的分组条形图。 例如 2018 年、2019 年、2020 年、2021 年、2022 年。在每一年中,我都希望该年的某一列的总和为 1 个柱,依此类推。 我试过的 我得到的是这样一个拥挤的条形图 ...
[英]Read JSON file with nested lists in R
我有一个很大的 json 数据集,我想将它转换为 R 中的数据框 (对不起,如果它可能是一个重复的问题,但其他答案对我没有帮助)我的 Json 文件如下: 我想要一个 dataframe 如下: (我没有写上面的完整表格) 我已经尝试过以下代码: 但每一行如下所示: dput 版本如下: 我遇 ...
[英]How to filter with conditions to add to new column
我正在尝试使用 dataframe,它看起来像: 家离开主场得分客场得分坦帕湾科罗拉多州 3个 1个圣荷西哥伦布 1个 3个新英格兰圣荷西 1个 5个科罗拉多州坦帕湾 2个 0 新英格兰 KC奇才队 2个 1个我的目标是将“home_score”与“away_score”进行比较,然后从“home” ...
[英]Truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all() to create a new clomuns
我的代码有问题,我想根据另一个的结果创建一个新列,但是我在使用此代码时遇到了这个错误 这很简单,但我找不到为什么我得到这个谢谢我得到了这个 ValueError: The truth value of a Series is ambiguous. 使用 a.empty、a.bool()、a.ite ...