cost 155 ms
熊猫将列标题添加到行值并转换数据框

我有一个 excel 工作簿,其中包含多个工作表,如下所示: 每个工作表的 [ID] 列都有不同的值。 有些工作表达到 TEST_E,有些只有 TEST_A,它们的顺序也不总是相同。 我试图通过创建一个连接 ID 和每个 TEST 列的新 ID_TEST 列来转换数据框,并将其余列转换为与 I ...

2022-07-02 18:58:20 1 24
结合来自不同数据框熊猫的列数

我有两个数据框。 一个有关于患者的人口统计信息,另一个有一些特征信息。 下面是一些代表我的数据集的虚拟数据: 人口统计: 这是打印的数据框: 特征: 以下是每个患者的每个特征的计数: 我想将每个患者的特征计数整合到人口统计表中。 请注意,特征表中没有患者 13。 最终的数据框将如下 ...

2022-07-02 17:46:40 2 36
如何使用 csv 文件计算排名帖子中几个人的平均评分?

有这个社区排行榜,我想我会尝试破解它。 在这个实践中,我想 将 1 到 10 个人为谷歌表格中的每个字符选择的评分作为多项选择答案,然后将它们取平均值并将它们粘贴到每个字符上。 根据这些平均值对它们进行排名。 import csv import math from collections ...

2022-07-02 17:29:34 0 34
基于几列的平均 3 个值的 Fillna

我有一个如下所示的数据框: 我想做的是用那个国家和那个产品的最后 3 个值的平均值来“填充”“$/unit”列。 即,第一个 NaN 应该是 4 月、5 月和 6 月法国 PROD.A 美元/单位的平均值(在本例中为 5.21、5.32 和 4.01 或 4.84 的平均值)。 感谢本网站的 ...

2022-07-02 17:21:34 1 35
通过将一个数据帧一分为二创建的两个数据帧之间的连接

如果我的标题令人困惑,我很抱歉,但我不确定如何描述我目前试图理解的情况。 但基本上我在使用 sklearn 模块中的train_test_split过程时偶然发现了这个问题。 所以,让我们继续,我向你展示一个已经让我困惑了几个小时的例子。 让我们创建一个包含 3 列的简单数据框: 'Le ...

2022-07-02 17:05:04 1 27
仅打印在 csv 的第一列

所以我有这个代码,但是当我抓取的数据有逗号时我遇到了问题。 我希望它只显示在第一列,但是当有逗号时,数据会出现在第二列。 是否可以在不使用熊猫的情况下仅在 csv 的第一列上抓取和打印它? 谢谢 ...

2022-07-02 16:33:45 1 40
使用熊猫进行循环内的计算

我有这个数据集: 我想得到一个斜坡,比如: 似乎我要超出循环的边界,但是我该如何编码才能使第一行空白并填充下一行? 如果我在没有 +1 的情况下执行相同的代码并使用 i 来代替它,它会给出 0/0(Nan),但可以。 预期的输出应该是: ...

2022-07-02 16:14:09 3 46
如何分别提供来自分类列的日期分组

我有一个事务表,其中列出了在一个列中开始的每个人的性别,以及他们在另一列中开始的日期。 我想执行一个 groupby,它会生成一个按日期计算每个性别的数据框。 任何想法? 应该导致 我想我需要在一个列表上运行一个 groupby,然后是一个 pivot,但是我的 groupby 正在生成一个 ...

2022-07-02 15:58:02 3 25
AttributeError:尝试将 pandas 数据帧转换为 nltk 语料库时,“NoneType”对象没有属性“组”

我正在使用一个函数,它获取熊猫数据框的内容,读取它并将其附加到文本文件中,然后获取该文本文件的内容并将其放入语料库中。 查看“tweets.txt”文件时,我可以看到在运行此函数后推文被添加到文本文件中。 但是函数中可能出错的部分是当我使用该函数并将语料库分配给一个对象时。 该对象显示为'Non ...

2022-07-02 15:19:43 0 20
Pandas 内部时间处理异常:NonExistentTimeError

我想知道您如何处理此类异常: 我知道这是关于夏令时,但我唯一提供的是时间戳,所以有问题的时间出现在 pandas 的某个地方。 它是一个错误吗? 克服它的最佳方法是什么? ...

2022-07-02 15:19:03 0 15
python pandas数据框聚合行

我有一个像这样的数据框。 而且我还有一组条件,例如 k1 > 1 和 k2 < 4。 我想处理条件并创建一个新的数据框,其中每个 id 包含 1 行,每个条件包含列。 ...

2022-07-02 15:17:45 4 48
保留groupby函数得到的原始格式

预期输入和输出:输入和输出 import pandas as pd import numpy as np df = pd.read_csv('/filename.csv') grp1 = df.groupby(['Name', 'class', 'sub', 'status', 'promote'] ...

2022-07-02 15:08:13 0 24
Pandas 在 postgreSQL 中使用字符串中的 { } 附加数据

我正在尝试创建一个可执行文件,该可执行文件通过废弃网站然后将其插入本地数据库来获取数据。 我正在使用 SQLalchemy 和 psycopg2 例如: 这是输出: 然后将我的值与数据库中的“{”和“}”一起插入。 我想知道我应该怎么做才能防止这种情况发生,因为这会破坏我项目的其他部分。 ...

2022-07-02 14:10:12 1 24
pandas:如何从 DataFrame 的列中删除字符串?

我有以下格式的数据。 我想删除出现在'TIMES_Sold'列中的字符串并将其替换为 0,然后将该列转换为整数。 同样,从'ITEM_Price_£'列中删除 'each' 并将其转换为浮点数。 我怎么能做到这一点? 输出应如下所示: ...

2022-07-02 13:11:50 4 65
Webscrape 到 Pandas DF 到 txt

我试图通过 selenium 将网络抓取保存到 Pandas 数据框,它应该附加新值然后删除重复项,或者从一开始就添加新值。 我正在努力迈出第一步 - 将数据添加到数据框中。 数据抓取有效,我曾经通过file.write保存数据,效果很好,但是当我试图将它传递给DF时,只添加了第一个值,(循环通过 ...

2022-07-02 12:47:11 1 28
基于字符串查找字典创建一个新的 python 数据框列

我有以下数据框: 它将血压读数的分类列为字符串,我还有一个字符串字典,列出所有可能的血压分类,并为每个颜色的十六进制代码绘制它们: 我的目标是向数据框添加一个新的列/系列,比如我们称之为 bpcolor,并为每个 bpstage 列行从字典中选择相应的颜色并将该值填充到相应的 bpcolor ...

2022-07-02 12:03:58 1 24
列名列表列表到 df 值列表列表

给定以下表示列名的列表列表: 和以下数据框 我想使用以下功能生成与names相同尺寸的列表: 即, names数组指向相关row_idx中从df中提取的列。 我试图避免嵌套循环。 ...

2022-07-02 11:59:27 2 27

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM