标签[dataframe]

数据框是表格数据结构。 通常,它包含数据,其中行是观察值,列是各种类型的变量。 虽然“数据框”或“数据框”是几种语言用于此概念的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),但“表”是MATLAB和SQL。

0
0回复
16

如何在pydatatable中键入强制转换数据框列?

我正在尝试探索pydatatable中框架的数据类型。 这里有一个数据框: 及其类型: 每个字段的数据类型为: 现在,我想将这三列转换为int, float, float , float, str,
0
1回复
29

计算列python中所有日期之间的时差

我有一个看起来像这样的数据框: 我想计算每个组出现之间的时间差 以秒为单位 。 输出示例: 这是我的代码: 这需要永远运行,我正在寻找一种更省时的方法来获得所需的输出。 有任何想法吗
0
0回复
12

DataFrame分成两个DataFrame并过滤这两个DataFrame以具有相同的尺寸

我遇到以下问题,并且有解决此问题的想法,但没有成功:我每个月的每个交易日都有 DAX看涨期权和看跌期权的数据。 经过转换和一些计算之后,我得到了以下DataFrame: DaxOpt 。 现在的目标是
-1
0回复
25

减去一列中的值并更改另一个

我有一个数据框架,看起来像这样: : : , : : , : : , : : , : : , : : , : : , : : , : : , : : , : : , : : , : : , : : ,
-1
1回复
32

从另一个数据框替换数据框的列值

我有两个相同的列号的数据框df 和df 。 我想用df 列中的相应第一行值替换df 的所有列值。 有更好的方法吗 请提出前进的方向。
1
2回复
34

python3:如何打印groupby.last()?

将其打印到文件的正确方法是什么 例如。
1
1回复
29

无法将用户定义的字符串替换函数应用于小标题的内容

我有一个用户定义的函数来替换文本模式。 这似乎在数据帧上起作用,但不起作用。 为什么会出现这种情况,以及如何处理数据
0
1回复
22

从数据框中获取作为日期时间对象的索引

我有一个看起来像这样的csv文件 我将csv读取为pandas数据框,并将有效列设置为索引。 我也将其转换为pd.datetime 现在,我想将索引作为某一行的日期时间对象。 我怎么做 我试过了但是没
0
0回复
20

在python中释放数据帧内存

我有一个包含多个平面文件的文件夹,这些文件具有不同的映射,我试图通过从sql服务器读取映射来逐一获取数据帧中的平面文件,一旦加载文件,就将其上传到sql服务器,接下来我将已处理的文件移动到另一个文件夹
2
2回复
31

从URL读取压缩的Stata文件到熊猫

是否可以从URL读取仅包含.dta文件的.zip文件 例如, https : rscfp .dta包含一个文件: rscfp .dta ,但pandas.read stata不适用于该文件: Valu
-1
1回复
23

根据数据框列创建不同范围的垃圾箱并获取计数

我是Python的新手。 我有一个包含三列的数据框,如下所示 我想将 col 划分为具有范围 的bin,并获得其他两列的相应范围 最小,最大值 。 此外,还想知道这些单个容器下的记录数 我尝试对每一列
0
1回复
35

根据另一列覆盖数据框中的数据

假设我有一个包含两列的csv文件,一列包含数据 一个数字 ,一列具有日期,格式为 。 我有一个脚本 进程,它以 data, date 的形式生成新数据。 我想要执行以下操作的代码。 如果date尚未出
2
1回复
21

熊猫DataFrame的反向地理编码

我们有经度和纬度数据,需要将它们转换为纽约市的邮政编码。 有 万行python包有什么办法吗
-2
2回复
27

Python Pandas-根据指定条件返回数据,并防止出现真假值

我有一个简单的数据框,在某种程度上提供了我想要的输出。 下面是代码和输出 输出量 我的问题是,由于我只对带有值的数据框感兴趣,因此如何防止输出打印真假值 所需的输出是两个单独的数据帧,仅包含值,而没有
-1
1回复
15

将熊猫数据框奇怪地转换为具有已定义模式的火花数据框

我面临以下问题,但尚未获得答案:当将具有整数的pandas数据框转换为具有数据假设为字符串的架构的pyspark数据框时,值将更改为 奇怪的 字符串,就像下面的例子。 我已经保存了很多重要的数据,我想
0
1回复
20

如何处理不同频率的数据集?

我建立了一个使用加速度计数据预测用户活动的模型,并使用了一个以 Hz采样的数据集。 如何处理这些数据以定制模型以预测将以 Hz频率采集的样本 在这种情况下,有什么好的方法可以规范化吗 我使用keras
0
0回复
06

数据帧的最佳分区大小,适用于70GB数据联接操作

我有一个大约 GB的dask数据帧和 个列,它们不适合内存。 我的机器是 CORE Xeon,具有 GB的Ram和本地的Dask Cluster。 我必须将 列中的每列都加入到另一个更大的数据框中。
-1
1回复
18

如何从火花到弹性搜索将较长的纪元列加载为时间格式?

我有一长数据类型的列 finishedTime ,其以毫秒为单位的时间。 我正在尝试将此列作为时间格式数据类型加载到弹性搜索中,以便可以看到时间轴,但无法这样做。 我尝试转换为TimestampTyp
0
1回复
19

循环时将数据框的每一列保存在新数据框中

我有一个名为 Adj Close 的数据框,看起来像这样: 我想将每个列 AAPL , TSLA 和 GOOG 保存在新的数据框中。 该代码应如下所示: 不幸的是,这是错误的语法。 我希望有一个人可以
0
1回复
16

使用熊猫使用index_col = none时创建索引的read_excel

我正在尝试将excel文件读入数据帧,并且以后要设置索引,所以我不希望熊猫将列 用作索引值。 默认情况下 index col None ,它不应该将数据的第 列用作索引。 我该如何解决 输入Excel

1 2 3 4 5 6 7 8 9 10 下一页