[英]How to iterate through a time frame?
好的,我有一些来自 csv 文件的标准普尔 500 分钟数据。 我正在寻找基于时间的时间戳迭代。 到目前为止,代码如下所示:
import datetime as dt
import pandas as pd
d = pd.read_csv('/Volumes/Seagate Portable/usindex_2020_all_tickers_awvbxk9/SPX_2020_2020.txt')
d.columns = ['Dates', 'Open', 'High', 'Low', 'Close']
d.Dates = pd.to_datetime(d.Dates)
d = d[(d.Dates.dt.time == dt.time(9, 30)) | (d.Dates.dt.time == dt.time(16, 0))].copy()
d.drop(['High', 'Low'], axis=1, inplace=True)
d.index = range(len(d.Open))
for i in d.index:
if dt.time(16, 0) in d.Dates[i]:
d['Open'][i] == np.NaN
导入的csv长这样:
Date Open Close
0 2020-01-02 16:00:00 3258.14 3257.98
1 2020-01-03 09:30:00 3226.36 3225.79
2 2020-01-03 16:00:00 3234.35 3234.57
3 2020-01-06 09:30:00 3217.55 3215.01
4 2020-01-06 16:00:00 3246.23 3246.28
5 2020-01-07 09:30:00 3241.86 3238.09
6 2020-01-07 16:00:00 3237.13 3237.18
7 2020-01-08 09:30:00 3238.59 3236.82
8 2020-01-08 16:00:00 3253.21 3253.06
9 2020-01-09 09:30:00 3266.03 3270.29
10 2020-01-09 16:00:00 3274.74 3274.66
11 2020-01-10 09:30:00 3281.81 3281.20
12 2020-01-10 16:00:00 3265.39 3265.34
13 2020-01-13 09:30:00 3271.13 3273.28
14 2020-01-13 16:00:00 3287.98 3288.05
15 2020-01-14 09:30:00 3285.35 3285.09
16 2020-01-14 16:00:00 3282.93 3282.89
17 2020-01-15 09:30:00 3282.27 3281.75
18 2020-01-15 16:00:00 3289.76 3289.40
19 2020-01-16 09:30:00 3302.97 3304.34
我收到的错误是TypeError: argument of type 'Timestamp' is not iterable
我想要做的是在 16:00:00 NaN 值处填充所有 Open 值,然后在该时间保留 Close valyes。 我可以使用相同的 for 循环遍历时间戳吗? 或者是否有另一种可能的方法来对此进行排序并填写相应的 NaN 值? 谢谢!
in
用于测试集合中的成员资格或在字符串中查找 substring。 您不能使用它来测试时间戳中的时间。
如果要使用for
循环:
for i in d.index:
if d.loc[i, 'Date'].time() == dt.time(16,0):
d.loc[i, 'Open'] == np.NaN
但最好使用矢量化的 function:
d['Open'] = d['Open'].mask(d['Dates'].dt.time == dt.time(16, 0))
for i in d.index:
if dt.time(16, 0) == d.Dates[i]:
d['Open'].loc[i] = np.nan
or
for i in d.index:
if dt.time(16, 0) is d.Dates[i]:
d['Open'].loc[i] = np.nan
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.