[英]Resampling pandas timeseries without computing a new offset
我正在閱讀僅包含可用時間的時間序列數據。 這導致Series
沒有缺失值,但是索引間距不等。 我想將它轉換為具有缺失值的等間距索引的Series
。 由於我不知道先驗的間距是什么,我現在正在使用類似的功能
min_dt = np.diff(series.index.values).min()
new_spacing = pandas.DateOffset(days=min_dt.days, seconds=min_dt.seconds,
microseconds=min_dt.microseconds)
series = series.asfreq(new_spacing)
計算間距應該是多少(注意這是使用Pandas 0.7.3 - 0.8 beta代碼看起來略有不同,因為我必須使用series.index.to_pydatetime()來獲得Numpy 1.6的正確行為)。
使用pandas庫是否有更簡單的方法來執行此操作?
如果你想在沒有數據的地方使用NaN,你可以使用位於日期工具中的Minute()
(截至pandas 0.7.x)
from pandas.core.datetools import day, Minute
tseries.asfreq(Minute())
這應該提供均勻間隔的時間序列,其中NaNs為1分鍾差異,作為沒有數據的系列值。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.