簡體   English   中英

重新取樣pandas時間序列而不計算新的偏移量

[英]Resampling pandas timeseries without computing a new offset

我正在閱讀僅包含可用時間的時間序列數據。 這導致Series沒有缺失值,但是索引間距不等。 我想將它轉換為具有缺失值的等間距索引的Series 由於我不知道先驗的間距是什么,我現在正在使用類似的功能

min_dt      = np.diff(series.index.values).min()
new_spacing = pandas.DateOffset(days=min_dt.days, seconds=min_dt.seconds,
                                microseconds=min_dt.microseconds)
series      = series.asfreq(new_spacing)

計算間距應該是多少(注意這是使用Pandas 0.7.3 - 0.8 beta代碼看起來略有不同,因為我必須使用series.index.to_pydatetime()來獲得Numpy 1.6的正確行為)。

使用pandas庫是否有更簡單的方法來執行此操作?

如果你想在沒有數據的地方使用NaN,你可以使用位於日期工具中的Minute() (截至pandas 0.7.x)

from pandas.core.datetools import day, Minute
tseries.asfreq(Minute())

這應該提供均勻間隔的時間序列,其中NaNs為1分鍾差異,作為沒有數據的系列值。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM