簡體   English   中英

關於熊貓插值函數的不確定性

[英]Uncertainity about the Interpolate Function in Pandas

我正在使用pandas的插值函數。 這是一個玩具示例,用於說明問題:

df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) 

df.iloc[1, 0] = np.nan

print df

print df.interpolate('nearest')

我的問題: interpolate函數是否適用於多列? 也就是說,它是否使用多元分析來確定缺失字段的值? 還是僅查看各個列?

文檔引用了各種可用的方法-大多數僅依賴於index ,可能通過單變量scipy.interp1d或其他單變量scipy方法:

方法:{“線性”,“時間”,“索引”,“值”,“最近”,“零”,“線性”,“二次”,“三次”,“重心”,“克羅格”,“多項式” ,“樣條曲線”,“ piecewise_polynomial”,“ pchip”}

  • 'linear':忽略索引並將值視為等間距。 這是MultiIndexes支持的唯一方法。
  • 默認'時間':插值適用於每日和更高分辨率數據,以插入給定長度的間隔'index','values':使用索引的實際數值
  • “最近”,“零”,“線性”,“二次”,“三次”,“重心”,“多項式”傳遞給scipy.interpolate.interp1d。 “多項式”和“樣條曲線”都要求您還指定一個順序(int),例如df.interpolate(method ='polynomial',order = 4)。 它們使用索引的實際數值。
  • “ krogh”,“ piecewise_polynomial”,“ spline”和“ pchip”都是類似名稱的scipy插值方法的包裝。 它們使用索引的實際數值。

SciPy的文檔和圖表說明輸出這里

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM