[英]Running the same script on the same pandas data produces very slightly different dataframes floating-point values
我正在執行我之前在相同數據上運行過的腳本。 我得到的 dataframe 僅與前一個略有不同(在小數點后 10 位左右)。 例如:
這當然是整個列的情況,而不僅僅是特定的行。 這個怎么可能? 請注意,我無法確認兩個腳本運行之間的相同環境(熊貓或 Python 版本)。 這可能是這兩個原因之一嗎? 還有什么?
一個可能的原因: 26 Dec 2020
發布的Pandas 1.2.0
,他們強調了這個問題:
更改 read_csv 和 read_table 的默認浮動精度
方法
read_csv()
和read_table()
可能相對於精度的最后一位稍微錯誤地讀取floating point
。
在此版本之前, floating_precision="high"
始終可以避免此問題。
但是,在這個版本中,默認值現在是floating_precision=None
以使精度更加准確。 它不會對性能產生任何影響。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.