簡體   English   中英

Pandas 相關矩陣未包含 csv 文件中的所有列

[英]Pandas correlation matrix not incorporating all columns in csv file

我有一個包含 12 個數據列的 csv 文件,並想用它們創建一個相關矩陣。 但是,當使用 pandas 執行此操作時,僅包含 4 個(看似隨機的)列。 任何想法為什么剩余的列不進入相關矩陣?

d = pd.read_csv('national_raw_convictions.csv')
cm = d.corr().abs()
cm.to_csv('national_raw_convictions_correlation.csv')

我附上了引用的輸入(左)和 output(右)csv 文件的屏幕截圖。 1

沒有足夠的信息來確定。

我的猜測是列具有 object 數據類型。 在讀取數據時,pandas 盡力理解列數據類型。 但是如果由於某種原因列有數字和字符串,列數據類型將是“對象”。 要檢查 dataframe 數據類型,您可以運行d.dtypes

希望它可以幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM