![](/img/trans.png)
[英]Problem getting correlation matrix from large csv file with Python / Pandas
[英]Pandas correlation matrix not incorporating all columns in csv file
我有一个包含 12 个数据列的 csv 文件,并想用它们创建一个相关矩阵。 但是,当使用 pandas 执行此操作时,仅包含 4 个(看似随机的)列。 任何想法为什么剩余的列不进入相关矩阵?
d = pd.read_csv('national_raw_convictions.csv')
cm = d.corr().abs()
cm.to_csv('national_raw_convictions_correlation.csv')
我附上了引用的输入(左)和 output(右)csv 文件的屏幕截图。 1
没有足够的信息来确定。
我的猜测是列具有 object 数据类型。 在读取数据时,pandas 尽力理解列数据类型。 但是如果由于某种原因列有数字和字符串,列数据类型将是“对象”。 要检查 dataframe 数据类型,您可以运行d.dtypes
。
希望它可以帮助。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.