简体   繁体   English

数据质量 - 缺失值(熊猫)

[英]Data quality - Missing values (Pandas)

I'm working on a data quality project.我正在做一个数据质量项目。 I'm trying to generate a data quality report using pandas-profiling profileReport but when i verify the report it says that i have no missing values while i do have empty cells.我正在尝试使用 pandas-profiling profileReport 生成数据质量报告,但是当我验证报告时,它说我没有缺失值,而我确实有空单元格。 Or do you have any other suggestion Result或者你有什么其他的建议结果

df = pd.read_excel('D:/SDAD/PFE/bi_bpcustomer.xls')
print(df.dtypes)
reportCl=ProfileReport(df)
reportCl.to_file(output_file='rapportClient.html')

Here's a part of my xls file showing missing cells: xls file这是我的 xls 文件的一部分,显示了缺少的单元格: xls 文件

It's fine, i found a way by adding this to my code:没关系,我找到了一种方法,将它添加到我的代码中:

missing_values = [""," "]
client= pd.read_excel('D:/SDAD/PFE/bi_bpcustomer.xls',na_values = 
missing_values)

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM