繁体   English   中英

使用熊猫删除具有多于4列的行

[英]Remove rows which has more than 4 columns using pandas

我有几个用熊猫处理的csv文件。 我想删除多于3列的行。

我该如何进行?

谢谢

编辑1

  id                                       ocr  raw_value   
4a82a357-99e7-49e6-85b6-b2f6a27b8d5f    OMNIPAGE    Terms        em
8b549fef-0cda-4af5-8239-35153c33ffbc    OMNIPAGE    price   
52ffe66a-b1ab-4b22-9b26-c298d53c951c    OMNIPAGE    Renseignements  
507a0d96-9481-4b3f-8c35-f16588bedc0b    OMNIPAGE    pour    
52e171dc-8d22-4162-b748-692b2fc11659    OMNIPAGE    Client  
c40a7e9f-1ec4-4cac-87e8-02ed0f335fe9    OMNIPAGE    5           client
4a936ed7-c082-4f46-9fa1-761a1525e2df    OMNIPAGE    SAS 
4b78130e-b099-400c-b7bf-6470e0519783    OMNIPAGE    des 
4d5c6297-1c79-42f9-b4ea-929a9abfb3f7    OMNIPAGE    431 
829d8bf5-b251-4bb1-82d8-0e912ab64e8e    OMNIPAGE    59  102
5ed5b74d-efc5-49fa-9b12-dbe3ca88995f    OMNIPAGE    votre   votre
58d26125-1120-4328-83c4-7f5b0135184d    OMNIPAGE    Crécy,  Crécy,

在此示例中:要删除的第一行和第六行有多余的列em客户端

如果可能的话,错误仅是额外的列。 然后将其传递给pd.read_csv。

error_bad_lines=False

error_bad_lines:布尔值,默认情况下,包含太多字段的True Lines(例如,带有太多逗号的csv行)默认情况下会引发异常,并且不会返回任何DataFrame。 如果为False,则这些“坏行”将从返回的DataFrame中删除。 (仅对C解析器有效)

CSV文件应具有固定的列数。 Pandas不是CSV格式的验证器(即使它能够处理一些错误)。 如果您使用的CSV格式不正确(在您的情况下,每列中的行数可变),则应先进行验证,然后再将其提供给Pandas。

例如: https : //pypi.python.org/pypi/csvvalidator

或自己编写代码相当琐碎。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM