繁体   English   中英

在熊猫中读取除CSV文件的最后一行

[英]Read all but last line of CSV file in pandas

我有一些CSV文件,我在熊猫中读到了:

#!/usr/bin/env python

import pandas as pd
import sys

filename = sys.argv[1]
df = pd.read_csv(filename)

不幸的是,这些文件的最后一行通常是损坏的(逗号数量错误)。 目前我在文本编辑器中打开每个文件并删除最后一行。

是否可以删除加载CSV的同一个python / pandas脚本中的最后一行,以节省必须采取这个额外的非自动步骤?

传递error_bad_lines=False ,它将自动跳过此行

df = pd.read_csv(filename, error_bad_lines=False)

error_bad_lines的优点是它会跳过而不会出现任何错误行,但如果最后一行总是duff那么skipfooter=1会更好

感谢@DexterMorgan指出skipfooter选项强制引擎使用比c引擎慢的python引擎来解析csv。

阅读http://pandas.pydata.org/pandas-docs/version/0.16.2/generated/pandas.read_csv.html 这里'skipfooter'参数可用于指定不想从末尾读取.csv文件的行。 可能它可以帮助你。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM