[英]Python - Read_csv read length of column
我正在使用 read_csv 将 csv 文件中的一列加载到我的代码中。 这是一个大文件,加载此列大约需要 45 秒。 是否可以只读取该列的最后一个元素,而不是加载整个列? 我什至对最后一个元素的值不感兴趣,但我对最后一个元素的索引感兴趣。 换句话说,是否可以确定一列的长度 - 而无需加载整个列?
谢谢
如果要获取行的最后一个索引,请按照以下代码片段操作:
fname = "test.csv"
count = 0
with open(fname, 'r') as f:
for line in f:
count += 1
print("Total number of lines is:", count)
如果要总计列数,请按照以下步骤操作:
df = pd.read_csv("test.csv", nrows=1)
print("total col number:", len(df.columns))
尝试使用 dask 或 csv 库,它们速度更快,应该足以满足您的要求。 更多信息在这里
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.