繁体   English   中英

使用 pandas Python (pandas.io.parsers.TextFileReader) 从文件中读取数据时出现问题

[英]Problem reading a data from a file with pandas Python (pandas.io.parsers.TextFileReader)

我想用 pandas 从文件中读取数据集,但是当我使用 pd.read_csv() 时,程序会读取它,但是当我想查看数据帧时:

pandas.io.parsers.TextFileReader 位于 0x1b3b6b3e198

作为附加信息,文件太大(大约 9 Gigas)

该文件使用垂直线作为分隔符,我尝试使用 chunksize 但它不起作用。

import pandas as pd
df = pd.read_csv(r"C:\Users\dguerr\Documents\files\Automotive\target_file", iterator=True, sep='|',chunksize=1000)

我想以传统的熊猫数据框格式导入我的数据。

您可以通过以下方式按块加载块:

import pandas as pd

path_to_file = "C:/Users/dguerr/Documents/Acxiom files/Automotive/auto_model_target_file"
chunk_size = 1000
for chunk in pd.read_csv(path_to_file,chunksize=chunk_size):
     # do your stuff

它可能与unicode编码有关吗?

import pandas as pd

df = pd.read_csv('C:/Users/dguerr/Documents/Acxiom files/Automotive/auto_model_target_file',
encoding='latin-1', chunksize=1000)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM