[英]difference in csv.reader and pandas - python
我正在使用csv.reader和pandas導入一個csv文件。 但是,來自同一文件的行數是不同的。
reviews = []
openfile = open("reviews.csv", 'rb')
r = csv.reader(openfile)
for i in r:
reviews.append(i)
openfile.close()
print len(reviews)
結果是10,000(這是正確的值)。 但是,熊貓返回不同的值。
df = pd.read_csv("reviews.csv", header=None)
df.info()
這將返回9,985
有誰知道為什么兩種導入數據方法之間有區別?
我只是試過這個:
reviews_df = pd.DataFrame(reviews)
reviews_df.info()
這將返回10,000。
參考pandas.read_csv
有一個名為skip_blank_lines
的參數,其默認值為True
因此,除非將其設置為False
否則它將不會讀取空白行。
考慮下面的示例,有兩個空白行:
A,B,C,D 0.07,-0.71,1.42,-0.37 0.08,0.36,0.99,0.11 1.06,1.55,-0.93,-0.90 -0.33,0.13,-0.11,0.89 1.91,-0.74,0.69,0.83 -0.28,0.14,1.28,-0.40 0.35,1.75,-1.10,1.23 -0.09,0.32,0.91,-0.08
使用skip_blank_lines = False讀取它:
df = pd.read_csv('test_data.csv', skip_blank_lines=False) len(df) 10
使用skip_blank_lines = True讀取它:
df = pd.read_csv('test_data.csv', skip_blank_lines=True) len(df) 8
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.