[英]pandas read_csv end of section flag
有沒有一種聰明/容易的方法來告訴熊貓中的read_csv在某個“節結束”標志之后不要加載數據? 還是讓它停到空行?
data = pd.read_csv(path, **params)
eos_line = (data['id'] == eos_string).idxmax()
data = data.drop(range(eos_line-2, data.shape[0]))
我覺得他們應該是更好的方法。 不幸的是,在調用read_csv之前,我不知道要跳過的行數或頁腳的長度。 數據看起來大概像
1,2,3
4,5,6
dont want any data after this line
7,8,9
10,11,12
(注意:-2是b / c,實際上在節字符串的末尾有2個空行,但是如果read_csv只讀到這一點,我想dropna()會毫不費力地刪除這兩行)
韋斯確實想到了一切!
In [40]: data = """A,B,C
....: 1,2,3
....: 4,5,6
....: 7,8,9
....: want to skip this
....: also also skip this
....: """
In [41]: read_csv(StringIO(data), skip_footer=2)
Out[41]:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.