簡體   English   中英

如何使用Python在大型csv文件上打印特定年份

[英]How to print specific years on a massive csv file using Python

import pandas

fileref = open('chart.csv')
f = pandas.read_csv(fileref)

f_set = f[f.year >= 2005]
print(f_set.groupby('y').namefromchart.nunique())

所以我知道f_set將打印出我的y單元格與2005年的相應年份。 如果我想打印出2002年至2009年的內容怎么辦?

看來你需要為boolean indexing添加第二個條件:

import pandas as pd

f = pd.read_csv('chart.csv')
f_set = f[(f.year >= 2002) & (f.year < 2010)]
print (f_set.groupby('y').namefromchart.nunique())

默認情況下, between另一個解決方案包括

f_set = f[f.year.between(2002,2009)]

考慮pd.DataFrame f

f = pd.DataFrame(dict(year=range(2000, 2011), A=np.random.rand(11)))

你可以設置索引並切片你喜歡的方式

f.set_index('year').ix[2002:2009]

在此輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM