[英]Create and append single column of 1’s, 0’s, and -1’s in csv file based on assessment of several other pre-existing columns
[英]Python method or pre-existing module to access csv via headers instead of column ID's
我被迫从一个CSV文件而不是一个数据库中进行项目工作……很烦人,但事实如此。 我无法控制CSV的发布组织。我可以合理地保证名称将保留在CSV标头中。
我只是准备编写一些代码以返回字符串匹配中的列ID,但是想知道是否有一个模块可以为我执行此操作?
e.g.
data = csv.csvRowData[5] becomes
data = csv.csvRowData[find_rowID('column_name')]
如果我的代码语法不正确,请原谅我,它来自php。 将弄清楚如何使其在语法中起作用。
我使用pandas
软件包,有一个功能强大的read_csv
实用程序http://pandas.pydata.org/pandas-docs/stable/generation/pandas.io.parsers.read_csv.html
cat test.csv
date,value
2014,Hi
2015,Hello
import pandas as pd
df = pd.read_csv('test.csv')
这将返回一个pandas.DataFrame
,它会执行您想要的操作(以及更多操作,例如,转换列上的数据类型),请在IPython上进行尝试:
In [5]: df['date']
Out[5]:
0 2014
1 2015
Name: date, dtype: int64
In [6]: df.columns
Out[6]: Index([u'date', u'value'], dtype='object')
python标准库包括csv模块 。
它提供了DictReader类,该类允许您通过列标题标签访问行的数据。
DictReader将CSV文件中的第一行作为列标题,然后将随后的每一行作为dict提供,其中列标签作为键,而行的数据作为值。
例如,如果people.csv
看起来像这样:
"First Name","Last Name"
Peter,Venkman
Egon,Spengler
您可以像这样使用DictReader:
import csv
with open('people.csv') as csv_file:
csv_reader = csv.DictReader(csv_file)
for row in csv_reader:
print row["Last Name"]
# will output
Venkman
Spengler
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.