![](/img/trans.png)
[英]Applying Conditions on Pandas DataFrame Columns before reading csv or tsv files
[英]Pandas: Reading TSV into DataFrame
我正在使用 Python 2.7,并且 TSV 的格式如下(368 行 × 3 列):
date dayOfWeek pageviews
2016 4 3920
...
我有一个 Jupyter 笔记本保存在与 TSV 相同的位置。 我正在运行这段代码:
import pandas as pd
pd.read_table('query_explorer.tsv')
我得到了一个 736 行 × 3 列并填充了 NaN 的数据框。 这也很有趣,因为我应该只有 368 行(正好是我的一半)。
知道这里发生了什么吗?
怎么样:
pd.read_table('query_explorer.tsv',delim_whitespace=True,header=0)
在csv
文件中,逗号是分隔符。 对于tsv
文件,制表符将分隔每个字段。 pandas
根据分隔符可以识别和分隔列。
import pandas as pd
pd.read_csv('query_explorer.tsv',sep="\t")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.