![](/img/trans.png)
[英]Applying Conditions on Pandas DataFrame Columns before reading csv or tsv files
[英]Pandas: Reading TSV into DataFrame
我正在使用 Python 2.7,並且 TSV 的格式如下(368 行 × 3 列):
date dayOfWeek pageviews
2016 4 3920
...
我有一個 Jupyter 筆記本保存在與 TSV 相同的位置。 我正在運行這段代碼:
import pandas as pd
pd.read_table('query_explorer.tsv')
我得到了一個 736 行 × 3 列並填充了 NaN 的數據框。 這也很有趣,因為我應該只有 368 行(正好是我的一半)。
知道這里發生了什么嗎?
怎么樣:
pd.read_table('query_explorer.tsv',delim_whitespace=True,header=0)
在csv
文件中,逗號是分隔符。 對於tsv
文件,制表符將分隔每個字段。 pandas
根據分隔符可以識別和分隔列。
import pandas as pd
pd.read_csv('query_explorer.tsv',sep="\t")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.