[英]How to load a tsv file into a Pandas DataFrame?
I'm new to python and pandas.我是 python 和 pandas 的新手。 I'm trying to get a
tsv
file loaded into a pandas DataFrame
.我正在尝试将
tsv
文件加载到 pandas DataFrame
中。
This is what I'm trying and the error I'm getting:这就是我正在尝试的,我得到的错误:
>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
Traceback (most recent call last):
File "<pyshell#28>", line 1, in <module>
df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!
The .read_csv function does what you want: .read_csv函数可以满足您的要求:
pd.read_csv('c:/~/trainSetRel3.txt', sep='\t')
If you have a header, you can pass header=0
.如果你有一个标题,你可以传递
header=0
。
pd.read_csv('c:/~/trainSetRel3.txt', sep='\t', header=0)
Note : Prior 17.0, pd.DataFrame.from_csv
was used (it is now deprecated and the .from_csv
documentation link redirects to the page for pd.read_csv
).注意:在 17.0 之前,使用了
pd.DataFrame.from_csv
(现在已弃用,并且.from_csv
文档链接重定向到pd.read_csv
的页面)。
Use pandas.read_table(filepath)
.使用
pandas.read_table(filepath)
。 The default separator is tab.默认分隔符是制表符。
open file, save as .csv and then apply打开文件,另存为 .csv 然后应用
df = pd.read_csv('apps.csv', sep='\t')
for any other format also, just change the sep tag对于任何其他格式,只需更改 sep 标签
data = pd.read_csv('your_dataset.tsv', delimiter = '\t', quoting = 3)
您可以使用分隔符来分隔数据,quoting = 3 有助于清除 datasst 中的引号
df = pd.read_csv('filename.csv', sep='\t', header=0)
您可以通过指定分隔符和标头将 tsv 文件直接加载到 pandas 数据框中。
Try this:尝试这个:
import pandas as pd
DataFrame = pd.read_csv("dataset.tsv", sep="\t")
use this用这个
import pandas as pd
df = pd.read_fwf('xxxx.tsv')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.