[英]How to read file with space separated values in pandas
我嘗試將文件讀入 pandas。該文件的值由空格分隔,但我嘗試使用不同數量的空格:
pd.read_csv('file.csv', delimiter=' ')
但它不起作用
添加delim_whitespace=True
參數,它比正則表達式快。
您可以使用正則表達式作為分隔符:
pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")
如果您無法使用接受的答案進行文本解析(例如,如果您的文本文件包含非統一行),那么值得嘗試使用 Python 的 csv 庫 - 這是使用用戶定義的方言的示例:
import csv
csv.register_dialect('skip_space', skipinitialspace=True)
with open(my_file, 'r') as f:
reader=csv.reader(f , delimiter=' ', dialect='skip_space')
for item in reader:
print(item)
Pandas read_fwf 獲勝:
import pandas as pd
df = pd.read_fwf(file_path)
您也可以傳遞一個正則表達式作為 read_table 的分隔符,而且速度很快:)。
result = pd.read_table('file', sep='\s+')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.