簡體   English   中英

Python - 導入由逗號和空格分隔的 txt.file

[英]Python - importing a txt.file seperated by commas and whitespaces

我需要導入一個 .txt 文件,其中包含一些有關天氣的統計信息。 但是,這些值由逗號分隔,后跟三個空格。 當我嘗試通過添加 sep=" " 或 ", " 來刪除它時,我收到一個錯誤。

 from tkinter.ttk import Separator import pandas as pd # Import dataset df = pd.read_csv("etmgeg_235.txt") # Drop eventual null values df.isnull().sum() df.dropna #Show correlations cr = df.corr() print(cr)
'

程序在導入 .txt 文件時“工作”,但隨后我得到一個與 NaN 的相關性和一個值為 1.0 的相關性。

數據集如下所示:“235,19060101, 113, 67, 67, 87, 12, 51, 1, , , -28, etc....”,它們之間還有一些空格。 如何正確導入此數據集?

使用pd.read_csvengine='python'設置正則表達式分隔符。 就像是:

df = pd.read_csv('data.csv', sep=r',\s*', engine='python')

pandas read_csv允許你使用正則表達式,所以像

df = pd.read_csv("etmgeg_235.txt", sep="[,\s]+", engine="python")

應該管用。 請注意,您必須使用python引擎才能使用正則表達式。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM