簡體   English   中英

使用python檢查CSV格式

[英]Checking format of CSV using python

我目前正在處理一個腳本,以檢查一堆CSV是否具有足夠的格式來供另一個處理。 我對它必須通過的某些斷言感到困惑。 一種是不遺漏,為此我嘗試了:

df = pd.read_csv("C:PATH\\test.csv", sep= ',')

def check(self, file):
try:
    assert df.notna().values.any()  
except AssertionError:
    assert False, "  NaN in data"

它什么也沒做。 我在帶有NaN的CSV上嘗試過,但沒有引發錯誤。 然后,我也希望它用逗號分隔,但它們可能會給我傳遞一個點和逗號分隔的點。 這是我的嘗試:

try:
    assert len(df.columns) != 1 
except AssertionError:      
    "Not comma separated"

它響應不佳,有時會升起國旗,有時卻沒有。

是否有我不了解的“斷言”內容或其他問題?

將df作為參數傳遞給check() 還要將.any()更改為.any() .all()

df= pd.read_csv("C:\\PATH\\test.csv", sep= ',')

def check(file):
    try:
        assert file.notna().values.all()  
    except AssertionError:
        assert False, "  NaN in data"

check(df)

pd.notna() https://pandas.pydata.org/pandas-docs/version/0.23.4/genic/pandas.notna.html

要求您提供數據框作為參數

請嘗試使用notnull(),如下所示:

df= pd.read_csv("C:PATH\\test.csv", sep= ',')

def check(file):
    try:
        assert file.notnull().values.any() 
    except AssertionError:
        assert False, "  NaN in data"

check(df)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM