[英]Checking format of CSV using python
我目前正在處理一個腳本,以檢查一堆CSV是否具有足夠的格式來供另一個處理。 我對它必須通過的某些斷言感到困惑。 一種是不遺漏,為此我嘗試了:
df = pd.read_csv("C:PATH\\test.csv", sep= ',')
def check(self, file):
try:
assert df.notna().values.any()
except AssertionError:
assert False, " NaN in data"
它什么也沒做。 我在帶有NaN的CSV上嘗試過,但沒有引發錯誤。 然后,我也希望它用逗號分隔,但它們可能會給我傳遞一個點和逗號分隔的點。 這是我的嘗試:
try:
assert len(df.columns) != 1
except AssertionError:
"Not comma separated"
它響應不佳,有時會升起國旗,有時卻沒有。
是否有我不了解的“斷言”內容或其他問題?
將df作為參數傳遞給check()
。 還要將.any()
更改為.any()
.all()
df= pd.read_csv("C:\\PATH\\test.csv", sep= ',')
def check(file):
try:
assert file.notna().values.all()
except AssertionError:
assert False, " NaN in data"
check(df)
pd.notna()
https://pandas.pydata.org/pandas-docs/version/0.23.4/genic/pandas.notna.html
要求您提供數據框作為參數
請嘗試使用notnull(),如下所示:
df= pd.read_csv("C:PATH\\test.csv", sep= ',')
def check(file):
try:
assert file.notnull().values.any()
except AssertionError:
assert False, " NaN in data"
check(df)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.