[英]Python parsing string value in csv with Panda
I am new to Python and I am trying to read a csv file using pandas but I have a bit of a problem within my csv file. 我的字符串末尾包含逗號,這會在末尾創建一個不需要的列,如圖所示:
這是原始的 csv:
例如,在第14
行,綠色字符串值以逗號結尾並創建一個新列,然后在使用此列時會出現解析錯誤:
import pandas as pd
pd.read_csv("data.csv")
ParserError:錯誤標記數據。 C 錯誤:預計第 8 行中有 6 個字段,看到 7
有沒有辦法可以清理它並合並最后兩列?
您可以使用np.where
將 APP 替換為缺少 APP 的最后一列,然后刪除最后一列。
import pandas as pd
import numpy as np
df = pd.read_csv("data.csv")
df['APP'] = np.where(df.app.isna(), df[-1], df.APP)
df = df.iloc[:,:-1]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.