[英]How to replace 2 double quotes into single double quotes in dataframe?
我有一列有 2 個雙引號的文本文件。 我正在嘗試更換它們但無法獲得結果。
例子:
在文本文件中,數據是:
From Date,To Date,Item Number,Item Description
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
但是在將此文件讀取為 dataframe 時,它顯示:
From Date To Date Item Number Item Description
01/31/2022 02/06/2022 100455 "REMICADE INJ 100MG "R" 10ML"
01/31/2022 02/06/2022 100455 "REMICADE INJ 100MG "R" 10ML"
01/31/2022 02/06/2022 100455 "REMICADE INJ 100MG "R" 10ML"
01/31/2022 02/06/2022 100455 "REMICADE INJ 100MG "R" 10ML"
我正在運行下面的代碼-
df = pd.read_csv(r"D:\Users\SPate233\Downloads\iMedical\Anamoly Script\dhs\KF_Standard_Customer_Activity_Data_February072022.txt", delimiter =',')
print(df.head())
print(df['Item Description'])
df1 = df.replace({r'"' : ''}, regex = True)
print(df1['Item Description'])
df1.to_csv(r"D:\Users\SPate233\Downloads\iMedical\Anamoly Script\dhs\out.txt", index=False, sep=',')
在 Output 文件中,我得到以下記錄-
From Date,To Date,Item Number,Item Description
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
01/31/2022,02/06/2022,100455,"REMICADE INJ 100MG ""R"" 10ML"
這是 CSV 編碼的效果。 CSV 並沒有真正被普遍接受的規范,但RFC 4180是一種嘗試,其中指出(在第 2.7 節中):
如果使用雙引號將字段括起來,則出現在字段內的雙引號必須通過在其前面加上另一個雙引號來轉義。
因此,例如,文本
"Hello", she said.
被寫入文件中
"""Hello"", she said."
Pandas 的read_csv
和to_csv
函數會為您處理這個問題,標准庫的csv
模塊也是如此。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.