[英]Remove special characters from column headers
我有一本關於數據框(健康,教育,經濟等)的字典(data_final)。 數據幀包含來自一個xlsx文件的數據。 在一個數據框(經濟)中,列名稱帶有方括號和單引號。
data_final['economy'].columns =
Index([ ('Sr.No.',),
('DistrictName',),
('Agriculture',),
('Forestry& Logging',),
('Fishing',),
('Mining &Quarrying',),
('ManufacturingMFG.',),
('RegisteredMFG.',),
('Unregd. MFG.',),
('Electricity,Gas & W.supply',),
('Construction',),
('Trade,Hotels& Restaurants',),
('Railways',),
('Transportby other means',),
('Storage',),
('Communication',),
('Banking &Insurance',),
('Real, Ownership of Dwel. B.Ser.& Legal',),
('PublicAdministration',),
('OtherServices',),
('TotalDDP',),
('Population(In '00)',),
('Per CapitaIncome(Rs.)',)],
dtype='object')
我無法使用
data_final['economy']['('Construction',)']
給出錯誤-
SyntaxError: invalid syntax
我嘗試使用replace刪除括號-
data_final['economy'].columns = pd.DataFrame(data_final['economy'].columns).replace("(","",regex=True))
但這並不能消除列名中的錯誤。 如何從列名中刪除所有這些特殊字符?
看起來您的列名似乎是作為元組導入/創建的。 如果您嘗試引用它們去掉括號但在末尾留下逗號,會發生什么情況,如下所示
data_final['economy']['Construction',]
甚至連括號
data_final['economy'][('Construction',)]
語法錯誤應與該行有關
('Population(In '00)',),
該字符串包含一個單引號,通常會標記該字符串的結尾。 如果要在字符串中使用一個,則必須將其用"
將其轉義為\\'
括起來。結果如下:
('Population(In \'00)',),
同樣的問題也適用於您的實際呼叫,您也必須在該處轉義引號。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.