[英]Remove special characters from column headers
我有一本关于数据框(健康,教育,经济等)的字典(data_final)。 数据帧包含来自一个xlsx文件的数据。 在一个数据框(经济)中,列名称带有方括号和单引号。
data_final['economy'].columns =
Index([ ('Sr.No.',),
('DistrictName',),
('Agriculture',),
('Forestry& Logging',),
('Fishing',),
('Mining &Quarrying',),
('ManufacturingMFG.',),
('RegisteredMFG.',),
('Unregd. MFG.',),
('Electricity,Gas & W.supply',),
('Construction',),
('Trade,Hotels& Restaurants',),
('Railways',),
('Transportby other means',),
('Storage',),
('Communication',),
('Banking &Insurance',),
('Real, Ownership of Dwel. B.Ser.& Legal',),
('PublicAdministration',),
('OtherServices',),
('TotalDDP',),
('Population(In '00)',),
('Per CapitaIncome(Rs.)',)],
dtype='object')
我无法使用
data_final['economy']['('Construction',)']
给出错误-
SyntaxError: invalid syntax
我尝试使用replace删除括号-
data_final['economy'].columns = pd.DataFrame(data_final['economy'].columns).replace("(","",regex=True))
但这并不能消除列名中的错误。 如何从列名中删除所有这些特殊字符?
看起来您的列名似乎是作为元组导入/创建的。 如果您尝试引用它们去掉括号但在末尾留下逗号,会发生什么情况,如下所示
data_final['economy']['Construction',]
甚至连括号
data_final['economy'][('Construction',)]
语法错误应与该行有关
('Population(In '00)',),
该字符串包含一个单引号,通常会标记该字符串的结尾。 如果要在字符串中使用一个,则必须将其用"
将其转义为\\'
括起来。结果如下:
('Population(In \'00)',),
同样的问题也适用于您的实际呼叫,您也必须在该处转义引号。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.