繁体   English   中英

如何清理带有特殊字符的数据集?

[英]How to clean dataset with special characters?

有很多单元格的数据看起来像这样(我正在分析电子商务数据集):

Mode d'été Flare Sleeve Plus Size T-shirt hors de l'épaule 

你会如何建议我清理这个数据集? 我知道字符串替换是一个选项,但是有更好/更有效的选项吗? 我真的只需要“喇叭袖加大码 T 恤”

用这个:

print("Mode d'été Flare Sleeve Plus Size T-shirt hors de l'épaule ".encode('WINDOWS-1252').decode())

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM