简体   繁体   English

Python 将Ã3编码为ó

[英]Python Encode Ã3 as ó

I have a string like我有一个字符串

' La empresa de capitales mixtos que opera el predio de residuos, Ceamse, aclarÃ3 este martes que la responsabilidad del desentendimiento con los recicladores informales que provocÃ3 un nuevo bloqueo y hace peligrar la recolecciÃ3n ' ' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclarÃ3 este martes que la responsabilidad del desentendimiento con los recicladores informes que provocÃ3 un nuevo bloqueo y hace peligrar la recolecciÃ3n '

and y need this你需要这个

' La empresa de capitales mixtos que opera el predio de residuos, Ceamse, aclaró este martes que la responsabilidad del desentendimiento con los recicladores informales que provocó un nuevo bloqueo y hace peligrar la recolección ' ' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclaró este martes que la responsabilidad del desentendimiento con los recicladores informes que provocó un nuevo bloqueo y hace peligrar la recolección '

how can I do this with Python?我怎么能用 Python 做到这一点?

thanks!谢谢!

You need to fix your webscraping script!您需要修复您的网页抓取脚本!

It looks like La Capital sends proper http header and html head information, and the content is UTF-8 encoded.貌似 La Capital 发送了正确的 http header 和 html 头部信息,内容是 ZAE3B3ZDF6970B49B9BC57277 编码的。 So your script needs to handle that, and everything will work fine.所以你的脚本需要处理它,一切都会正常工作。

I know from experience requests.get and beautifulsoup 4 both handles Unicode well, so just debug your script, and see where it goes wrong.我从经验中知道 requests.get 和 beautifulsoup 4 都可以很好地处理 Unicode,所以只需调试你的脚本,看看哪里出错了。 Check the raw input, check if you need your page's.content or.text, and fix it accordingly.检查原始输入,检查您是否需要页面的.content 或.text,并相应地修复它。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM