简体繁体 English

Python 将Ã3编码为ó

[英]Python Encode Ã3 as ó

原文 2020-05-26 21:59:16 8 1 python/ decode/ encode

I have a string like我有一个字符串

' La empresa de capitales mixtos que opera el predio de residuos, Ceamse, aclarÃ3 este martes que la responsabilidad del desentendimiento con los recicladores informales que provocÃ3 un nuevo bloqueo y hace peligrar la recolecciÃ3n ' ' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclarÃ3 este martes que la responsabilidad del desentendimiento con los recicladores informes que provocÃ3 un nuevo bloqueo y hace peligrar la recolecciÃ3n '

and y need this你需要这个

' La empresa de capitales mixtos que opera el predio de residuos, Ceamse, aclaró este martes que la responsabilidad del desentendimiento con los recicladores informales que provocó un nuevo bloqueo y hace peligrar la recolección ' ' La empresa de capitales mixtos que el predio de residuos, Ceamse, aclaró este martes que la responsabilidad del desentendimiento con los recicladores informes que provocó un nuevo bloqueo y hace peligrar la recolección '

how can I do this with Python?我怎么能用 Python 做到这一点？

thanks!谢谢！

1 个解决方案

You need to fix your webscraping script!您需要修复您的网页抓取脚本！

It looks like La Capital sends proper http header and html head information, and the content is UTF-8 encoded.貌似 La Capital 发送了正确的 http header 和 html 头部信息，内容是 ZAE3B3ZDF6970B49B9BC57277 编码的。 So your script needs to handle that, and everything will work fine.所以你的脚本需要处理它，一切都会正常工作。

I know from experience requests.get and beautifulsoup 4 both handles Unicode well, so just debug your script, and see where it goes wrong.我从经验中知道 requests.get 和 beautifulsoup 4 都可以很好地处理 Unicode，所以只需调试你的脚本，看看哪里出错了。 Check the raw input, check if you need your page's.content or.text, and fix it accordingly.检查原始输入，检查您是否需要页面的.content 或.text，并相应地修复它。