[英]IMAP4_SSL with gmail in python
我們正在使用IMAP4_SSL和python從gmail帳戶中檢索郵件。 電子郵件正文以html格式檢索。 我們需要將其轉換為純文本。 有人可以幫助我們嗎?
站在巨人的肩膀上...
彼得·本格森(Peter Bengtsson)在這里已經解決了這個確切的問題。
彼得的劇本使用了Leonard Richardson的出色的BeautifulSoup ,
和Fredrik Lundh的unescape()函數 。
使用Peter的測試用例,您將獲得:
This is a paragraph.
Foobar [1]
http://two.com
Visit http://www.google.com.
Text elsewhere. Elsewhere [2]
[1] http://one.com
[2] http://three.com
...由此:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html>
<body>
<div id="main">
<p>This is a paragraph.</p>
<p><a href="http://one.com">Foobar</a>
<br />
<a href="http://two.com">two.com</a>
</p>
<p>Visit <a href="http://www.google.com">www.google.com</a>.</p>
<br />
Text elsewhere.
<a href="http://three.com">Elsewhere</a>
</div>
</body>
</html>
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.