簡體   English   中英

刪除美麗湯中的換行符

[英]Remove newlines in beautiful soup

在BeautifulSoup中,我具有以下內容:

>>> tr = soup.find_all('tr')[1]
<tr>
<td>Adaptive Systems Seminar (HOC+WPO)</td>
<td>wo</td>
<td>13:00</td>
<td>17:00</td>
<td>4:00</td>
<td>22-29, 32-36</td>
<td>MANDERICK BERNARD</td>
<td> </td>
</tr>

但是,我只是對文本感興趣。 所以我做

>>> tr(text=True)
[u'\n', u'Adaptive Systems Seminar (HOC+WPO)', u'\n', u'wo', u'\n', u'13:00', u'\n', u'17:00', u'\n', u'4:00', u'\n', u'22-29, 32-36', u'\n', u'MANDERICK BERNARD', u'\n', u'\xa0', u'\n']

我想要上面的列表,但是沒有所有的換行符 我已經閱讀了文檔,但找不到任何相關信息。

一種選擇是找到其中的所有td元素並使用get_text()

In [4]: [td.get_text(strip=True) for td in soup.select("tr > td")]
Out[4]: 
[u'Adaptive Systems Seminar (HOC+WPO)',
 u'wo',
 u'13:00',
 u'17:00',
 u'4:00',
 u'22-29, 32-36',
 u'MANDERICK BERNARD',
 u'']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM