[英]How to get text and href value in anchor tag with scrapy, xpath, python
[英]How to select text in a tag with xpath scrapy?
我想選擇這些標簽中的文本,我該如何選擇它們(我想在 Facebook 粉絲頁面上的帖子中選擇名稱和評論)?
<div class="_2b05">
<a href="/profile.php?id=100003980635623&fref=nf&rc=p&__tn__=R">
<div class="_7_cb _3-8m">
<i class="_3-8_ img sp_VfPHLawdqPX sx_0636a9"></i>
Fan cứng
</div>
Hải Ka
</a>
</div><div data-commentid="511961943618859" data-sigil="comment-body">
Ráng lướt rồi cũng sẽ qua<span class="_5mfr"><span class="_6qdm" style="height: 16px; width: 16px; font-size: 16px; background-image: url("https://static.xx.fbcdn.net/images/emoji.php/v9/t81/1/16/1f60c.png")">😌</span></span></div>
<div class="_2b05">
<a href="/leminhnhut2110?fref=nf&rc=p&__tn__=R">
Lê Minh Nhựt</a>
</div>
<div data-commentid="511968943618159" data-sigil="comment-body">Làm ngụm Oolong cho phẻ m.n êijii</div>
我成功地通過使用這樣的 xpath 來選擇評論
response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')
但是這個名字有一些風扇標簽的問題。 我使用了這個 xpath:
response.xpath('//div[contains(@data-sigil,"comment-body")]//preceding-sibling::div/a/text()')
如果沒有粉絲文本,它只會顯示評論的用戶名。 如何跳過粉絲文本,只選擇包含用戶名的文本? 謝謝
更新:對不起,我的問題不是粉絲文本。 您可以閱讀我和 F.Hoque 爵士之間的對話以了解更多信息。 謝謝
response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')
輸出:
(上面的 xpath 選擇將返回以下輸出)
Ráng lướt rồi cũng sẽ qua
Làm ngụm Oolong cho phẻ m.n êijii
選擇用戶名:
response.xpath('//div[@class="_2b05"]/a/text()')
輸出:
Hải Ka
Lê Minh Nhựt
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.