簡體   English   中英

如何使用 xpath scrapy 在標簽中選擇文本?

[英]How to select text in a tag with xpath scrapy?

我想選擇這些標簽中的文本,我該如何選擇它們(我想在 Facebook 粉絲頁面上的帖子中選擇名稱和評論)?

  • 我有 2 個這樣的 div 標簽
<div class="_2b05">
    <a href="/profile.php?id=100003980635623&amp;fref=nf&amp;rc=p&amp;__tn__=R">
        <div class="_7_cb _3-8m">
        <i class="_3-8_ img sp_VfPHLawdqPX sx_0636a9"></i>
        Fan cứng
        </div>
        Hải Ka
        </a>
    </div><div data-commentid="511961943618859" data-sigil="comment-body">
    Ráng lướt rồi cũng sẽ qua<span class="_5mfr"><span class="_6qdm" style="height: 16px; width: 16px; font-size: 16px; background-image: url(&quot;https://static.xx.fbcdn.net/images/emoji.php/v9/t81/1/16/1f60c.png&quot;)">😌</span></span></div>



<div class="_2b05">
    <a href="/leminhnhut2110?fref=nf&amp;rc=p&amp;__tn__=R">
    Lê Minh Nhựt</a>
    </div>
    <div data-commentid="511968943618159" data-sigil="comment-body">Làm ngụm Oolong cho phẻ m.n êijii</div>

我成功地通過使用這樣的 xpath 來選擇評論

response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')

但是這個名字有一些風扇標簽的問題。 我使用了這個 xpath:

response.xpath('//div[contains(@data-sigil,"comment-body")]//preceding-sibling::div/a/text()')

如果沒有粉絲文本,它只會顯示評論的用戶名。 如何跳過粉絲文本,只選擇包含用戶名的文本? 謝謝

一些關於它的圖片: 在此處輸入圖像描述 附粉絲文字: 在此處輸入圖像描述 沒有粉絲文本: 在此處輸入圖像描述

更新:對不起,我的問題不是粉絲文本。 您可以閱讀我和 F.Hoque 爵士之間的對話以了解更多信息。 謝謝

response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')

輸出:

(上面的 xpath 選擇將返回以下輸出)

Ráng lướt rồi cũng sẽ qua
Làm ngụm Oolong cho phẻ m.n êijii

選擇用戶名:

response.xpath('//div[@class="_2b05"]/a/text()')

輸出:

 Hải Ka
Lê Minh Nhựt

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM