簡體   English   中英

如何通過使用CSS或XPath選擇器拒絕指定的HTML標簽

[英]How to reject specify HTML tags by using css or xpath selector

我想通過使用css或xpath選擇器來刪除stylescript標簽及其內容。

這是一個示例HTML:

<html>
  <head>
    <title>test</title>
    <style>
      // style
    </style>
    <script>
      /* some script */
    </script>
  </head>
  <body>
    <p>text</p>
    <script>
      /* some script */
    </script>
    <div>foo</div>
  </body>
</html>

我想要一個這樣的HTML:

<html>
  <head>
    <title>test</title>
  </head>
  <body>
    <p>text</p>
    <div>foo</div>
  </body>
</html>

我以為我可以用此代碼獲得不包含<script>標記的HTML,但是以某種方式該代碼僅復制HTML。

doc = Nokogiri::HTML(open("foo.text"))
doc.css(":not(script)").to_html

如何啟用我想要的行為?

嘗試以下行:

doc.search('.//style').remove
doc.search('.//script').remove

更簡單的是:

doc.search('style,script').remove

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM