簡體   English   中英

Python Scrapy獲取HTML <script> tag

[英]Python Scrapy Get HTML <script> tag

我有一個項目,我需要HTML代碼中的get腳本。

        <script>
      (function() {
        ... / More Code
        Level.grade = "2";

        Level.level = "1";

        Level.max_line = "5";

        Level.cozum = 'adım 12\ndön sağ\nadım 13\ndön sol\nadım 11'; 
... / More Code
</script>

我如何僅獲得“adım12 \\ndönsağ\\nadım13 \\ndönsol \\nadım11”此代碼?

感謝您的幫助

使用正則表達式來做到這一點

首先抓取該SCRIPT標簽的內容,例如

response.css("script").extract_first()

然后使用這個正則表達式

(Level\.cozum = )(.*?)(\;)

在此處查看演示https://regex101.com/r/YxHRmR/1

這是代碼

import re
regex = r"(Level\.cozum = )(.*?)(\;)"

test_str = ("<script>\n"
    "      (function() {\n"
    "        ... / More Code\n"
    "        Level.grade = \"2\";\n\n"
    "        Level.level = \"1\";\n\n"
    "        Level.max_line = \"5\";\n\n"
    "        Level.cozum = 'adım 12\\ndön sağ\\nadım 13\\ndön sol\\nadım 11'; \n"
    "... / More Code\n"
    "</script>")

matches = re.findall(regex, test_str, re.MULTILINE)

print(matches)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM