嘗試添加僅提取包含“word”的行的代碼，並從請求中寫入一個 new.txt 文件

Question

此代碼打開一個包含網站的文本文件 ( list.txt )，然后從這些網站的 webarchive.org 中提取 URLS，並將它們寫入一個新的文本文件 ( urls.txt )。 我只需要從 web.archive.org 中提取包含“word”的鏈接，但出現錯誤：

if `word' in url:  IndentationError: unexpected indent

有人可以解釋原因並在此處提供正確的代碼嗎？

代碼：

urls = []
with open("list.txt", "r") as f_in:
    for line in map(str.strip, f_in):
        if line == "":
            continue
        urls.append(line)

archive_url = "http://web.archive.org/cdx/search/cdx?url=*.{}&output=text&fl=original&collapse=urlkey"

with open("url.txt", "w") as f_out:
    for url in urls:

        r = requests.get(archive_url.format(url))
         if 'word' in url:
        print(r.text, file=f_out)
        print("\n", file=f_out)

Answer 1

有兩個問題：

if語句前有一個前導空格
在此語句之后的行中，您必須縮進代碼

這應該可以解決您的問題：

urls = []
with open("list.txt", "r") as f_in:
    for line in map(str.strip, f_in):
        if line == "":
            continue
        urls.append(line)

archive_url = "http://web.archive.org/cdx/search/cdx?url=*.{}&output=text&fl=original&collapse=urlkey"

with open("url.txt", "w") as f_out:
    for url in urls:

        r = requests.get(archive_url.format(url))
        if 'word' in url:
            print(r.text, file=f_out)
            print("\n", file=f_out)

嘗試添加僅提取包含“word”的行的代碼，並從請求中寫入一個 new.txt 文件

問題描述

1 個解決方案

解決方案1
1 2022-05-04 19:25:40

嘗試添加僅提取包含“word”的行的代碼，並從請求中寫入一個 new.txt 文件

問題描述

1 個解決方案

解決方案1 1 2022-05-04 19:25:40

解決方案1
1 2022-05-04 19:25:40