如何使用 python 提取图像 url？

Question

我正在尝试从此代码中提取图像 URL：

<div class="theme-screenshot one attachment-theme-screenshot size-theme-screenshot wp-post-image loaded" data-featured-src="https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg" data-src="https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg" style='background-image: url("https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg");'></div>

如何在 data-src 中找到 URL？

我正在使用漂亮的汤并找到 function 但我不知道如何提取链接，因为我没有像往常一样看到 img 标签...

提前感谢您的时间

Answer 1

您可以尝试以下方法：

from bs4 import BeautifulSoup

html = """
<div class="theme-screenshot one attachment-theme-screenshot size-theme-screenshot wp-post-image loaded" data-featured-src="https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg" data-src="https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg" style='background-image: url("https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg");'></div>
"""
soup = BeautifulSoup(html, "html.parser")
url = soup.select_one(
    "div.theme-screenshot.one.attachment-theme-screenshot.size-theme-screenshot.wp-post-image.loaded"
).get("data-src")

print(url)

这将返回：

https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg

BeautifulSoup(bs4) 的文档可以在以下位置找到：

https://www.crummy.com/software/BeautifulSoup/bs4/doc/

Answer 2

如果您出于某种原因不能使用 HTML 解析器，那么您可以使用正则表达式。

import re

text = '''
<div class="theme-screenshot one attachment-theme-screenshot size-theme-screenshot wp-post-image loaded" data-featured-src="https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg" data-src="https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg" style='background-image: url("https://websitedemos.net/wp-content/uploads/2019/07/outdoor-adventure-02-home.jpg");'></div>
'''

parsed = re.search('(?<=data-src=").*(?=" )', text).group(0)

print(parsed)

如何使用 python 提取图像 url？

问题描述

2 个解决方案

解决方案1
1 2022-07-29 15:58:48

解决方案2
1 2022-07-29 16:15:24

如何使用 python 提取图像 url？

问题描述

2 个解决方案

解决方案1 1 2022-07-29 15:58:48

解决方案2 1 2022-07-29 16:15:24

解决方案1
1 2022-07-29 15:58:48

解决方案2
1 2022-07-29 16:15:24