繁体   English   中英

如何从“data-at”中提取文本?

[英]How to extract text from "data-at"?

我正在尝试为香水页面抓取丝芙兰网站。 当我尝试获取品牌名称时,我无法访问“data-at”后面的文本,所以这是我的尝试,但我不确定为什么它不起作用......

for container in perfume_containers:
# The brand
   brand = container.find('span', attrs={'class':'css-ktoumz'})['data-at']
   brands.append(brand)

在此处输入图片说明

在此处输入图片说明

请帮忙!

如果您想要使用类过滤器或任何其他过滤器成功选择的任何标签的值,那么假设您使用的是BeautifulSoup您可以使用.text属性访问此标签的值

例子

from bs4 import BeautifulSoup
import requests

url = "https://www.sephora.com/shop/perfume"
url = (url)

page = requests.get(url)

soup = BeautifulSoup(page.text, "lxml")

print(soup.find('span', attrs={'class':'css-ktoumz'}).get('data-at')) # will print sku_item_brand
print(soup.find('span', attrs={'class':'css-ktoumz'}).text) # will print CHANEL

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM