简体   繁体   English

使用BeautifulSoup从html文件中提取特定文本

[英]Extracting particular text from html file using BeautifulSoup

I have a code like given below. 我有下面给出的代码。 I am using BeautifulSoup to scrape text in class = 'product'. 我正在使用BeautifulSoup刮擦class ='product'中的文本。 But I wanted only 2nd and 4th value(ie. 'Product 2' and 'Product 4') in my extracted csv file. 但是我提取的csv文件中只需要第二和第四值(即“产品2”和“产品4”)。 As of now I only know to extract all the values(ie. 'Product 1' 'Product 2' 'Product 3' 'Product 4'). 到目前为止,我只知道提取所有值(即“产品1”,“产品2”,“产品3”,“产品4”)。

 <body> <div class="product">Product 1</div> <div class="product">Product 2</div> <div class="product">Product 3</div> <div class="product">Product 4</div> </body> 

find_all returns a list, so use indexes to get the desired elements find_all返回一个列表,因此使用索引来获取所需的元素

result = data_soup.find_all(attrs={"class": "product"})
print(result[1], result[3])

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM