繁体   English   中英

如何从anckor标签的html链接中提取新闻文章

[英]How to extract news article from html links of anckor tags

有人可以帮助我提取以下标签中可用的新闻文本。

 <a href="tigrinya/news-50612332.html" class="faux-block-link__overlay-link" tabindex="-1" aria-hidden="true"> ሕሉፍ ወልፊ ሞባይል፡ ንመንእሰያት ራዕዲ ከምዝፈጥረሎም ተገሊጹ</a>" and " <a href="tigrinya/news-50605565.html" class="title-link"> <h3 class="title-link__title"> <span class="title-link__title-text">ሃገራዊ ቦርድ መረጻ ኢትዮጵያ ንብልጽግና ፓርቲ ኣይመዝገብኩዎን ኢሉ</span> </h3> </a>

使用 python BeautifulSoup 库解析 HTML 数据

从 bs4 导入 BeautifulSoup

数据= “” “ሕሉፍወልፊሞባይልንመንእሰያትራዕዲከምዝፈጥረሎምተገሊጹ” 和 “ሃገራዊቦርድመረጻኢትዮጵያንብልጽግናፓርቲኣይመዝገብኩዎንኢሉ ”“”

汤 = BeautifulSoup(数据,'lxml')

打印(soup.find('span', {'class': 'title-link__title-text'}).text)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM