[英]Web Scraping data using python
我刚开始使用 Python 学习网页抓取。 我的目标是从http://money.rediff.com/companies/Bajaj-Auto-Ltd/10540026网上抓取 Bajaj Auto Ltd. 的实时新闻。
问题:我无法提取内容(即新闻)。
from urllib.request import urlopen
from bs4 import BeautifulSoup
url = 'http://money.rediff.com/companies/Bajaj-Auto-Ltd/10540026'
data = urlopen(url)
soup = BeautifulSoup(data)
te=soup.find('a',attrs={'target':'_jbpinter'})
lis=te.find_all_next('a',attrs={'target':'_jbpinter'})
#print(lis)
for li in lis:
print(li.find('a').contents[0])
我收到错误“AttributeError: 'NoneType' object has no attribute 'contents'” 我没有得到想要的结果。
任何输入将不胜感激。
您正试图两次获取a
标签。
代替
for li in lis:
print(li.find('a').contents[0])
和
for li in lis:
print(li.get_text())
你会得到这个输出:
Need Different Rates For Different Products: Rahul Bajaj on GST
Reforms irrespective of Bihar results: Bajaj
Auto shares in focus; Tata Motors up over 5%
We believe new Avenger will stimulate the market: Bajaj Auto's Eric Vas
BHP Billiton pins future of Indonesian coal mine on new...
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.