繁体   English   中英

我正在尝试为我的项目抓取一个网站,但我遇到了一个错误。 看看,让我知道是否有人对此有建议

[英]I am trying to scrape a website for my project but I am stuck with an error. Take a look and let me know if anyone have suggestion for this

html_text = requests.get('https://www.trustpilot.com/categories/restaurants_bars? 
numberofreviews=0&status=claimed&timeperiod=0').text
soup = BeautifulSoup(html_text, 'lxml')
restaurants = soup.find_all('a', class_ = 'internal___1jK0Z wrapper___26yB4')
for index, restaurant in enumerate(restaurants):
    name = restaurant.find('div', class_ = 'businessTitle___152-c').text
    rating = restaurant.find('div', class_ = 'textRating___3F1NO').text
    with open('{index}.csv', 'a') as f:
        f.write(name)
        f.write(',')
        f.write(rating)
        f.write('\n')

    print('File saved')

这是引发错误的代码。

回溯(最后一次调用):文件“main.py”,第 8 行,名称 = restaurant.find('div', class_ = 'businessTitle___152-c').text AttributeError: 'NoneType' object 没有属性 'text '

运行您的代码并打印出相关位。 您所定位的类集, internal___1jK0Z wrapper___26yB4器___26yB4 不仅用于餐厅网站,还用于页面页脚中的 about 链接。 我认为这组类用于每个链接,而不仅仅是餐厅网站的链接。

在此处输入图像描述

您正在尝试访问None类型的 object 的属性,可能您的一个查询返回None

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM