Python html 解析使用漂亮的汤问题

Question

我正在尝试使用 beautifulsoup 从https://www.devex.com/organizations/search获取所有组织的名称。但是，我遇到了错误。 有人可以帮忙吗。

从请求中导入请求从 bs4 中导入请求导入 BeautifulSoup 导入 pandas 作为 pd 导入 numpy 作为 np

从时间导入睡眠从随机导入randint

headers = {"Accept-Language": "en-US,en;q=0.5"}

标题 = [] 页 = np.arange(1, 2, 1)

对于页面中的页面：

page = requests.get("https://www.devex.com/organizations/search?page%5Bnumber%5D=" + str(page) + "", headers=headers)

soup = BeautifulSoup(page.text, 'html.parser') movie_div = soup.find_all('div', class_='info-container')

睡眠（randint（2,10））

对于movie_div中的容器：

    name = container.a.find('h3', class_= 'ng-binding').text
    titles.append(name)

电影 = pd.DataFrame({ '电影': 标题,

})

看你的 dataframe

印刷（电影）

打印（movies.dtypes）

打印(movies.isnull().sum())

movies.to_csv('movies.csv')

Answer 1

你可以试试类似的东西

name = bs.find("h3", {"class": "ng-binding"})