动态查找href标签

Question

我试图从我的美丽汤搜索中提取“信息技术”作为输出。 但我还不能弄清楚，因为“扇区”是 URL 中任何类型的股票代码的动态值。

谁能告诉我如何提取这些信息？

<a href="http://eresearch.fidelity.com/eresearch/markets_sectors/sectors/sectors_in_market.jhtml?tab=learn&amp;sector=45">Information Technology</a>

我的代码：

url = 'https://eresearch.fidelity.com/eresearch/goto/evaluate/snapshot.jhtml?symbols=AAPL'

html = requests.get(url).text    
detail_tags_sector = BeautifulSoup(html, 'lxml')
detail_tags_sector.find_all('a')

Answer 1

要从锚元素获取文本，您需要访问每个锚元素上的 .text 变量
因此，您的代码将更改为：

url = 'https://eresearch.fidelity.com/eresearch/goto/evaluate/snapshot.jhtml?symbols=AAPL'
contents = []

html = requests.get(url).text    
detail_tags_sector = BeautifulSoup(html, 'html.paser')
for anchor in detail_tags_sector.find_all('a'):
    contents.append(anchor.text)
print(contents)

Answer 2

您可以使用以下任一选项。

import requests
from lxml.html.soupparser import fromstring
url = 'https://eresearch.fidelity.com/eresearch/goto/evaluate/snapshot.jhtml?symbols=AAPL'
html = requests.get(url).text
soup=fromstring(html)
findSearch = soup.xpath('//a[contains(text(), "Information Technology")]/text()')
print(findSearch[0])

或者

from bs4 import BeautifulSoup
from lxml import html
import requests
url = 'https://eresearch.fidelity.com/eresearch/goto/evaluate/snapshot.jhtml?symbols=AAPL'

html = requests.get(url).text
detail_tags_sector = BeautifulSoup(html, 'lxml')
for link in detail_tags_sector.find_all('a'):
    print(link.text)

或者

from bs4 import BeautifulSoup    
import requests
url = 'https://eresearch.fidelity.com/eresearch/goto/evaluate/snapshot.jhtml?symbols=AAPL'
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser')
for link in soup.find_all('a'):
    print(link.text)

请让我知道这可不可以帮你。

Answer 3

这些答案的问题在于，它们收集了页面上所有链接的文本，而且数量不少。 如果只想挑选出information technology字符串，您需要做的就是添加：

info = soup.select_one('[href*="sectors_in"]')
print(info.text)

输出：

Information Technology

动态查找href标签

问题描述

3 个解决方案

解决方案1
1 2019-02-18 16:28:48

解决方案2
0 已采纳 2019-02-18 16:41:07

解决方案3
0 2019-02-20 01:18:54

动态查找href标签

问题描述

3 个解决方案

解决方案1 1 2019-02-18 16:28:48

解决方案2 0 已采纳 2019-02-18 16:41:07

解决方案3 0 2019-02-20 01:18:54

解决方案1
1 2019-02-18 16:28:48

解决方案2
0 已采纳 2019-02-18 16:41:07

解决方案3
0 2019-02-20 01:18:54