Python- <a>使用BeautifulSoup</a>从<a>选项卡</a>获取数据

Question

    <a href="/realDonaldTrump/status/868985285207629825" class="tweet-timestamp js-permalink js-nav js-tooltip" data-original-title="5:20 PM - 28 May 2017"></a>

url = "https://twitter.com/realDonaldTrump?
ref_src=twsrc%5Egoogle%7Ctwcamp%5Eserp%7Ctwgr%5Eauthor"
r = requests.get(url)

soup = BeautifulSoup(r.content, "html.parser")

links = soup.find_all('a')
for link in soup.find_all('a'):
print(link.text, link.get('href'))

我在从html中检索“ href”标签时遇到了麻烦。 该代码可以检索所有其他“ href”，但我想要的是“ / realDonaldTrump / status / 868985285207629825”。 我也想检索“ data-original-title”标签。 有什么帮助或建议吗？

Answer 1

import requests
from bs4 import BeautifulSoup    
url = "https://twitter.com/realDonaldTrump?ref_src=twsrc%5Egoogle%7Ctwcamp%5Eserp%7Ctwgr%5Eauthor"
r = requests.get(url)

soup = BeautifulSoup(r.content, "html.parser")

links = soup.find_all('a', {'class':'tweet-timestamp js-permalink js-nav js-tooltip'})
for link in links:
    try:
        print(link['href'])
        if link['data-original-title']:
            print(link['data-original-title'])
    except:
        pass

Python- <a>使用BeautifulSoup</a>从<a>选项卡</a>获取数据

问题描述

1 个解决方案

解决方案1
0 已采纳 2017-05-29 05:42:32

Python- <a>使用BeautifulSoup</a>从<a>选项卡</a>获取数据

问题描述

1 个解决方案

解决方案1 0 已采纳 2017-05-29 05:42:32

解决方案1
0 已采纳 2017-05-29 05:42:32