從雅虎財經抓取數據

Question

我一直在嘗試從 yahoo Finance 中抓取數據，但每次嘗試時都會出現以下錯誤：-

Traceback (most recent call last):   
  File "C:\Users\nnarn\PycharmProjects\papaproject\main.py", line 15, in <module>
    print(str(parsePrice()))   
  File "C:\Users\nnarn\PycharmProjects\papaproject\main.py", line 8, in parsePrice
    soup=bs4.BeautifulSoup(r.text, "xml")   
  File "C:\Users\nnarn\AppData\Local\Programs\Python\Python39\lib\site-packages\bs4\__init__.py", line 243, in __init__
    raise FeatureNotFound(
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: xml. Do you need to install a parser library?

編碼：

import bs4
import requests
from bs4 import BeautifulSoup
    
def parsePrice():
   r=requests.get('https://finance.yahoo.com/quote/FB?p=FB')
   soup=bs4.BeautifulSoup(r.text, "xml")
   price=soup.find('div',{'class':'D(ib) Mend(20px)'})[0].find('span').text
   print(price)
   return price
    
while True:
   print(str(parsePrice()))

Answer 1

BS4 文檔建議您使用soup = BeautifulSoup(r.text, 'html.parser') ，因為您正在下載的頁面內容是 HTML，而不是 XML。

Answer 2

只需刪除“xml”，您的soup.find也包含錯誤。 首先find_all跨度，然后 select 是您需要的列表：

import bs4
import requests

from bs4 import BeautifulSoup

def parsePrice():
    r=requests.get('https://finance.yahoo.com/quote/FB?p=FB')
    soup=bs4.BeautifulSoup(r.text)
    price=soup.find('div',{'class':'D(ib) Mend(20px)'}).find_all('span')[0].text
    print(price)
    return price

while True:
    print(str(parsePrice()))

從雅虎財經抓取數據

問題描述

2 個解決方案

解決方案1
0 2021-03-12 10:39:18

解決方案2
-1 2021-03-12 10:43:23

從雅虎財經抓取數據

問題描述

2 個解決方案

解決方案1 0 2021-03-12 10:39:18

解決方案2 -1 2021-03-12 10:43:23

解決方案1
0 2021-03-12 10:39:18

解決方案2
-1 2021-03-12 10:43:23