簡體   English   中英

導入Beautifulsoup時出錯

[英]Error when Importing Beautifulsoup

我正在寫一些語法來分析網站並在那里獲取所有href。 但是,當我嘗試導入bs4時,它彈出一個錯誤,提示“ ImportError:無法導入名稱'HTMLParseError'。我正在使用Python 3.5.2。

我參考了過去的內容,並且知道這可能是由於bs4的舊版本所致,因此已將其升級到4.5.1版。 但是,該錯誤仍然存​​在。 我的語法有問題嗎(我在下面附上,這也是從過去的參考文獻中得出的)。 還是我必須尋找另一種工具來完成任務?

有人知道嗎? 還有一件事,我也嘗試安裝lxml(它說無法找到vcvarsall.bat),但也失敗了。 因此,我可以使用的工具並不多。

from bs4 import BeautifulSoup
import urllib.request

def open_html():

    resp = urllib.request.urlopen("http://www.gpsbasecamp.com/national-parks")
    soup = BeautifulSoup(resp, from_encoding=resp.info().get_param('charset'))

    for link in soup.find_all('a', href=True):
        print(link['href'])

if __name__ == '__main__':
    open_html()

如果要手動安裝lxml,可以下載從http://www.lfd.uci.edu/~gohlke/pythonlibs/頁面編譯的lxml .whl文件。 接下來,打開cmd,cd以決定保存該文件的位置,並使用命令:

點安裝[name_of_file]

但這是解決此問題的最簡單方法,否則我將向您介紹主題:

pip安裝出現錯誤:無法找到vcvarsall.bat

作為一種替代措施,已經安裝了Anaconda python,它已包括BS 4.4.1和lxml 3.6( https://docs.continuum.io/anaconda/pkg-docs )。 通常,Anaconda使包裹管理變得輕而易舉。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM