簡體   English   中英

beautifulsoup 沒有完全解析頁面

[英]beautifulsoup doesn't fully parse the page

    import requests
from bs4 import BeautifulSoup as bs

url1 = 'https://school.karelia.ru/auth/login'
url2 = 'https://school.karelia.ru/personal-area/#diary'

payload = {
    'login_login': 'КлочковМ',
    'login_password': 'КлочковМ7'
}

def getHW():
    with requests.session() as s:
        s.post(url1, data=payload)
        r = s.get(url2)
        soup = bs(r.content, 'html.parser')
        print(soup.find_all("div"))

getHW()

我正在嘗試解析一個站點,但這段代碼並沒有完全解析。 在網站的代碼中,有比我從這段代碼得到的結果更多的子類:

<div class="right" id="main-region"></div>

出於某種原因,class“正確”就到此為止,即使在站點中它繼續了很多。 為什么會這樣?

這是因為你做了soup.find_all("div") div 以</div>結尾,你告訴 BS 只查找 div,所以 BS 就停在那里。 要實際搜索課程,請參見例如此答案

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM