[英]Impossible to get specific table with `read_html
我正在嘗試使用read_html
函數( URL )訪問表。
我的問題是read_html
似乎沒有找到我的表,而它存在。 我不知道為什么,除了我要閱讀的表格與另一個表格具有相同的屬性。
我先做了:
url = 'https://geco.amf-france.org/Bio/res_part.aspx?NomProd=&OrderBy=&OrderBySens=&NumAgr=&CodeISIN=&NomSoc=&selectNRJ=OPCVM&ClassProd=0&TypeProd=&npos='
df = pd.read_html(url)
df
它在 df[0]、df 1和 df[3] 中返回 3 個 df 存儲,但沒有一個是我看到的主表。 它只是一張小桌子,而不是圖片中的“大”桌子:
[ 0
0 Recherche Liste Vendredi 2 octobre 2020 Prod...,
0 1 2 \
0 Recherche Recherche Recherche
1 Produit financier Gestionnaire Valeurs liquidatives
3 4 5 \
0 Recherche Liste Liste
1 Associations Professionnelles Encours Gestionnaires agréés
6 7
0 Liste Vendredi 2 octobre 2020
1 Gestionnaires de l'EEE - Passeport IN Recherche Documentaire ,
0 1 2 3
0 Code ISIN part : NaN Nom de Produit : NaN
1 N° d'agrément : NaN Classification produit : NaN
2 Nom SG : NaN Régime juridique : OPCVM]
我也試過:
df = pd.read_html(url, attrs = {'class' : 'ctcoltableresult2'})
df
但它什么都不返回
有任何想法嗎?
看起來如果您將 falvor 指定為 bs4 就可以了。 我還添加了 attrs 以獲取“大”表。
url = 'https://geco.amf-france.org/Bio/res_part.aspx?NomProd=&OrderBy=&OrderBySens=&NumAgr=&CodeISIN=&NomSoc=&selectNRJ=OPCVM&ClassProd=0&TypeProd=&npos='
df = pd.read_html(url, flavor='bs4', attrs={'class':'ctcoltableresult2'})
df
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.