無法使用 `read_html 獲取特定表

Question

我正在嘗試使用read_html函數（ URL ）訪問表。

我的問題是read_html似乎沒有找到我的表，而它存在。 我不知道為什么，除了我要閱讀的表格與另一個表格具有相同的屬性。

我先做了：

url = 'https://geco.amf-france.org/Bio/res_part.aspx?NomProd=&OrderBy=&OrderBySens=&NumAgr=&CodeISIN=&NomSoc=&selectNRJ=OPCVM&ClassProd=0&TypeProd=&npos='
df = pd.read_html(url)
df

它在 df[0]、df 1和 df[3] 中返回 3 個 df 存儲，但沒有一個是我看到的主表。 它只是一張小桌子，而不是圖片中的“大”桌子：

[                                                   0
 0  Recherche Liste  Vendredi 2 octobre 2020  Prod...,
                    0             1                     2  \
 0          Recherche     Recherche             Recherche   
 1  Produit financier  Gestionnaire  Valeurs liquidatives   
 
                                3        4                       5  \
 0                      Recherche    Liste                   Liste   
 1  Associations Professionnelles  Encours  Gestionnaires agrÃ©Ã©s   
 
                                        6                        7  
 0                                  Liste  Vendredi 2 octobre 2020  
 1  Gestionnaires de l'EEE - Passeport IN   Recherche Documentaire  ,
                    0   1                         2      3
 0   Code ISIN part : NaN          Nom de Produit :    NaN
 1  NÂ° d'agrÃ©ment : NaN  Classification produit :    NaN
 2           Nom SG : NaN       RÃ©gime juridique :  OPCVM]

我也試過：

df = pd.read_html(url, attrs = {'class' : 'ctcoltableresult2'})
df

但它什么都不返回

有任何想法嗎？

Answer 1

看起來如果您將 falvor 指定為 bs4 就可以了。 我還添加了 attrs 以獲取“大”表。

url = 'https://geco.amf-france.org/Bio/res_part.aspx?NomProd=&OrderBy=&OrderBySens=&NumAgr=&CodeISIN=&NomSoc=&selectNRJ=OPCVM&ClassProd=0&TypeProd=&npos='
df = pd.read_html(url, flavor='bs4', attrs={'class':'ctcoltableresult2'})
df

無法使用 `read_html 獲取特定表

問題描述

1 個解決方案

解決方案1
1 2020-10-02 20:05:37

無法使用 `read_html 獲取特定表

問題描述

1 個解決方案

解決方案1 1 2020-10-02 20:05:37

解決方案1
1 2020-10-02 20:05:37