使用python将HTML表格转换为CSV文件

Question

我对熊猫很陌生，所以我想用熊猫将这个 HTML 表转换为 CSV 文件，但是我的 CSV 文件给了我一个奇怪的标志，它没有设法将所有表转换为 CSV。
这是我的代码。 我阅读了有关使用 beautifulsoup 的信息，但我不太确定如何使用该功能。

import as pandas
df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'
              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')
df[0].to_csv('ENR3.0.csv')

谢谢！

编辑：我已将导入更改为import pandas as dp但我仍然无法将所有 HTML 表转换为 CSV 文件。

非常感谢您的所有帮助！

Answer 1

您可以使用pandas本身来做到这一点。 你搞砸了import语句。 以下是您如何正确执行此操作：

import pandas as pd
df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'
              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')

df[0].to_csv('ENR3.0.csv', index = False)

如果要获取变量df存在的所有dataframes ，请将最后一行替换为：

for x in range(len(df)):
    df[x].to_csv(f"CSV_File_{x+1}", index = False)

Answer 2

导入语句有问题
它应该是import pandas as pd而不是import as pandas ，因为您在下面的代码中使用别名pd 。

学习美汤，用lxml解析器解析需要的数据（非常快）。
此链接可能对您有所帮助：
BeautifulSoup 不同的解析器

如果需要任何其他帮助，请在此帖子上发表评论，并尝试对我们的问题进行排序:)

在您的代码中进行更正：

 import pandas as pd df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR' 'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1') df[0].to_csv('ENR3.0.csv')

使用python将HTML表格转换为CSV文件

问题描述

2 个解决方案

解决方案1
0 已采纳 2020-10-15 06:39:55

解决方案2
0 2020-10-15 06:40:25

使用python将HTML表格转换为CSV文件

问题描述

2 个解决方案

解决方案1 0 已采纳 2020-10-15 06:39:55

解决方案2 0 2020-10-15 06:40:25

解决方案1
0 已采纳 2020-10-15 06:39:55

解决方案2
0 2020-10-15 06:40:25