繁体   English   中英

使用python将HTML表格转换为CSV文件

[英]Converting HTML table to CSV file using python

我对熊猫很陌生,所以我想用熊猫将这个 HTML 表转换为 CSV 文件,但是我的 CSV 文件给了我一个奇怪的标志,它没有设法将所有表转换为 CSV。
这是我的代码。 我阅读了有关使用 beautifulsoup 的信息,但我不太确定如何使用该功能。

import as pandas
df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'
              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')
df[0].to_csv('ENR3.0.csv')

谢谢!

编辑:我已将导入更改为import pandas as dp但我仍然无法将所有 HTML 表转换为 CSV 文件。

非常感谢您的所有帮助!

您可以使用pandas本身来做到这一点。 你搞砸了import语句。 以下是您如何正确执行此操作:

import pandas as pd
df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'
              'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')

df[0].to_csv('ENR3.0.csv', index = False)

如果要获取变量df存在的所有dataframes ,请将最后一行替换为:

for x in range(len(df)):
    df[x].to_csv(f"CSV_File_{x+1}", index = False)

导入语句有问题
它应该是import pandas as pd而不是import as pandas ,因为您在下面的代码中使用别名pd

学习美汤,用lxml解析器解析需要的数据(非常快)。
此链接可能对您有所帮助:
BeautifulSoup 不同的解析器


如果需要任何其他帮助,请在此帖子上发表评论,并尝试对我们的问题进行排序:)



在您的代码中进行更正:

 import pandas as pd df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR' 'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1') df[0].to_csv('ENR3.0.csv')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM