[英]Converting HTML table to CSV file using python
我对熊猫很陌生,所以我想用熊猫将这个 HTML 表转换为 CSV 文件,但是我的 CSV 文件给了我一个奇怪的标志,它没有设法将所有表转换为 CSV。
这是我的代码。 我阅读了有关使用 beautifulsoup 的信息,但我不太确定如何使用该功能。
import as pandas
df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'
'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')
df[0].to_csv('ENR3.0.csv')
谢谢!
编辑:我已将导入更改为import pandas as dp
但我仍然无法将所有 HTML 表转换为 CSV 文件。
非常感谢您的所有帮助!
您可以使用pandas
本身来做到这一点。 你搞砸了import
语句。 以下是您如何正确执行此操作:
import pandas as pd
df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR'
'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1')
df[0].to_csv('ENR3.0.csv', index = False)
如果要获取变量df
存在的所有dataframes
,请将最后一行替换为:
for x in range(len(df)):
df[x].to_csv(f"CSV_File_{x+1}", index = False)
导入语句有问题
它应该是import pandas as pd
而不是import as pandas
,因为您在下面的代码中使用别名pd
。
学习美汤,用lxml解析器解析需要的数据(非常快)。
此链接可能对您有所帮助:
BeautifulSoup 不同的解析器
在您的代码中进行更正:
import pandas as pd df = pd.read_html('https://aim-sg.caas.gov.sg/aip/2020-10-13/final/2020-09-10-Non-AIR' 'AC/html/eAIP/ENR-3.1-en-GB.html?s=B2EE1C5E1D2A684224A194E69D18338A560504FC#ENR-3.1') df[0].to_csv('ENR3.0.csv')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.