簡體   English   中英

Python:提取不同的表並將它們合並到一個 CSV 文件中

[英]Python: Extract different tables and merge them into a single CSV file

我想找到印度所有的冷藏庫及其容量。 該信息可在https://www.napanta.com/cold-storage/ 中獲得

每個州都有它的 URL(例如: https : //www.napanta.com/cold-storage/andhra-pradesh/ )……然后去每個州的 URL,我們看到它有很多區,每個區都有它的美聯社克里希納區的自己的 URL ( https://www.napanta.com/cold-storage/andhra-pradesh/krishna )

我的目標是創建一個單一的 CSV 文件,其中包含來自每個州所有地區的這些信息。 此 One Big CSV 文件中的其他列將是州和地區名稱。

有了這個州-區數據框后,我想將它附加到所有州和區的更大數據框。 最后將此大型主數據框導出為單個 CSV 文件。 最終結果應該是一個包含每個州每個區的所有數據的單個 CSV 文件。

我用 Beautiful Soup 嘗試了刮削部分,現在,我被卡住了。 請幫我寫代碼。

您應該首先獲得所有鏈接的列表。 可以用硒和美湯來完成。 然后你可以嘗試遍歷這些鏈接的列表並使用熊貓讀取表格:

import pandas as pd
li = []
for link in list_of_links:
    dfi = pd.read_html(link)
    li.append(dfi)
df = pd.concat(li)
df.to_csv("Your_File.csv")

獲得所有信息后,您可以將其加載到數據框並使用 Pandas 進行轉換,然后使用

DataFrame.to_csv('filename.csv')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM