[英]Python: Extract different tables and merge them into a single CSV file
我想找到印度所有的冷藏庫及其容量。 該信息可在https://www.napanta.com/cold-storage/ 中獲得
每個州都有它的 URL(例如: https : //www.napanta.com/cold-storage/andhra-pradesh/ )……然后去每個州的 URL,我們看到它有很多區,每個區都有它的美聯社克里希納區的自己的 URL ( https://www.napanta.com/cold-storage/andhra-pradesh/krishna )
我的目標是創建一個單一的 CSV 文件,其中包含來自每個州所有地區的這些信息。 此 One Big CSV 文件中的其他列將是州和地區名稱。
有了這個州-區數據框后,我想將它附加到所有州和區的更大數據框。 最后將此大型主數據框導出為單個 CSV 文件。 最終結果應該是一個包含每個州每個區的所有數據的單個 CSV 文件。
我用 Beautiful Soup 嘗試了刮削部分,現在,我被卡住了。 請幫我寫代碼。
您應該首先獲得所有鏈接的列表。 可以用硒和美湯來完成。 然后你可以嘗試遍歷這些鏈接的列表並使用熊貓讀取表格:
import pandas as pd
li = []
for link in list_of_links:
dfi = pd.read_html(link)
li.append(dfi)
df = pd.concat(li)
df.to_csv("Your_File.csv")
獲得所有信息后,您可以將其加載到數據框並使用 Pandas 進行轉換,然后使用
DataFrame.to_csv('filename.csv')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.