繁体   English   中英

如何使用Pandas将python Web抓取数据导出到现有excel文件中的特定工作表?

[英]How can I export my python web scrape data to a specific sheet in an existing excel file using pandas?

我有一个包含多个工作表的Excel文件。 我想使用pandas将来自Python的新数据添加到同一Excel文件中的新表中。 在不影响我以前的数据的情况下可以这样做吗? 我是新来的...谢谢您的帮助!

这是到目前为止我正在使用的Python代码:

from urllib.request import urlopen
from lxml import html
import cssselect

response = urlopen("https://www.xyz.com.shtml")
content = response.read()
tree = html.fromstring(content)

for div in tree.cssselect('.first_name'):
for a in div.cssselect('table:nth-child(2) a'):
    print(a.text)

我在网上找到了这个……我在当前情况下如何使用它有点困惑:

import pandas as pd

df = pd.DataFrame({'Data': [10, 20, 30, 20, 15, 30, 45]})

writer = pd.ExcelWriter('pandas_simple.xlsx', engine='xlsxwriter')

df.to_excel(writer, sheet_name='Sheet1')

writer.save()

似乎您想抓取网站并在类中获取表格元素。 我建议您改用BeautifulSoup。

脚步

  1. 在课堂上抢你的桌子
  2. 将您的数据附加到字典中
  3. 转换为数据框
  4. 将数据框导出到excel

     from lxml import html from bs4 import BeautifulSoup import requests import pandas req = requests.get('https://www.xyz.com.shtml') soup = BeautifulSoup(req.text, "lxml") content = soup.find("table:nth-child(2) a", {"class": "first_name"}) mydict = dict() for c in content: #from c append data in mydict # example: mydict['Data'].append(c.text) df = pd.DataFrame(mydict) writer = pd.ExcelWriter('pandas_simple.xlsx') df.to_excel(writer,'Sheet1') writer.save() 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM