繁体   English   中英

email 和电话网站提取器与 python 和 scrapy

[英]email and phone website extractor with python and scrapy

我有数千个网站的列表,如果可用,我想提取电话号码和电子邮件。 可能使用 python + scrapy。 我找到了这个https://levelup.gitconnected.com/scraping-websites-for-phone-numbers-and-emails-with-python-5557fcfa1596但看起来 package 不再可用。 有什么建议么? 谢谢!

这是一个广泛的问题,所以我不能在这里完全回答。

基本上,您需要遵循以下步骤:

  • 首先,使用 BS4 或 Scrapy 废弃网站 HTML。
  • 然后使用一些正则表达式来查找电子邮件、电话号码

另请查看这篇文章: https://www.geeksforgeeks.org/email-id-extractor-project-from-sites-in-scrapy-python/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM