繁体   English   中英

Python 3.4-从pastebin.com下载新上传的文本文件

[英]Python 3.4 - Downloading newly uploaded text files from pastebin.com

我想从pastebin.com下载文本文件。 启动程序后,它应查找要上传的文本文件,并在上传后“下载”它们。 我知道如何“下载”它们,但不知道如何告诉Python单击http://pastebin.com/archive上的一个公共文件,然后单击“原始”按钮以打开一个包含“原始”内容。

我在Google上搜索了很多,但实际上没有任何帮助。

谢谢

嗯,程序不知道如何“点击”任何东西:)。 为了从页面检索信息,您只需要在正确的URL上发送GET请求即可。 在您的情况下,这可能是http://pastebin.com/raw/4ffLHviP或您要下载的pastebin的任何其他代码。 您可以手动检索代码,也可以例如在存档页面上应用文本解析器(正则表达式,beautifulsoup ...)。

请注意,有一个用于抓取Pastebin的API(请参阅http://pastebin.com/scraping )。 如果要从中提取后续内容,则强烈建议使用它。 它更“礼貌”,可以提供更好的服务,并且可以避免您被列入黑名单。

要选择文件,只需执行以下操作:

  1. 访问文件的链接,例如。 http://pastebin.com/B8A6L7Zt
  2. 原始内容已经在该页面上,即<textarea id='paste_code'>...</textarea> 因此,您只需使用正则表达式就可以切断此内容。 在此处输入图片说明

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM