[英]How can I programmatically scrape an image from another website?
几年前,我帮助某人整理了一个网页(仅限本地个人使用,不向世界提供),该网页汇集了他最喜欢的几个网站上的户外网络摄像头照片。 这可以节省一次查看多个网站的时间。 当这些网站上的图片有固定的网址时,我们很容易。 当URL可预测地改变时(例如,当URL具有日期时),我们能够编写一些JavaScript代码。 但现在他想添加一个图像,其文件名似乎随机变化,我不知道如何处理。 基本上,我想:
<img>
标记将该网址插入我的网页。 我意识到这可能是一个令人困惑和不寻常的问题。 我愿意尽可能地帮助澄清。 我只是不确定如何询问这家伙想做什么。
更新: David Dorward提到使用JavaScript执行此操作违反了同源策略 。 我愿意接受有关解决此问题的其他方法的建议。
它可能是一个严重侵犯版权的行为。
图片最像是在页面中包含容器 - 只需定期访问该页面并解析img标记。 确保您评论的随机位不仅仅是一个随机参数,以强制浏览器获取新图像而不是检索缓存版本。
for each url do <img src=url />
如果你在你的项目中使用php,你可以使用CURL库获取另一个网站内容,并使用正则表达式解析它从源代码获取图像URL。
你的个人资料中有一个Python问题,所以我只想说如果我试图这样做,我会选择Python和Beautiful Soup 。 具有能够处理无效HTML的附加优势。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.