繁体   English   中英

从另一个域获取HTML

[英]Get HTML from another domain

我想每隔30秒获取一次特定链接,然后在程序中解析它的代码。 有没有办法做到这一点?

我需要获取在代码中发现的某些东西,这些东西总是以固定的间隔变化。

我试过使用一个iframe并获取它的innerHTML,但是它也不起作用,php的file_get_contents()也不起作用。

你可以尝试使用这个吗? http://davidwalsh.name/download-urls-content-php-curl

编码

 /* gets the data from a URL */
function get_data($url)
{
  $ch = curl_init();
  $timeout = 5;
  curl_setopt($ch,CURLOPT_URL,$url);
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
  $data = curl_exec($ch);
  curl_close($ch);
  return $data;
}

然后致电

$returned_content = get_data('http://davidwalsh.name');

(提供给DAVID WALSH)

我尝试过使用iframe并获取它的innerHTML,但这不起作用

那会碰到相同的原产地政策

也php的file_get_contents()不起作用

如果数据在HTML本身中,则应该这样做(除非在安装PHP时已禁用该功能)。

您尝试从中进行抓取的网站可能已采取步骤来阻止滥用的抓取工具。

(并且访问第三方网站并每30秒抓取其HTML听起来很是侮辱)。

file_get_content无效,因为您的服务器已将其禁用(可能出于安全原因)。 您可以启用它,也可以使用cURL。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM