从外部网页获取数据

Question

通过php从外部网站获取内容的最佳方法是什么？

使用php如何访问网页（例如： http : //store.domain.com/1/ ）并扫描HTML编码以查找介于两者之间的数据（即字母C和E）。 我使用什么php方法？

<span id="ctl00_ContentPlaceHolder1_phstats1_pname">C</span>
<span id="ctl00_ContentPlaceHolder1_phstats2_pname">E</span>

然后将“ C”（找到的字符串）保存到$ pname

$_session['pname1'] = $pname1;
$_session['pname2'] = $pname2;

Answer 1

您需要使用网页抓取技术。 只需使用HTML DOM Library或使用Node.js和jQuery类的技术即可完成。 您可以在这里和这里找到一些有用的教程。

您可能还会看到有关使用PHP实施抓取的线程

Answer 2

最有效的方法是：

$content = file_get_contents('http://www.domain.com/whatever.html');

$pos = str_pos($content,'id="c');
$on=0;
while($pos!==false)
 {
 $content = substr($content,$pos+4);
 $pos = str_pos($content,'"');
 $list[$on] = substr($content,0,$pos);
 $on++;
 $pos = str_pos($content,'id="c');
 }

然后，您所有的值都将在$ list数组中，其计数为$ on。

您也可以使用preg函数之一来完成它，但是我喜欢老式的方法，它的速度要快十亿分之一秒。

Answer 3

我认为您实际上可以使用file_get_contents("http://store.domain.com/1/"); 进行http请求。

就解析而言，根据您的项目规模和您愿意付出的努力，您可以在此处找到一个html DOM解析器，例如http://simplehtmldom.sourceforge.net/或仅搜索id="ctl00_ContentPlaceHolder1_phstats1_pname" ，并将其id="ctl00_ContentPlaceHolder1_phstats1_pname" （不是推荐的处理方式）。

Answer 4

可以通过CURL完成。 但是，您可以仅在项目中包括简单HTML DOM解析器。 它非常易于使用，将满足您的目的。

文档在这里。 http://simplehtmldom.sourceforge.net/

从外部网页获取数据

问题描述

4 个解决方案

解决方案1
4 2011-11-04 04:43:37

解决方案2
3 已采纳 2011-11-04 04:52:54

解决方案3
0 2011-11-04 04:36:38

解决方案4
0 2011-11-04 04:55:12

从外部网页获取数据

问题描述

4 个解决方案

解决方案1 4 2011-11-04 04:43:37

解决方案2 3 已采纳 2011-11-04 04:52:54

解决方案3 0 2011-11-04 04:36:38

解决方案4 0 2011-11-04 04:55:12

解决方案1
4 2011-11-04 04:43:37

解决方案2
3 已采纳 2011-11-04 04:52:54

解决方案3
0 2011-11-04 04:36:38

解决方案4
0 2011-11-04 04:55:12