從外部網頁獲取數據

Question

通過php從外部網站獲取內容的最佳方法是什么？

使用php如何訪問網頁（例如： http : //store.domain.com/1/ ）並掃描HTML編碼以查找介於兩者之間的數據（即字母C和E）。 我使用什么php方法？

<span id="ctl00_ContentPlaceHolder1_phstats1_pname">C</span>
<span id="ctl00_ContentPlaceHolder1_phstats2_pname">E</span>

然后將“ C”（找到的字符串）保存到$ pname

$_session['pname1'] = $pname1;
$_session['pname2'] = $pname2;

Answer 1

您需要使用網頁抓取技術。 只需使用HTML DOM Library或使用Node.js和jQuery類的技術即可完成。 您可以在這里和這里找到一些有用的教程。

您可能還會看到有關使用PHP實施抓取的線程

Answer 2

最有效的方法是：

$content = file_get_contents('http://www.domain.com/whatever.html');

$pos = str_pos($content,'id="c');
$on=0;
while($pos!==false)
 {
 $content = substr($content,$pos+4);
 $pos = str_pos($content,'"');
 $list[$on] = substr($content,0,$pos);
 $on++;
 $pos = str_pos($content,'id="c');
 }

然后，您所有的值都將在$ list數組中，其計數為$ on。

您也可以使用preg函數之一來完成它，但是我喜歡老式的方法，它的速度要快十億分之一秒。

Answer 3

我認為您實際上可以使用file_get_contents("http://store.domain.com/1/"); 進行http請求。

就解析而言，根據您的項目規模和您願意付出的努力，您可以在此處找到一個html DOM解析器，例如http://simplehtmldom.sourceforge.net/或僅搜索id="ctl00_ContentPlaceHolder1_phstats1_pname" ，並將其id="ctl00_ContentPlaceHolder1_phstats1_pname" （不是推薦的處理方式）。

Answer 4

可以通過CURL完成。 但是，您可以僅在項目中包括簡單HTML DOM解析器。 它非常易於使用，將滿足您的目的。

文檔在這里。 http://simplehtmldom.sourceforge.net/

從外部網頁獲取數據

問題描述

4 個解決方案

解決方案1
4 2011-11-04 04:43:37

解決方案2
3 已采納 2011-11-04 04:52:54

解決方案3
0 2011-11-04 04:36:38

解決方案4
0 2011-11-04 04:55:12

從外部網頁獲取數據

問題描述

4 個解決方案

解決方案1 4 2011-11-04 04:43:37

解決方案2 3 已采納 2011-11-04 04:52:54

解決方案3 0 2011-11-04 04:36:38

解決方案4 0 2011-11-04 04:55:12

解決方案1
4 2011-11-04 04:43:37

解決方案2
3 已采納 2011-11-04 04:52:54

解決方案3
0 2011-11-04 04:36:38

解決方案4
0 2011-11-04 04:55:12