使用PHP Simple HTML DOM Parser查找表格单元格并获取下一个兄弟的内容

Question

我正在尝试使用PHP Simple HTML DOM Parser来获取外部文件的HTML。 该文件包含一个表，目标是找到具有特定数据内容的能力单元格，然后获取下一个兄弟单元格的数据。 这些数据需要放在PHP变量中。

基于如何使用PHP解析和处理HTML / XML等文章中的研究和信息？ ，抓取 A元素的href属性，刮擦数据：PHP简单的HTML DOM解析器，当然还有PHP Simple HTML DOM Parser Manual我已经能够产生一些结果，但我担心我可能走错了路。

表格行如下所示：

<tr>
<td>fluff</td>  
<td>irrelevant</td> 
<td>etc</td>   
<td><a href="one">Hello world</a></td>                        
<td>123.456</td> 
<td>fluff</td>          
<td>irrelevant</td>   
<td>etc</td>
</tr>

我想要完成的是找到包含“Hello world”的表格单元格，然后从下一个td单元格中获取数字。 下面的代码找到了表格单元格并回显了它的内容，但我尝试将它用作地标以获取下一个单元格的数据失败了......

$html = file_get_html("http://site.com/stuff.htm");
$e = $html->find('td',0)->innertext = 'Hello world';
echo $e;

所以最终，在上面的例子中，123.456的值需要以某种方式进入PHP变量。

谢谢你的帮助！

Answer 1

可以使用DOMXPath类完成。 您不需要外部库。

这是一个例子：

<?php

$html = <<<EOF
<tr>
<td>fluff</td>  
<td>irrelevant</td> 
<td>etc</td>   
<td><a href="one">Hello world</a></td>                        
<td>123.456</td> 
<td>fluff</td>          
<td>irrelevant</td>   
<td>etc</td>
</tr>
EOF;


// create empty document 
$document = new DOMDocument();

// load html
$document->loadHTML($html);

// create xpath selector
$selector = new DOMXPath($document);

// selects the parent node of <a> nodes
// which's content is 'Hello world'
$results = $selector->query('//td/a[text()="Hello world"]/..');

// output the results 
foreach($results as $node) {
    echo $node->nodeValue . PHP_EOL;
}

Answer 2

使用简单的html dom解析器：

$str = "<table><tr>
<td>fluff</td>  
<td>irrelevant</td> 
<td>etc</td>   
<td><a href=\"one\">Hello world</a></td>                        
<td>123.456</td> 
<td>fluff</td>          
<td>irrelevant</td>   
<td>etc</td>
</tr></table>";

$html = str_get_html($str);

 $tds = $html->find('table',0)->find('td');
 $num = null;
 foreach($tds as $td){

     if($td->plaintext == 'Hello world'){

        $next_td = $td->next_sibling();
        $num = $next_td->plaintext ;    
        break; 
     }
 }

 echo($num);

使用PHP Simple HTML DOM Parser查找表格单元格并获取下一个兄弟的内容

问题描述

2 个解决方案

解决方案1
4 已采纳 2013-04-02 18:23:08

解决方案2
2 2013-04-02 18:37:09

使用PHP Simple HTML DOM Parser查找表格单元格并获取下一个兄弟的内容

问题描述

2 个解决方案

解决方案1 4 已采纳 2013-04-02 18:23:08

解决方案2 2 2013-04-02 18:37:09

解决方案1
4 已采纳 2013-04-02 18:23:08

解决方案2
2 2013-04-02 18:37:09