下面的代码段循环遍历某些网页,获取html,然后查找table.results,并从每个中包含的标记中获取纯文本。 $ result还可以。

现在,我试图获取在每个标签的第二个标签中找到的标签的href值。 我想将其包含在$ results数组中,但是我不确定如何执行此操作。 第三个foreach语句获取了它们,但随后我需要将$ links与$ results合并。 理想情况下,我还将在第二个foreach语句中获得链接。

有人知道吗?

$i = 0;
    foreach( $urls as $u )
    {           
        $html = file_get_html($u);

        foreach($html->find('.results tbody tr') as $element)
        {
            $result[$i] = $this->extract($element->plaintext);
            $i++;                   
        }

        foreach($html->find('.results tbody tr a') as $element)
        {
            $links[$i] = $element->href;
            $i++;           
        }                            
    }

    print_r($result); 
    print_r($links); 

    die;

#1楼 票数:0 已采纳

$html = file_get_html($u);
foreach($html->find('.results tbody tr') as $element)
{
  $links = $element->find('a');
  foreach($links as $l) {
    $result[] = $l->href;
  }
  $result[] = $this->extract($element->plaintext);
}

  ask by stef translate from so

未解决问题?本站智能推荐:

1回复

带有数据属性的simple_html_dom解析问题

我一直在努力解决这个问题。 我正在尝试解析一个包含许多 div 标签的 html 文档,在这些 div 标签中是其他 div 标签,它们具有一些我需要解析的数据属性。 但是,我确实需要保留 div class="row" 的原始循环。 这不能改变。 我希望有人能够帮助我,我一直在努力解决这个问题。
2回复

simple_html_dom纯文本结果中没有空格

我有以下html: <div><p>Launched:</p> <p>2010</p><p>Categories:</p><p>Software</p><p>Descript
1回复

如何使用simple_html_dom或DomDocument跳过最后n行?

有没有一种方法可以通过simple_html_dom或dom文档始终跳过已分析表的最后n行? 我尝试使用固定的行号,但是由于源文件可以更改其行数,因此无法正常工作。 这是我解析表的标准代码。 您对我有任何想法或提示,如何始终跳过最后两行?
2回复

php,simple_html_dom.php,获取选择的选项

我有这样的html块: 我正在尝试使用simple_html_dom( http://simplehtmldom.sourceforge.net/ )提取选定的值“ Australia”。 到目前为止,我已经构建了一个函数,但是无法正常工作: //提取所选值 这样的QueryPat
2回复

simple_html_dom-读取html页面,两个数组

这是我的整个代码 此代码将在一个漂亮的列表中产生标题,并且还将产生一个漂亮的链接列表。 我的问题是我需要将它们合并,我希望$ header是href的文本,而href中的链接是$ linkk 像这样.. 我不知道该怎么做,因为我有两个foreach语句。 我试图将它们合并,但未
1回复

使用simple-html-dom-parser从$element返回单个项目[关闭]

这个问题不太可能对将来的访客有所帮助; 它仅与较小的地理区域,特定的时间段或极为狭窄的情况(通常不适用于Internet的全球受众)有关。 要获得使该问题更广泛适用的帮助 , 请访问帮助中
1回复

php简单html中的纯文本使用“a”和“img”标签解析dom

我有简单的富文本,例如: 在这种情况下,我是否有可能通过简单的html dom获得纯文本: 我的意思是除标签和img标签外,所有标签都将被删除
2回复

解析php中的html页面

今天,当我用Simple HTML DOM解析器解析一个页面时,我没有得到任何结果。 所以我想,这一定很奇怪。 所以我去看那里写的HTML代码。 我发现有很多错误。 所以这就是问题所在。 当解析器正常工作时,在状态下做什么,但HTML是一团糟。 也许有人会建议一些能够处理这种问题的