繁体   English   中英

simple_html_dom纯文本结果中没有空格

[英]simple_html_dom plaintext result has no spaces

我有以下html:

<div><p>Launched:</p> <p>2010</p><p>Categories:</p><p>Software</p><p>Description:</p><p>Established</p><p>Website:</p></div>

如果我加载它并使用纯文本仅获取文本:

$str = '<div><p>Launched:</p><p>2010</p><p>Categories:</p><p>Software</p><p>Description:</p><p>Established</p><p>Website:</p></div>'; $html = str_get_html($str); echo $html->plaintext;

结果是不同的p标签之间没有空格:

发布时间:2010年类别:软件描述:已建立网站:

如果在结束和开始p标签之间添加空格,则可以正确输出。

这是正确的行为吗?

有没有办法让解析器在纯文本输出中考虑p标签?

标签p之间必须有空格,否则您可以这样做:

$result = "";
foreach($html->find('p') as $val){
    $result .= $val->plaintext." " ;
}

您可以通过这种方式剥离标签

    $content = file_get_contents($url);
    $rawContent = strip_tags($content);
    $html = str_get_html($content);

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM