繁体   English   中英

如何使用Perl提取HTML表数据?

[英]How can I extract HTML table data using Perl?

我需要从网页中检索一些数据。 在分析了页面的HTML代码之后,我发现我需要的数据嵌入到具有唯一表id的表中。 我不知道它是否是一个HTML规则,无论如何它对解析我认为非常好。

表格中的数据排列如下(省略了各种属性和标签,以便为您提供清晰的“数据结构”)

<table .... id = "tablename" .... >
    <tr>
         <td .... >filed1</td>
             ....
         <td .... >filedn</td>
    </tr>
         #several "trs" here
    <tr>
         <td .... >filed1</td>
             ....
         <td .... >filedn</td>
    </tr>
</table>

所以我的问题是如何在这种情况下使用Perl的HTML解析器实用程序来满足我的需求。

提前致谢。

HTML :: TableExtract听起来与您正在寻找的完全一样。

使用HTML :: Table

Perl期刊中查看Ken MacFarlane 使用HTML :: Parser解析HTML 我不确定这是否是你所指的解析器,但看起来它可以做你想要的,或者至少指出你正确的方向。

你可以尝试这样的事情:

my $html = '<html code....';

$html =~ s/^.*(<table id="tablename">.*<\/table>).*/$1/s;

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM