如何使用Perl提取HTML表數據？

Question

我需要從網頁中檢索一些數據。 在分析了頁面的HTML代碼之后，我發現我需要的數據嵌入到具有唯一表id的表中。 我不知道它是否是一個HTML規則，無論如何它對解析我認為非常好。

表格中的數據排列如下（省略了各種屬性和標簽，以便為您提供清晰的“數據結構”）

<table .... id = "tablename" .... >
    <tr>
         <td .... >filed1</td>
             ....
         <td .... >filedn</td>
    </tr>
         #several "trs" here
    <tr>
         <td .... >filed1</td>
             ....
         <td .... >filedn</td>
    </tr>
</table>

所以我的問題是如何在這種情況下使用Perl的HTML解析器實用程序來滿足我的需求。

提前致謝。

Answer 1

HTML :: TableExtract聽起來與您正在尋找的完全一樣。

Answer 2

使用HTML :: Table 。

Answer 3

在Perl期刊中查看Ken MacFarlane 使用HTML :: Parser解析HTML 。 我不確定這是否是你所指的解析器，但看起來它可以做你想要的，或者至少指出你正確的方向。

Answer 4

你可以嘗試這樣的事情：

my $html = '<html code....';

$html =~ s/^.*(<table id="tablename">.*<\/table>).*/$1/s;

如何使用Perl提取HTML表數據？

問題描述

4 個解決方案

解決方案1
12 已采納 2009-12-21 07:33:19

解決方案2
2 2009-12-21 11:30:16

解決方案3
-1 2009-12-21 05:55:00

解決方案4
-4 2009-12-21 06:32:39

如何使用Perl提取HTML表數據？

問題描述

4 個解決方案

解決方案1 12 已采納 2009-12-21 07:33:19

解決方案2 2 2009-12-21 11:30:16

解決方案3 -1 2009-12-21 05:55:00

解決方案4 -4 2009-12-21 06:32:39

解決方案1
12 已采納 2009-12-21 07:33:19

解決方案2
2 2009-12-21 11:30:16

解決方案3
-1 2009-12-21 05:55:00

解決方案4
-4 2009-12-21 06:32:39