簡體   English   中英

如何使用Perl提取HTML表數據?

[英]How can I extract HTML table data using Perl?

我需要從網頁中檢索一些數據。 在分析了頁面的HTML代碼之后,我發現我需要的數據嵌入到具有唯一表id的表中。 我不知道它是否是一個HTML規則,無論如何它對解析我認為非常好。

表格中的數據排列如下(省略了各種屬性和標簽,以便為您提供清晰的“數據結構”)

<table .... id = "tablename" .... >
    <tr>
         <td .... >filed1</td>
             ....
         <td .... >filedn</td>
    </tr>
         #several "trs" here
    <tr>
         <td .... >filed1</td>
             ....
         <td .... >filedn</td>
    </tr>
</table>

所以我的問題是如何在這種情況下使用Perl的HTML解析器實用程序來滿足我的需求。

提前致謝。

HTML :: TableExtract聽起來與您正在尋找的完全一樣。

使用HTML :: Table

Perl期刊中查看Ken MacFarlane 使用HTML :: Parser解析HTML 我不確定這是否是你所指的解析器,但看起來它可以做你想要的,或者至少指出你正確的方向。

你可以嘗試這樣的事情:

my $html = '<html code....';

$html =~ s/^.*(<table id="tablename">.*<\/table>).*/$1/s;

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM