![](/img/trans.png)
[英]How can i extract value of each fields of each table of multiple tables of html file using perl
[英]How can I extract HTML table data using Perl?
我需要從網頁中檢索一些數據。 在分析了頁面的HTML代碼之后,我發現我需要的數據嵌入到具有唯一表id的表中。 我不知道它是否是一個HTML規則,無論如何它對解析我認為非常好。
表格中的數據排列如下(省略了各種屬性和標簽,以便為您提供清晰的“數據結構”)
<table .... id = "tablename" .... >
<tr>
<td .... >filed1</td>
....
<td .... >filedn</td>
</tr>
#several "trs" here
<tr>
<td .... >filed1</td>
....
<td .... >filedn</td>
</tr>
</table>
所以我的問題是如何在這種情況下使用Perl的HTML解析器實用程序來滿足我的需求。
提前致謝。
HTML :: TableExtract聽起來與您正在尋找的完全一樣。
使用HTML :: Table 。
在Perl期刊中查看Ken MacFarlane 使用HTML :: Parser解析HTML 。 我不確定這是否是你所指的解析器,但看起來它可以做你想要的,或者至少指出你正確的方向。
你可以嘗試這樣的事情:
my $html = '<html code....';
$html =~ s/^.*(<table id="tablename">.*<\/table>).*/$1/s;
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.