請幫助我定義一個perl正則表達式

Question

我是新手。 請幫忙。 我正在努力爬行

<div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div>

在網頁中。 我想抓住/ v / name / idlike123123ksajdfk部分。 （知道

<div class="name"><a href="/v/

部分是固定的）所以我寫了正則表達式（可以讓你發笑）：

~m#<div class="name"><a href="(/v/.*?)">#

如果您更正我的愚蠢代碼，這將非常有幫助。

Answer 1

使用功能強大的HTML解析器（有關原因，請參見http://htmlparsing.com/ ）：

use strictures;
use Web::Query qw();
my $w = Web::Query->new_from_html(<<'HTML');
<div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div>
<div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div>
<div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div>
<div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div>
<div class="name"><a href="/v/name/idlike123123ksajdfk">name</a></div>
HTML

my @v_links = $w->find('div.name > a[href^="/v/"]')->attr('href');

Answer 2

有很多Perl模塊可以從HTML中提取鏈接。 WWW :: Mechanize ， Mojo :: DOM ， HTML :: LinkExtor和HTML :: SimpleLinkExtor都可以做到這一點。

Answer 3

使用Mojolicious進行Web抓取可能是當今在Perl中最簡單的方法

http://mojolicio.us/perldoc/Mojolicious/Guides/Cookbook#Web_scraping

Answer 4

您不應該使用regex來解析HTML ，因為有很多庫可以進行此類解析。

達西姆的答案就是一個很好的例子。

但是，如果仍然要使用正則表達式，並且將文本分配給$_ ，則

my @list = m{<div class="name"><a href="(/v/.*?)">}g;

將為您提供所有發現的列表。

請幫助我定義一個perl正則表達式

問題描述

4 個解決方案

解決方案1
6 已采納 2012-05-18 11:47:07

解決方案2
1 2012-05-18 19:27:17

解決方案3
1 2012-06-12 19:09:03

解決方案4
0 2012-05-18 11:47:40

請幫助我定義一個perl正則表達式

問題描述

4 個解決方案

解決方案1 6 已采納 2012-05-18 11:47:07

解決方案2 1 2012-05-18 19:27:17

解決方案3 1 2012-06-12 19:09:03

解決方案4 0 2012-05-18 11:47:40

解決方案1
6 已采納 2012-05-18 11:47:07

解決方案2
1 2012-05-18 19:27:17

解決方案3
1 2012-06-12 19:09:03

解決方案4
0 2012-05-18 11:47:40