如何在字符串中獲取正則表達式的所有匹配項？

Question

如何使用curl獲取任何html標簽的內容？ 在以下腳本中獲取例如h1內容：

#!/usr/bin/perl  

use strict;  
use warnings;  

my $page = `curl www.yahoo.com`;  
print "Page: \n";  
sleep(5);  
#print "$page \n";  
if ($page =~ m/<h1\s*>(.*)<\/h1\s*>/ig){  
        print "$1 \n";  
}

我只有一場比賽。 如何獲得所有比賽？

Answer 1

您可以像這樣獲得所有匹配項：

my @matches = $page =~ /<h1\b[^>]*>(.*?)<\/h1>/ig;

print "@matches\n";

Answer 2

用正則表達式解析HTML是一種罪過。 幸運的是，周圍有很多解析器。 我特別喜歡Mojo套件：

use strict; use warnings;
use feature 'say';
use Mojo;

my $ua  = Mojo::UserAgent->new(max_redirects => 5);  # redirects defaults to zero
for my $h3 ($ua->get('www.stackoverflow.com')->res->dom('h3')->each) { # use CSS selectors
  say $h3->all_text;
}

CPAN上的Mojo
Mojolicious主頁

Answer 3

使用while循環代替if ：

while ($page =~ m/<h1\s*>(.*)<\/h1\s*>/ig) {  
    print "$1 \n";  
}

如何在字符串中獲取正則表達式的所有匹配項？

問題描述

3 個解決方案

解決方案1
2 2013-08-18 18:38:47

解決方案2
2 2013-08-18 20:00:40

解決方案3
1 2013-08-18 18:44:57

如何在字符串中獲取正則表達式的所有匹配項？

問題描述

3 個解決方案

解決方案1 2 2013-08-18 18:38:47

解決方案2 2 2013-08-18 20:00:40

解決方案3 1 2013-08-18 18:44:57

解決方案1
2 2013-08-18 18:38:47

解決方案2
2 2013-08-18 20:00:40

解決方案3
1 2013-08-18 18:44:57