使用Perl在HTTP响应中查找特定值

Question

我在Perl中有一个小脚本，HTTP POST请求

my $request =  $ua->post( $url, [ 'country' => 10, 'evalprice' => 0 ] );
my $response = $request->content;

现在我知道在响应中将有这部分，仅出现一次

:&nbsp;<b>9570&nbsp;USD

我只想取数字9570（或任何数字），不知道如何搜索

:&nbsp;<b>

然后在那之后和之前

&nbsp;USD

我想正则表达式会有所帮助，但我无法在这里弄清楚如何使用它们。

Answer 1

使用正则表达式，您走在正确的轨道上。 您只需要一个表达式，并且由于您的字符串很简单，因此甚至不需要一个非常复杂的表达式。

my $content =~ m/:&nbsp;<b>([.\d]+)&nbsp;USD/;
my $price = $1;

m//是匹配的运算符。 wil =~一起告诉Perl对变量$content做一个正则表达式。 我们有一个包含价格的捕获组（ () ），其内容将放入$1 。 [.\\d+]是一组字符。 该点只是一个点（你的价格可能有美分），以及\\d意味着所有的数字（ 0 - 9 ）。 +表示可能有很多这样的字符，但至少有一个。

在http://rubular.com上尝试一下
阅读有关perlre和perlretut中的正则表达式的更多信息
如果您想对网站进行更多操作，请查看WWW :: Mechanize

Answer 2

使用这样的代码（删除HTML实体是不错的选择，但是可选）：

use HTML::Entities;

my $content = ":&nbsp;<b>9570&nbsp;USD";
my $decoded = decode_entities($content); # replace &nbsp; to spaces
my ($price) = ($decoded =~ /<b>(\d+)\s*USD/);
print "price = $price\n";

Answer 3

解析HTML的最安全方法是在适当的CPAN模块的帮助下。 但是，一个简单的选择（如果响应很简单）可能是这样。

use strict;
use warnings;

my $str = ":&nbsp;<b>9570&nbsp;USD";

if( $str =~ m/:&nbsp;<b>(\d+)&nbsp;/ ) {
   print $1, "\n";
}

我使用了一个正则表达式，找到匹配项后该数字为$1 。

使用Perl在HTTP响应中查找特定值

问题描述

3 个解决方案

解决方案1
3 已采纳 2013-06-09 09:26:24

解决方案2
1 2013-06-09 09:26:13

解决方案3
1 2013-06-09 09:27:27

使用Perl在HTTP响应中查找特定值

问题描述

3 个解决方案

解决方案1 3 已采纳 2013-06-09 09:26:24

解决方案2 1 2013-06-09 09:26:13

解决方案3 1 2013-06-09 09:27:27

解决方案1
3 已采纳 2013-06-09 09:26:24

解决方案2
1 2013-06-09 09:26:13

解决方案3
1 2013-06-09 09:27:27