如何使用Perl的WWW :: Mechanize从超时中恢复？

Question

我正在使用WWW :: Mechanize来读取每隔几秒运行一次的循环中的特定网页。 偶尔，'GET'超时并且脚本停止运行。 如何从一个这样的超时恢复，以便它继续循环并在下一次尝试'GET'？

Answer 1

使用eval ：

eval {
    my $resp = $mech->get($url);
    $resp->is_success or die $resp->status_line;
    # your code
};

if ($@) {
    print "Recovered from a GET error\n";    
}

在获取页面时， eval块将捕获任何错误。

Answer 2

一种选择是实现一种方法来处理超时错误，并在构造时将其作为onerror处理程序挂钩到mech对象中。 请参阅文档中的构造函数和启动。

您甚至可以通过设置空错误处理程序来忽略错误，例如：

my $mech = WWW::Mechanize->new( onerror => undef );

但我不建议 - 你以后会遇到奇怪的问题。

Answer 3

此解决方案将继续尝试加载页面，直到它工作。

do {
    eval {
        $mech->get($url);
    };
} while ($@ ne '');

Answer 4

要获得更完整的解决方案，您可以使用Try :: Tiny :: Retry等模块。 它允许您指定要运行的代码块，捕获任何错误，然后重试该代码阻塞可配置的时间量。 语法很干净。

use WWW::Mechanize();
use Try::Tiny::Retry ':all';

my $mech = WWW::Mechanize->new();
retry {
    $mech->get("https://stackoverflow.com/");
}
on_retry {
    warn("Failed. Retrying. Error was: $_");
}
delay {
    # max of 100 tries, sleeping 5 seconds between each failure
    return if $_[0] >= 100;
    sleep(11 * 1000 * 1000);
}; #don't forget this semicolon

# dump all the links found on the page
print join "\n", map {$_->text } $mech->links;

如何使用Perl的WWW :: Mechanize从超时中恢复？

问题描述

4 个解决方案

解决方案1
3 已采纳 2010-09-22 06:02:56

解决方案2
1 2010-09-22 05:42:34

解决方案3
0 2013-12-12 18:18:18

解决方案4
0 2018-10-11 19:22:27

如何使用Perl的WWW :: Mechanize从超时中恢复？

问题描述

4 个解决方案

解决方案1 3 已采纳 2010-09-22 06:02:56

解决方案2 1 2010-09-22 05:42:34

解决方案3 0 2013-12-12 18:18:18

解决方案4 0 2018-10-11 19:22:27

解决方案1
3 已采纳 2010-09-22 06:02:56

解决方案2
1 2010-09-22 05:42:34

解决方案3
0 2013-12-12 18:18:18

解决方案4
0 2018-10-11 19:22:27