如何使用Perl的WWW :: Mechanize從超時中恢復？

Question

我正在使用WWW :: Mechanize來讀取每隔幾秒運行一次的循環中的特定網頁。 偶爾，'GET'超時並且腳本停止運行。 如何從一個這樣的超時恢復，以便它繼續循環並在下一次嘗試'GET'？

Answer 1

使用eval ：

eval {
    my $resp = $mech->get($url);
    $resp->is_success or die $resp->status_line;
    # your code
};

if ($@) {
    print "Recovered from a GET error\n";    
}

在獲取頁面時， eval塊將捕獲任何錯誤。

Answer 2

一種選擇是實現一種方法來處理超時錯誤，並在構造時將其作為onerror處理程序掛鈎到mech對象中。 請參閱文檔中的構造函數和啟動。

您甚至可以通過設置空錯誤處理程序來忽略錯誤，例如：

my $mech = WWW::Mechanize->new( onerror => undef );

但我不建議 - 你以后會遇到奇怪的問題。

Answer 3

此解決方案將繼續嘗試加載頁面，直到它工作。

do {
    eval {
        $mech->get($url);
    };
} while ($@ ne '');

Answer 4

要獲得更完整的解決方案，您可以使用Try :: Tiny :: Retry等模塊。 它允許您指定要運行的代碼塊，捕獲任何錯誤，然后重試該代碼阻塞可配置的時間量。 語法很干凈。

use WWW::Mechanize();
use Try::Tiny::Retry ':all';

my $mech = WWW::Mechanize->new();
retry {
    $mech->get("https://stackoverflow.com/");
}
on_retry {
    warn("Failed. Retrying. Error was: $_");
}
delay {
    # max of 100 tries, sleeping 5 seconds between each failure
    return if $_[0] >= 100;
    sleep(11 * 1000 * 1000);
}; #don't forget this semicolon

# dump all the links found on the page
print join "\n", map {$_->text } $mech->links;

如何使用Perl的WWW :: Mechanize從超時中恢復？

問題描述

4 個解決方案

解決方案1
3 已采納 2010-09-22 06:02:56

解決方案2
1 2010-09-22 05:42:34

解決方案3
0 2013-12-12 18:18:18

解決方案4
0 2018-10-11 19:22:27

如何使用Perl的WWW :: Mechanize從超時中恢復？

問題描述

4 個解決方案

解決方案1 3 已采納 2010-09-22 06:02:56

解決方案2 1 2010-09-22 05:42:34

解決方案3 0 2013-12-12 18:18:18

解決方案4 0 2018-10-11 19:22:27

解決方案1
3 已采納 2010-09-22 06:02:56

解決方案2
1 2010-09-22 05:42:34

解決方案3
0 2013-12-12 18:18:18

解決方案4
0 2018-10-11 19:22:27