[英]Percent difference in log files
瀏覽日志文件時,我經常一次又一次遇到相同的錯誤消息。 當然,由於時間戳,用戶名,IP地址等原因,兩行永遠不會相同。
我正在尋找一種設置“差異百分比”的方法,並忽略任何說與已報告的錯誤消息90%相似的行。 另一個想法是也總是忽略時間戳差異。
程序:
*編輯:對不起,如果我第一次不清楚。 如果需要的話,我會很樂意解釋。
謝謝。
我不知道任何完整的即用型解決方案,但Text :: Levenshtein和類似算法可以幫助您弄清楚一個通用字符串與另一個通用字符串的相似之處。
另一個想法是使用時間戳緩存您的日志消息,因此您不會重復過去(例如一分鍾)中看到的消息。
my %msg_cache = ();
sub log_filter {
my $msg = shift;
if (defined($msg_cache{$msg}) && $msg_cache{$msg} < time-60) {
# we've logged this message in the last minute - skip
return;
}
$msg_cache{$msg} = time;
return 1;
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.