在perl中使用正则表达式提取子字符串

Question

我有一个简单的问题（我认为）从 Perl 的档案中提取信息。 这个档案大约有 200 000 行，有些行有这种格式

WO      GB111MTD1                    dddD-51   TIME 141202 0105  PAGE  1

我想输入一个变量GB111MTD1 ，我知道“WO”这个词总是排在第一位。

我尝试过的是以下内容：

open(archive, "C:/Users/g/Desktop/c/alarms.log") or die "blah\n";

while(< archive>){
        if($_ =~ /^WO\s+(.*)/){
            print "Found: $1\n";
            last;
        }
}

这打印了我所有的行，但我只想要“GB111MTD1”。

---下一个意图

while(< archive>){
        if($_ =~ /^WO\s+(.*)\S/){
            print "Found: $1\n";
            last;
        }
}

我想在这里说“如果该行以 WO 开头并且有一些空格，请匹配我接下来的内容，直到找到其他空格”

在这里，唯一的区别是 WO GB111MTD1 dddD-51 TIME 141202 0105 PAGE 1 的“1”没有显示，但仍然不是我想要的

我希望你明白我的问题。

Answer 1

您可以将\\S用于非空白字符：

use warnings;
use strict;

while (<DATA>) {
    if (/^WO\s+(\S+)/) {
        print "Found: $1\n";
        last;
    }
}

__DATA__
WO GB111MTD1 dddD-51 TIME 141202 0105 PAGE 1

印刷：

Found: GB111MTD1

Answer 2

我会在以 WO 开头的行上使用 split。

 use warnings;
 use strict;

 while (<DATA>) {
     if (/^WO\s/) {
         my @fields = split(/\s+/);
         my $myvar = $fields[1];
         # do stuff with $myvar
         say "Frobnicating order # $myvar";
     }
 }

 __DATA__
 WO GB111MTD1 dddD-51 TIME 141202 0105 PAGE 1

在perl中使用正则表达式提取子字符串

问题描述

2 个解决方案

解决方案1
4 2014-12-11 16:07:47

解决方案2
1 2014-12-11 16:32:52

在perl中使用正则表达式提取子字符串

问题描述

2 个解决方案

解决方案1 4 2014-12-11 16:07:47

解决方案2 1 2014-12-11 16:32:52

解决方案1
4 2014-12-11 16:07:47

解决方案2
1 2014-12-11 16:32:52