![](/img/trans.png)
[英]How to pass a replacing regex with a backreference as a command line argument to a Perl script
[英]How to pass a replacing regex as a command line argument to a perl script
我正在尝试编写一个简单的perl脚本来将一个给定的正则表达式应用于文件名等,并且我无法将正则表达式作为参数传递给脚本。
我希望能做的是这样的事情:
> myscript 's/hi/bye/i' hi.h
bye.h
>
我已经制作了这段代码
#!/utils/bin/perl -w
use strict;
use warnings;
my $n_args = $#ARGV + 1;
my $regex = $ARGV[0];
for(my $i=1; $i<$n_args; $i++) {
my $file = $ARGV[$i];
$file =~ $regex;
print "OUTPUT: $file\n";
}
我不能使用qr,因为显然它不能用于替换正则表达式(虽然我的来源是一个论坛帖子所以我很高兴被证明是错误的)。
我宁愿避免将这两个部分作为单独的字符串传递并在perl脚本中手动执行正则表达式。
是否可以将正则表达式作为这样的参数传递,如果是这样,最好的方法是什么?
我想,有不止一种方法可以做到这一点。
Ev 一世 方式:
由于您基本上发送了一个正则表达式,因此可以对其进行求值以获得结果。 像这样:
my @args = ('s/hi/bye/', 'hi.h');
my ($regex, @filenames) = @args;
for my $file (@filenames) {
eval("\$file =~ $regex");
print "OUTPUT: $file\n";
}
当然,按照这种方式将打开你一些非常讨厌的惊喜。 例如,考虑传递这组参数:
...
my @args = ('s/hi/bye/; print qq{MINE IS AN EVIL LAUGH!\n}', 'hi.h');
...
是的,它会嘲笑你最ev 一种 意利。
安全方式:
my ($regex_expr, @filenames) = @args;
my ($substr, $replace) = $regex_expr =~ m#^s/((?:[^/]|\\/)+)/((?:[^/]|\\/)+)/#;
for my $file (@filenames) {
$file =~ s/$substr/$replace/;
print "OUTPUT: $file\n";
}
如您所见,我们将给出的表达式解析为两部分,然后使用这些部分构建一个完整的运算符。 显然,这种方法不够灵活,但当然,它更安全。
最简单的方法:
my ($search, $replace, @filenames) = @args;
for my $file (@filenames) {
$file =~ s/$search/$replace/;
print "OUTPUT: $file\n";
}
是的,没错 - 根本没有正则表达式解析! 这里发生的是我们决定采用两个参数 - “搜索模式”和“替换字符串” - 而不是单个参数。 它会使我们的脚本不像前一个那么灵活吗? 不,因为我们仍然需要或多或少地定期解析正则表达式。 但是现在用户清楚地理解了给命令的所有数据,这通常是一个很大的改进。 )
两个示例中的@args对应于@ARGV数组。
s/a/b/i
是一个运算符,而不仅仅是一个正则表达式,所以如果你想要正确解释它,你需要使用eval
。
#!/usr/bin/env perl
use warnings;
use strict;
my $regex = shift;
my $sub = eval "sub { \$_[0] =~ $regex; }";
foreach my $file (@ARGV) {
&$sub($file);
print "OUTPUT: $file\n";
}
这里的技巧是我将这个“代码位”代入字符串以生成定义匿名子程序$_[0] =~ s/a/b/i;
Perl代码$_[0] =~ s/a/b/i;
(或者你传递它的任何代码),然后使用eval
编译该代码并给我一个我可以在循环内调用的代码引用。
$ test.pl 's/foo/bar/' foo nicefood
OUTPUT: bar
OUTPUT: nicebard
$ test.pl 'tr/o/e/' foo nicefood
OUTPUT: fee
OUTPUT: nicefeed
这比放置eval "\\$file =~ $regex;"
更有效eval "\\$file =~ $regex;"
在循环内部,它将在每次迭代时进行编译和评估,而不是仅在前面进行一次。
关于eval
的警告 - 正如raina77ow的回答所解释的那样,除非你100%确定你总是从可信赖的来源获得你的意见,否则你应该避免eval
...
s/a/b/i
不是正则表达式。 这是一个正则表达式加替换。 除非你使用字符串eval ,否则这项工作可能非常困难(考虑s{a}<b>e
等等)。
麻烦的是,当你真正需要传递的是参数时,你试图传递一个perl运算符:
myscript hi bye hi.h
在脚本中:
my ($find, $replace, @files) = @ARGV;
...
$file =~ s/$find/$replace/i;
你的代码有点笨重。 这就是你所需要的:
use strict;
use warnings;
my ($find, $replace, @files) = @ARGV;
for my $file (@files) {
$file =~ s/$find/$replace/i;
print "$file\n";
}
请注意,这种方式允许您在正则表达式中使用元字符,例如\\w{2}foo?
。 这既是好事,也是坏事。 要使所有字符按字面顺序排列(禁用元字符),您可以像这样使用\\Q ... \\E
:
... s/\Q$find\E/$replace/i;
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.