[英]grep multi column, in order or awk better?
Linux Debian测试64。
我希望grep或awk以下内容...
ExifListAll =(下面)
DSCF3566.JPG 2014-07-21 12:54:32 On 1
DSCF3566.RAF 2014-07-21 12:54:32 On 1
DSCF3567.JPG 2014-07-21 12:54:33 On 2
DSCF3567.RAF 2014-07-21 12:54:33 On 2
DSCF3568.JPG 2014-07-21 12:54:33 On 3
DSCF3568.RAF 2014-07-21 12:54:33 On 3
DSCF3569.JPG 2014-07-21 12:54:34 Off 0
我将使用第3列时间12:54:33开始,搜索1秒钟之前和之后的1秒钟,第4列=“打开”,第5列= 1、2或3
到目前为止,我已经尝试过了;
echo "$ExifListAll" | grep -E '2014-07-21.*12:45:3[3-4].*On.*[1-3]'
我可以更有效地使用awk 1衬板吗?
我这样做正确吗?
echo "$ExifListAll" | awk '$4 == "On" && $5~/1/,$5~/3/'
谢谢。
grep
可以正常工作。 您只是在语法上遇到了挑战。 首先,更容易使用模式\\s*
来匹配字段之间的零个或多个空格。 您正在使用.*
(因为正则表达式很贪婪),它将使每个字符都匹配到该行的末尾。 同样,字符类是指其中包含的字符。 即匹配1、2或3,请使用[123]
。 通过这些更改,以下内容可以实现您的意图:
echo "$ExifListAll" | grep -E "2014-07-21\s*12:54:3[34]\s*On\s*[123]"
输出:
$ cat grepdat.dat | grep -E "2014-07-21\s*12:54:3[34]\s*On\s*[123]"
DSCF3567.JPG 2014-07-21 12:54:33 On 2
DSCF3567.RAF 2014-07-21 12:54:33 On 2
DSCF3568.JPG 2014-07-21 12:54:33 On 3
DSCF3568.RAF 2014-07-21 12:54:33 On 3
这不是您期望的输出吗? 12:54:34的Off
和0
,我从您的问题中解释为不想要。 如果您希望状态为On/Off regardless, and included the
对应于12:54:34关0的0`,请使用:
echo "$ExifListAll" | grep -E "2014-07-21\s*12:54:3[34]\s*(On|Off)\s*[0123]"
输出:
$ cat grepdat.dat | grep -E "2014-07-21\s*12:54:3[34]\s*(On|Off)\s*[0123]"
DSCF3567.JPG 2014-07-21 12:54:33 On 2
DSCF3567.RAF 2014-07-21 12:54:33 On 2
DSCF3568.JPG 2014-07-21 12:54:33 On 3
DSCF3568.RAF 2014-07-21 12:54:33 On 3
DSCF3569.JPG 2014-07-21 12:54:34 Off 0
每个注释都需要1-6行:
cat grepdat.dat | grep -E "2014-07-21\s*12:54:3[234]\s*On\s*[123]"
产量
$ cat grepdat.dat | grep -E "2014-07-21\s*12:54:3[234]\s*On\s*[123]"
DSCF3566.JPG 2014-07-21 12:54:32 On 1
DSCF3566.RAF 2014-07-21 12:54:32 On 1
DSCF3567.JPG 2014-07-21 12:54:33 On 2
DSCF3567.RAF 2014-07-21 12:54:33 On 2
DSCF3568.JPG 2014-07-21 12:54:33 On 3
DSCF3568.RAF 2014-07-21 12:54:33 On 3
您不能使用范围或标志来检索多个与/ end /块匹配的行。 对于使用awk的更通用的解决方案,您可以将时间转换为纪元时间,然后进行比较:
mydatetime="2014-07-21 12:54:33"
awk -v expected_time=$(date -d"$mydatetime" +%s) '
{ t = $2" "$3; gsub(/[:-]/," ",t); t1 = mktime(t) }
t1 >= expected_time-1 && t1 <= expected_time+1 && $4 =="On" && $5 ~ /^[123]$/
' file.txt
注意:
如果您确切地知道了您所提到的Expected_time,那么只使用grep行,它比awk行更简单,更快。
grep -E '2014-07-21.*12:54:3[2-4].*On.*[1-3]' file.txt
谢谢大家的建议。
我已经使用了另一种更直接的方法,即'exiftool',它从图像中读取所有元数据。
我选择了目录中的任何图像,然后给出前一秒和下一秒。 我不确定如何替换所提供的信息,但是我会在您的帮助下进行整理。
DateTimeOrigFirst="$(exiftool -T -d '%F %T' -DateTimeOriginal DSCF3567.RAF)"
DateTimeOrig1SecMinus="$(exiftool -T -globalTimeShift "-0:0:0 0:0:1" -d '%F %T' -DateTimeOriginal DSCF3567.RAF)"
DateTimeOrig1SecPlus="$(exiftool -T -globalTimeShift "+0:0:0 0:0:1" -d '%F %T' -DateTimeOriginal DSCF3567.RAF)"
然后,我可以在第一个示例中使用1-6生成图像1-6;
printf %s\\n "$ExifListAll" | tr '\t' ' ' | grep \
-E "$DateTimeOrigFirst|$DateTimeOrig1SecMinus|$DateTimeOrig1SecPlus"
再次感谢。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.