Linux Shell脚本，用于计算文件中的相似单词

Question

正在使用以下格式的日志文件：

201208290101
201208290101
201208290101
201208290101
201208290101
201208291222
201208291222
201208291222
201208291222
201209300242
201209300242
201209300242

我想计算在某个特定时间发生的事件数，因此我必须计算日志文件中某个特定时间戳发生了多少次。 例如，上面的输出将类似于：

201208290101  = 5
201208291222  = 4
201209300242  = 3

关于如何计算这个有什么建议吗？

Answer 1

只需通过uniq -c文件即可。

$ uniq -c
201208290101
201208290101
201208290101
201208290101
201208290101
201208291222
201208291222
201208291222
201208291222
201209300242
201209300242
201209300242
^D
      5 201208290101
      4 201208291222
      3 201209300242

Answer 2

您可以awk关联数组：

 awk '{a[$0]++;} END{for(i in a) print i," = ", a[i]}' filename

Answer 3

如果一切都整理好了

cat yourfile.txt | uniq -c

否则，您需要先对其进行排序，然后才能使用uniq：

cat yourfile.txt | sort | uniq -c

Linux Shell脚本，用于计算文件中的相似单词

问题描述

3 个解决方案

解决方案1
4 已采纳 2012-10-03 04:17:41

解决方案2
1 2012-10-03 04:22:01

解决方案3
1 2012-10-03 04:26:29

Linux Shell脚本，用于计算文件中的相似单词

问题描述

3 个解决方案

解决方案1 4 已采纳 2012-10-03 04:17:41

解决方案2 1 2012-10-03 04:22:01

解决方案3 1 2012-10-03 04:26:29

解决方案1
4 已采纳 2012-10-03 04:17:41

解决方案2
1 2012-10-03 04:22:01

解决方案3
1 2012-10-03 04:26:29