Bash - 计算一行出现的频率

Question

文件 A 是我必须搜索的文件。 文件 B 是文件，其中包含我需要在文件 A 中搜索的内容。

文件 A 是很多代码，类似这样：

test test 
a = rr
b = gg
test test
c = a + b
test

这些变量有时只声明而不使用，我将所有需要的变量过滤到文件 B 中：

a
b

我想计算每个变量（文件 B 中的每个变量都有自己的行，并且是一个字符串）在文件 B 中出现的频率。

我会在Excel中使用count if来实现这一点，但我不知道如何在 Bash 中做一些类似的事情。

我尝试使用grep -wc File_B File_A但这对我不起作用，我猜是因为这个尝试在 File_A 中找到完整的 File_B，但这不起作用。

任何帮助将不胜感激。

亲切的问候

埃利亚斯

Answer 1

命令grep -wc File_B File_A实际上在文件File_A中搜索单词File_B 。

您可能想要的是grep -wcf File_B File_A - -f的意思是“不要搜索模式File_B ，而是读取要从File_B搜索的模式。

问题是，它将计算在 File_A 中找到的来自File_B的所有匹配File_A并为您求和，所以如果File_B第一行上的模式被找到 8 次，并且File_B第二行上的模式被找到 4时间， grep -wcf只会打印 12。如果您想要一个输出列出每个模式被找到的次数，您需要编写一个循环，从File_B和grep中分别读取每一行。

也许是这样的：

while read pat; do echo -n "$pat: "; grep -wc "$pat" File_A; done < File_B

Bash - 计算一行出现的频率

问题描述

1 个解决方案

解决方案1
2 2022-07-08 06:21:42

Bash - 计算一行出现的频率

问题描述

1 个解决方案

解决方案1 2 2022-07-08 06:21:42

解决方案1
2 2022-07-08 06:21:42