如何在Python文件中計算單詞“ test”？

Question

我有一個包含許多字符串的文件。 看起來像

sdfsdf sdfsdfsdf sdfsdfsdf測試gggg uff測試測試fffffffff sdgsdgsdgsdg sdgsdgsdgsdg uuuttt 555555555 ddfdfdfg dddd4444 66677565 sdfsdfdgg5556

如何計算所有單詞“測試”。 我嘗試過，但是只有這個結果

f = open("file")
words =  0
for s in f:
    i = s.find('test')
    if i > -1:
        words += 1
print(words)
f.close()

並且此腳本僅計算包含單詞“ test”的字符串。 如何計算單詞？

Answer 1

如果要查找所有匹配項：

with open("file") as f:
    numtest = f.read().count("test")

如果只想查找單詞匹配項：

with open("file") as f:
    numtest = f.read().split().count("test")

Answer 2

單線：

s.split().count('test')

Answer 3

這應該工作。

   from collections import Counter
   with open('myfile.txt', 'r') as f:
       words = f.read().split()
       counts = Counter(words)

   print counts["test"] #counts just of exact string "test"
   #find all strings containing test (e.g 'atest', 'mytest')
   print sum([val for key,val in counts.iteritems() if "test" in key])

Answer 4

您可以使用正則表達式：

import re

with open('myfile.txt', 'r') as f:
    txt = f.read()

cnt = len(re.findall(r'\btest\b', txt))

如果您不關心區分大小寫（也可以匹配Test或TEST ）

cnt = len(re.findall(r'\btest\b', txt, flags=re.I))

Answer 5

它將在整個文件中計算test的數量：

f = open('my_file.txt', 'r')
num_tests = len([word for word in f.read().split() if word == 'test'])
f.close()

請注意，它不會匹配tester, tested, testing, etc....單詞。如果您也想匹配它們，請改用：

f = open('my_file.txt', 'r')
num_tests = len([word for word in f.read().split() if 'test' in word])
f.close()

如何在Python文件中計算單詞“ test”？

問題描述

5 個解決方案

解決方案1
1 2016-02-24 19:01:08

解決方案2
1 2016-02-24 19:03:04

解決方案3
0 2016-02-24 19:00:42

解決方案4
0 2016-02-24 19:02:34

解決方案5
0 2016-02-24 19:04:06

如何在Python文件中計算單詞“ test”？

問題描述

5 個解決方案

解決方案1 1 2016-02-24 19:01:08

解決方案2 1 2016-02-24 19:03:04

解決方案3 0 2016-02-24 19:00:42

解決方案4 0 2016-02-24 19:02:34

解決方案5 0 2016-02-24 19:04:06

解決方案1
1 2016-02-24 19:01:08

解決方案2
1 2016-02-24 19:03:04

解決方案3
0 2016-02-24 19:00:42

解決方案4
0 2016-02-24 19:02:34

解決方案5
0 2016-02-24 19:04:06