[英]Return sum of unique word occurrences from a text file using python
我正在尝试为课程更新我的旧脚本。 通常,如果列表中的任何项目出现在该行中,则此脚本只会记录“ 1”。 但是,现在我希望它计算和总结那些唯一单词在该行中出现的次数。 例如,使用以下列表:
ess = ['jim','bob','sally','tom']
.
.
.
elif 'SCHOOL' in line:
csvfile.write( str(line.count(',') + 1)+ ',')
flag = 0
for staff in ess:
if staff in line:
csvfile.write('1')
flag = 1
break
if flag == 1:
csvfile.write('\n')
else:
csvfile.write('0\n')
如果出现任何名称,而不是简单地记录“ 1”。 我希望它返回该行中出现多少个名称的总和。 例如,如果吉姆和莎莉都出现在该行中,则返回“ 2”
您可以简单地对字符串/句子运行多个计数。
或者您也可以split
为“”(空格)分隔这句话,走了过来说返回的列表,并检查每个字等于你想要的话之一:
我会做这样的事情:
sum = 0
for line in lines:
split_list = line.split(" ")
for word in ess:
if word in split_list :
sum+=1
或替代:sum = 0表示行中的行:for ess中的单词:sum + = line.count(word)
有两种方法可以尝试此操作:
1)您不在乎一个名称出现在句子中的次数,只要该名称至少出现一次即可:
def names_in_sentence(sentence_str):
return sum([1 for name in lis_names if name in sentence_str])
这是一种相当蟒蛇的方法。 我正在使用列表推导为输入句子中存在的每个名称创建一个1的列表。
2)您确实关心一个句子中一个名字出现了多少次。 例如,如果句子是“这是一个鲍勃,他是个鲍勃”,您将返回2:
def names_in_sentence(sentence_str):
return sum([sentence.count(name) for name in lis_names])
在这种情况下,我使用列表推导来计算每个名称在句子中出现的次数,并对列表求和。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.