繁体   English   中英

使用python从文本文件返回唯一单词出现的总和

[英]Return sum of unique word occurrences from a text file using python

我正在尝试为课程更新我的旧脚本。 通常,如果列表中的任何项目出现在该行中,则此脚本只会记录“ 1”。 但是,现在我希望它计算和总结那些唯一单词在该行中出现的次数。 例如,使用以下列表:

ess = ['jim','bob','sally','tom']
.
.
.   
elif 'SCHOOL' in line:
    csvfile.write( str(line.count(',') + 1)+ ',')
    flag = 0
    for staff in ess:
      if staff in line:
        csvfile.write('1')
        flag = 1
        break
    if flag == 1:
      csvfile.write('\n')
    else:
      csvfile.write('0\n')

如果出现任何名称,而不是简单地记录“ 1”。 我希望它返回该行中出现多少个名称的总和。 例如,如果吉姆和莎莉都出现在该行中,则返回“ 2”

您可以简单地对字符串/句子运行多个计数。

或者您也可以split为“”(空格)分隔这句话,走了过来说返回的列表,并检查每个字等于你想要的话之一:

我会做这样的事情:

 sum = 0
 for line in lines:
     split_list = line.split(" ")
     for word in ess:
         if word in split_list :
             sum+=1

或替代:sum = 0表示行中的行:for ess中的单词:sum + = line.count(word)

有两种方法可以尝试此操作:

1)您不在乎一个名称出现在句子中的次数,只要该名称至少出现一次即可:

def names_in_sentence(sentence_str):
    return sum([1 for name in lis_names if name in sentence_str])

这是一种相当蟒蛇的方法。 我正在使用列表推导为输入句子中存在的每个名称创建一个1的列表。

2)您确实关心一个句子中一个名字出现了多少次。 例如,如果句子是“这是一个鲍勃,他是个鲍勃”,您将返回2:

def names_in_sentence(sentence_str):
    return sum([sentence.count(name) for name in lis_names])

在这种情况下,我使用列表推导来计算每个名称在句子中出现的次数,并对列表求和。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM