繁体   English   中英

Python-检查字符串中是否只有多个列表中的一个元素

[英]Python - Check if there's only one element of multiple lists in a string

以下代码使我可以检查ttext列表中是否只有一个元素。

from itertools import product, chain
from string import punctuation

list1 = ['abra', 'hello', 'cfre']
list2 = ['dacc', 'ex', 'you', 'fboaf']
list3 = ['ihhio', 'oih', 'oihoihoo']

l = [list1, list2, list3]

def test(l, tt):
    counts = {word.strip(punctuation):0 for word in tt.split()}
    for word in chain(*product(*l)):
        if word in counts:
            counts[word] += 1
        if sum(v > 1 for v in counts.values())  > 1:
            return False
    return True

Output:

In [16]: ttext = 'hello my name is brian'
In [17]: test(l,ttext)
Out[17]: True
In [18]: ttext = 'hello how are you?'
In [19]: test(l,ttext)
Out[19]: False

现在,如果我在列表的元素“我有”,“你是”和“他是”中有空格,我该怎么做?

您可以添加一个列表理解,它可以遍历并拆分所有单词:

def test(l, tt):
    counts = {word.strip(punctuation):0 for word in tt.split()}
    splitl = [[word for item in sublist for word in item.split(' ')] for sublist in l]
    for word in chain(*product(*splitl)):
        if word in counts:
            counts[word] += 1
        if sum(v > 1 for v in counts.values())  > 1:
            return False
    return True

您可以通过使用“ +”串联列表而不是使用列表列表来简化很多操作。 如果字符串中包含空格,则此代码也将显示单词。

import string

list1 = ['abra', 'hello', 'cfre']
list2 = ['dacc', 'ex', 'you', 'fboaf']
list3 = ['ihhio', 'oih', 'oihoihoo']

l = list1 + list2 + list3

def test(l, tt):
    count = 0
    for word in l:
        #set of all punctuation to exclude
        exclude = set(string.punctuation)
        #remove punctuation from word
        word = ''.join(ch for ch in word if ch not in exclude)
        if word in tt:
            count += 1
    if count > 1:
        return False
    else:
        return True

您可以考虑将集合用于这种处理。

这是一个快速实现:

from itertools import chain
from string import punctuation

list1 = ['abra', 'hello', 'cfre']
list2 = ['dacc', 'ex', 'you', 'fboaf']
list3 = ['ihhio', 'oih', 'oihoihoo']
l = list(chain(list1, list2, list3))

words = set(w.strip(punctuation) for word in l for w in word.split())  # 1

def test(words, text):
    text_words = set(word.strip(punctuation) for word in text.split())  # 2
    return len(words & text_words) == 1  # 3

几点评论:

  1. 意图上的双重for循环有效,您可以获得单词列表。 该集合确保每个单词都是唯一的。
  2. 在输入句子上有同样的事情
  3. 使用集合交集获取句子中所有也在搜索集中的单词。 然后使用该集合的长度来查看是否只有一个。

您可以通过迭代遍历所有列表输入。 就像是:

words=[]

for list in l:
    for word in list:
        string=word.split()
        words.append(string)

好吧,首先,让我们重写函数使其更加自然:

from itertools import chain

def only_one_of(lists, sentence):
  found = None
  for item in chain(*lists):
    if item in sentence:
      if found: return False
      else: found = item
  return True if found not is None else False

这已经在您的约束下起作用了,因为它只是在寻找某些字符串item作为sentence的子字符串。 是否包含空格都没有关系。 但这可能会导致意外结果。 想像:

list1 = ['abra', 'hello', 'cfre']
list2 = ['dacc', 'ex', 'you', 'fboaf']
list3 = ['ihhio', 'oih', 'oihoihoo']

l = [list1, list2, list3]

only_one_of(l, 'Cadabra')

这将返回True因为abraCadabra的子字符串。 如果这是您想要的,那么您就完成了。 但是,如果没有,则需要重新定义item in sentence真正含义。 因此,让我们重新定义我们的功能:

def only_one_of(lists, sentence, is_in=lambda i, c: i in c):
  found = None
  for item in chain(*lists):
    if is_in(item, sentence):
      if found: return False
      else: found = item
  return True if found not is None else False

现在,最后一个参数都期望成为功能被应用到两个字符串返回True ,如果第一个是在第二或发现的False ,在其他地方。

通常,您需要检查项目是否作为单词在句子中(但单词可以在中间包含空格),因此让我们使用正则表达式来做到这一点:

import re
def inside(string, sentence):
  return re.search(r'\b%s\b' % string, sentence)

stringsentence但将string视为单词时,此函数返回True (正则表达式中的特殊序列\\b表示单词boundary )。

因此,以下代码应克服您的约束:

import re
from itertools import chain

def inside(string, sentence):
  return re.search(r'\b%s\b' % string, sentence)

def only_one_of(lists, sentence, is_in=lambda i, c: i in c):
  found = None
  for item in chain(*lists):
    if is_in(item, sentence):
      if found: return False
      else: found = item
  return True if found not is None else False

list1 = ['abra', 'hello', 'cfre']
list2 = ['dacc', 'ex', 'you', 'fboaf']
list3 = ['ihhio', 'oih', 'oihoihoo']
list4 = ['I have', 'you are', 'he is']

l = [list1, list2, list3, list4]

only_one_of(l, 'hello my name is brian', inside) # True
only_one_of(l, 'hello how are you?', inside) # False
only_one_of(l, 'Cadabra', inside) # False
only_one_of(l, 'I have a sister', inside) # True
only_one_of(l, 'he is my ex-boyfriend', inside) # False, ex and boyfriend are two words
only_one_of(l, 'he is my exboyfriend', inside) # True, exboyfriend is only one word

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM