如何创建一个字典，其中包含文本中的单词作为键和“它出现的子列表”作为值？

Question

我的问题与其他人非常相似，但这里我的清单有点特别。

我必须用 Python 创建一个搜索引擎。 为此，我必须像标题中所说的那样创建一个字典。

让我给你上下文：

我基本上有一个由“[==========]”分隔的几个部分组成的文本。

喜欢：

  [blablabla][blabliblou]
  [==========]
  [blablablou][blibloubla]
  [=========]
  [oubabababa][baboulila]

我创建了一个组合这些列表的算法，直到我们“击中”一个“==========”并将它们放入一个列表中，其中 [blablabla blabliblou] 是 list[O], [blablablou][blibloubla]是列表 [1] 等...

算法：

  import re
  file = open("mytext.txt","r",encoding="utf-8")
  list = []
  dico = {}
  d = file.read()

  x = re.split(r"=+", d)
  for i in range(len(x)):
  liste.append(x[i])

我有一个输出，如：

  [ [blablabla blabliblou] [blablablou blibloubla] [oubabababa baboulila] ]

但是现在第二步是创建一个字典，该字典将文本中的所有单词作为键，并将包含它们的子列表作为值。

我尝试使用条件循环如下：

  import re
  file = open("mytext.txt","r",encoding="utf-8")
  list = []
  numd = 0
  dico = {}
  d = file.read()

  for x in file:
  x = re.split(r"=+", d)
     for i in range(len(x)):
     list.append(x[i])
     numd =+ 1
        for word in list:
           if word in dico:
               if numd not in dico[word]:
                  dico[word].append(numd)
           else:
              dico[word] = [numd]

预期的输出是：

    {blablabla:1, blablilou:1, blablablou:2, blibloubla:2, oubabababa:3,
baboulila:3}

但我的清单仍然是空的。

预先感谢您的回复！ 我会很感激

Answer 1

这个怎么样？

from collections import defaultdict
all_dict = defaultdict(list)
for index, val in enumerate(x):
    for value in val:
        if value not in all_dict:
            all_dict[value].append(index)

print(all_dict)

它将为您提供预期的输出：

defaultdict(list,
            {'blablabla': [0],
             'blabliblou': [0],
             'blablablou': [1],
             'blibloubla': [1],
             'oubabababa': [2],
             'baboulila': [2]})

Answer 2

from collections import defaultdict

l = [ ["blablabla", "blabliblou"], ["blablablou", "blibloubla"], ["oubabababa", "baboulila"] ]

d = defaultdict(list)
for i, line in enumerate(l):
    [d[word].append(i) for word in line]

print(dict(d))
>>> {'blablabla': [0], 'oubabababa': [2], 'blablablou': [1], 'blabliblou': [0], 'baboulila': [2], 'blibloubla': [1]}

Answer 3

这是我到目前为止的代码：

  import re 
  from collections import defaultdict 
  file = open("mytext.txt","r",encoding="utf-8") 
  l = [] 
  d = file.read() 

  x = re.split(r"=+", d) 
  for i in range(len(x)): 
     l.append(x[i]) 

  d = defaultdict(list) 
 for i, line in enumerate(l): 
    [d[word].append(i) for word in line]

它似乎有效，但键是字母，值是字母出现的子列表

如何创建一个字典，其中包含文本中的单词作为键和“它出现的子列表”作为值？

问题描述

3 个解决方案

解决方案1
0 2019-04-14 09:31:19

解决方案2
0 2019-04-14 09:42:51

解决方案3
0 2019-04-14 10:01:52

如何创建一个字典，其中包含文本中的单词作为键和“它出现的子列表”作为值？

问题描述

3 个解决方案

解决方案1 0 2019-04-14 09:31:19

解决方案2 0 2019-04-14 09:42:51

解决方案3 0 2019-04-14 10:01:52

解决方案1
0 2019-04-14 09:31:19

解决方案2
0 2019-04-14 09:42:51

解决方案3
0 2019-04-14 10:01:52