Python字典映射不能按预期工作

Question

所以我有这个包含以下内容的文本文件。

<lang:Foreign> <lang:foreign>
</lang:Foreign> </lang:foreign>
<lang: Foreign> <lang:foreign>
</lang: Foreign> </lang:foreign>

我的程序所做的是将行中的第一个文本映射到第二个文本。 所以它在字典中看起来像这样。

{<lang:Foreign> : <lang:foreign>}

flist = [line.split() for line in f]
for k, v in flist:
    fdict.update({k: v})

我的映射代码在上面。 但问题是最后两行条目

<lang: Foreign> <lang:foreign>
</lang: Foreign> </lang:foreign>

第一个条目之间有空格，我的代码拆分了lang：和Foreign。 但我想指定第一个条目包含空格。 我尝试过以下操作

<lang:\sForeign> <lang:foreign>
</lang:\sForeign> </lang:foreign>

知道我怎么能告诉我的程序接受这个空间并正确映射它？ 谢谢！

Answer 1

只需使用不同的split参数。 这应该适合你：

line.split(' <')

Answer 2

我建议使用正则表达式。 使用以下模式匹配将为您提供每行包含在“<>”中的匹配模式列表。

    import re

    pattern = re.compile(r'<.*?>')
    flist = pattern.findall(line) # sample output of flist = ['<lang:Foreign>', '<lang:foreign>']
    if len(flist) == 2:
        fdict.update({flist[0]: flist[1]})

Answer 3

我建议您拆分“> <”，然后将“>”和“<”添加回数组的第一个和第二个元素。 像这样......

arr = line.split('> <')
arr[0] = arr[0] + '>'
arr[1] = '<' + arr[1]

Answer 4

使用正则表达式可能在这里最有意义。

import re

pattern = re.compile(r'(<.*?>)\s*(<.*?>)')

flist = [pattern.findall(line) for line in f]
for k, v in flist:
    fdict.update({k: v})

Python字典映射不能按预期工作

问题描述

4 个解决方案

解决方案1
0 2019-05-17 18:02:14

解决方案2
0 2019-05-17 18:03:09

解决方案3
0 2019-05-17 18:05:29

解决方案4
0 2019-05-17 18:06:25

Python字典映射不能按预期工作

问题描述

4 个解决方案

解决方案1 0 2019-05-17 18:02:14

解决方案2 0 2019-05-17 18:03:09

解决方案3 0 2019-05-17 18:05:29

解决方案4 0 2019-05-17 18:06:25

解决方案1
0 2019-05-17 18:02:14

解决方案2
0 2019-05-17 18:03:09

解决方案3
0 2019-05-17 18:05:29

解决方案4
0 2019-05-17 18:06:25