两个不同的结构化python列表之间的匹配

Question

我使用python 2.7，我有2个列表，其中一个具有以下形状：

t1 = [('go', 'VB'), [('like', 'IN'), [('i', 'PR')]], [('to', 'TO')], [('there', 'RB')]]

另一个是以这种格式存储的文本文件：

t2 = [go:VB, [like:IN, [i:PR]], [to:TO], [there:RB]]

我想看看（t1）是否匹配（t2）。

我面临的一个问题是文本文件中的内容没有（''），因此它们看起来像变量。

您能帮忙找到匹配这两者的方法吗？

def match(t1, t2):
    #check here if the nested lists match or not.   
    return True

我试图将（t1）转换为字符串并删除'（'和'）'，方法是将其替换为空的''，然后将'，'替换为'：'，但是它给出了很多引号，但我认为这不是解决此问题的好主意。

Answer 1

这个答案没有使用eval() ，这确实是不安全的。

使用str将t1转换为字符串。
借助replace删除t1和t1所有空格
使用re的sub转换t2 。
最后，比较字符串

### 1
t1 = str(t1)

### 2
t1 = t1.replace(" ", "")
t2 = t2.replace(" ", "")

### 3
t2 = re.sub(r"(\w+):(\w+)", r"('\1','\2')", t2)

### 4
print(t1 == t2)

编辑

如果要支持制表符和换行符，则需要执行此操作

### 2
t1 = "".join(t1.split())
t2 = "".join(t2.split())

Answer 2

天真的和简单的方法-使用regex substitution将字符串从文件转换为Python可评估形式，然后对其进行恶意eval ：

import re

s2 = '[go:VB, [like:IN, [i:PR]], [to:TO], [there:RB]]'

# 'go:VB' -> '("go", "VB")'
s2_pyth = re.sub(r'(\w+):(\w+)', r'("\1", "\2")', s2)
# '[("go", "VB"), [("like", "IN"), [("i", "PR")]], [("to", "TO")], [("there", "RB")]]'

l2 = eval(s2_pyth)
# [('go', 'VB'), [('like', 'IN'), [('i', 'PR')]], [('to', 'TO')], [('there', 'RB')]]

if l1 == l2:
    # or whatever more specific comparison

我认为，在这种情况下使用eval （似乎是无害的NLP学术任务）是可以的。 如果文本文件中的标记不是严格的字母数字形式，则可能需要更智能的正则表达式作为r'\\w+'来匹配它们，也许是这样。 就像r'[^\\[\\]]+' ...

Answer 3

假设您的结构仅由包含两个字符串的列表和元组组成，则以下函数应通过递归生成目标字符串来实现您的期望：

def format_list(l):
  res = "["
  items = []
  for item in l:
    if isinstance(item,list):
      items.append(format_list(item))
    elif isinstance(item,tuple):
      items.append(item[0] + ':' + item[1])
  res += ", ".join(items) + "]"
  return res

两个不同的结构化python列表之间的匹配

问题描述

3 个解决方案

解决方案1
2 2016-05-16 12:42:38

解决方案2
1 2016-05-16 11:32:47

解决方案3
1 已采纳 2016-05-16 12:28:39

两个不同的结构化python列表之间的匹配

问题描述

3 个解决方案

解决方案1 2 2016-05-16 12:42:38

解决方案2 1 2016-05-16 11:32:47

解决方案3 1 已采纳 2016-05-16 12:28:39

解决方案1
2 2016-05-16 12:42:38

解决方案2
1 2016-05-16 11:32:47

解决方案3
1 已采纳 2016-05-16 12:28:39