[英]Stanford pos tagger not displaying the output elements in Python (MAC)
[英]How to use stanford English Tagger in python Mac OS
我成功运行了斯坦福英语标记器,如下所示:输入:“图片清晰”输出:
[[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]
但是我想读取整个文件,并希望输出如下所示:
这_DT图片_NN是_VBZ清除_JJ
就像一个句子。 不是方括号中的格式。 但是我不知道如何在python中更改它。
我的原始密码
import nltk
from nltk.tag.stanford import POSTagger
st = POSTagger('/Users/apple/Desktop/package/stanford-postagger/models/english-left3words-distsim.tagger', '/Users/apple/Desktop/package/stanford-postagger/stanford-postagger.jar')
print st.tag('This picture is clear'.split())
相当简单的列表/元组/字符串操作:
inp = [[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]
out = []
for t in inp[0]:
out += t
outs = "_".join(out)
print outs
您拥有的数据是元组列表的列表。 我们只对第一个元素感兴趣-因此对inp[0]
感兴趣。
我们遍历此列表(我本可以使用列表理解)来提取元组的元素( t
),创建另一个列表( out
)。 然后,将元素与下划线join
在一起以生成字符串是一项简单的任务。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.