繁体   English   中英

如何在python Mac OS中使用斯坦福英语Tagger

[英]How to use stanford English Tagger in python Mac OS

我成功运行了斯坦福英语标记器,如下所示:输入:“图片清晰”输出:

[[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]

但是我想读取整个文件,并希望输出如下所示:

这_DT图片_NN是_VBZ清除_JJ

就像一个句子。 不是方括号中的格式。 但是我不知道如何在python中更改它。

我的原始密码

import nltk
from nltk.tag.stanford import POSTagger
st = POSTagger('/Users/apple/Desktop/package/stanford-postagger/models/english-left3words-distsim.tagger', '/Users/apple/Desktop/package/stanford-postagger/stanford-postagger.jar')

print st.tag('This picture is clear'.split())

相当简单的列表/元组/字符串操作:

inp = [[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]

out = []
for t in inp[0]:
    out += t

outs = "_".join(out)
print outs

您拥有的数据是元组列表的列表。 我们只对第一个元素感兴趣-因此对inp[0]感兴趣。

我们遍历此列表(我本可以使用列表理解)来提取元组的元素( t ),创建另一个列表( out )。 然后,将元素与下划线join在一起以生成字符串是一项简单的任务。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM