[英]Stanford pos tagger not displaying the output elements in Python (MAC)
[英]How to use stanford English Tagger in python Mac OS
我成功運行了斯坦福英語標記器,如下所示:輸入:“圖片清晰”輸出:
[[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]
但是我想讀取整個文件,並希望輸出如下所示:
這_DT圖片_NN是_VBZ清除_JJ
就像一個句子。 不是方括號中的格式。 但是我不知道如何在python中更改它。
我的原始密碼
import nltk
from nltk.tag.stanford import POSTagger
st = POSTagger('/Users/apple/Desktop/package/stanford-postagger/models/english-left3words-distsim.tagger', '/Users/apple/Desktop/package/stanford-postagger/stanford-postagger.jar')
print st.tag('This picture is clear'.split())
相當簡單的列表/元組/字符串操作:
inp = [[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]
out = []
for t in inp[0]:
out += t
outs = "_".join(out)
print outs
您擁有的數據是元組列表的列表。 我們只對第一個元素感興趣-因此對inp[0]
感興趣。
我們遍歷此列表(我本可以使用列表理解)來提取元組的元素( t
),創建另一個列表( out
)。 然后,將元素與下划線join
在一起以生成字符串是一項簡單的任務。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.