簡體   English   中英

如何在python Mac OS中使用斯坦福英語Tagger

[英]How to use stanford English Tagger in python Mac OS

我成功運行了斯坦福英語標記器,如下所示:輸入:“圖片清晰”輸出:

[[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]

但是我想讀取整個文件,並希望輸出如下所示:

這_DT圖片_NN是_VBZ清除_JJ

就像一個句子。 不是方括號中的格式。 但是我不知道如何在python中更改它。

我的原始密碼

import nltk
from nltk.tag.stanford import POSTagger
st = POSTagger('/Users/apple/Desktop/package/stanford-postagger/models/english-left3words-distsim.tagger', '/Users/apple/Desktop/package/stanford-postagger/stanford-postagger.jar')

print st.tag('This picture is clear'.split())

相當簡單的列表/元組/字符串操作:

inp = [[(u'This', u'DT'), (u'picture', u'NN'), (u'is', u'VBZ'), (u'clear', u'JJ')]]

out = []
for t in inp[0]:
    out += t

outs = "_".join(out)
print outs

您擁有的數據是元組列表的列表。 我們只對第一個元素感興趣-因此對inp[0]感興趣。

我們遍歷此列表(我本可以使用列表理解)來提取元組的元素( t ),創建另一個列表( out )。 然后,將元素與下划線join在一起以生成字符串是一項簡單的任務。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM