[英]How to use Stanford Parser to get POS tags using java?
我正在從事抄襲檢測項目。 我需要使用Stanford Parser API為存儲在文本文件中的句子中的單詞獲取詞性(POS)標記。
我知道可以將edu.Stanford.nlp.parser.lexparser.LexicalizedParser
類用於此目的。 但是我無法使其正常工作。
誰能告訴我如何用Java編寫可利用此類或API中提供的其他類來獲取POS標簽的代碼?
非常感謝你
查看分發中包含的啟動文件ParserDemo.java
和ParserDemo2.java
。 它們顯示了在代碼中調用解析器的簡單示例。 特別是,在ParserDemo2.java
請參見parse.taggedYield()
調用,該調用返回一個TaggedWord
List
,您可以從中請求每個項目的tag()
。
但是,如果您只想使用詞性標記器,您會發現僅使用詞性標記器(例如Stanford詞性Tagger)會更快,內存占用更少。
可以在以下位置找到Javadoc: http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html
: http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html
。 請注意,程序包名稱( edu.stanford.nlp.parser.lexparser
)區分大小寫,並且您已編寫Stanford
。 這將意味着您收到“ ClassNotFoundException”。
您不提供任何其他信息或錯誤消息,因此很難提供進一步的幫助。 您需要編譯和運行Java軟件包的幫助嗎? 如果是這樣,請先解決該問題,再處理NLP。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.