簡體   English   中英

如何使用Stanford Parser使用Java獲取POS標簽?

[英]How to use Stanford Parser to get POS tags using java?

我正在從事抄襲檢測項目。 我需要使用Stanford Parser API為存儲在文本文件中的句子中的單詞獲取詞性(POS)標記。

我知道可以將edu.Stanford.nlp.parser.lexparser.LexicalizedParser類用於此目的。 但是我無法使其正常工作。

誰能告訴我如何用Java編寫可利用此類或API中提供的其他類來獲取POS標簽的代碼?

非常感謝你

查看分發中包含的啟動文件ParserDemo.javaParserDemo2.java 它們顯示了在代碼中調用解析器的簡單示例。 特別是,在ParserDemo2.java請參見parse.taggedYield()調用,該調用返回一個TaggedWord List ,您可以從中請求每個項目的tag()

但是,如果您只想使用詞性標記器,您會發現僅使用詞性標記器(例如Stanford詞性Tagger)會更快,內存占用更少。

可以在以下位置找到Javadoc: http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html : http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html 請注意,程序包名稱( edu.stanford.nlp.parser.lexparser )區分大小寫,並且您已編寫Stanford 這將意味着您收到“ ClassNotFoundException”。

您不提供任何其他信息或錯誤消息,因此很難提供進一步的幫助。 您需要編譯和運行Java軟件包的幫助嗎? 如果是這樣,請先解決該問題,再處理NLP。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM