[英]How to use Stanford Parser to get POS tags using java?
我正在从事抄袭检测项目。 我需要使用Stanford Parser API为存储在文本文件中的句子中的单词获取词性(POS)标记。
我知道可以将edu.Stanford.nlp.parser.lexparser.LexicalizedParser
类用于此目的。 但是我无法使其正常工作。
谁能告诉我如何用Java编写可利用此类或API中提供的其他类来获取POS标签的代码?
非常感谢你
查看分发中包含的启动文件ParserDemo.java
和ParserDemo2.java
。 它们显示了在代码中调用解析器的简单示例。 特别是,在ParserDemo2.java
请参见parse.taggedYield()
调用,该调用返回一个TaggedWord
List
,您可以从中请求每个项目的tag()
。
但是,如果您只想使用词性标记器,您会发现仅使用词性标记器(例如Stanford词性Tagger)会更快,内存占用更少。
可以在以下位置找到Javadoc: http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html
: http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html
。 请注意,程序包名称( edu.stanford.nlp.parser.lexparser
)区分大小写,并且您已编写Stanford
。 这将意味着您收到“ ClassNotFoundException”。
您不提供任何其他信息或错误消息,因此很难提供进一步的帮助。 您需要编译和运行Java软件包的帮助吗? 如果是这样,请先解决该问题,再处理NLP。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.