[英]how to use any statistical stemmer like YASS or GRAS in place of Porter stemmer in TERRIER Information Retreival system
Terrier IR系统默认使用Porter Stemmer。 如何在Terrier中使用统计词干输出? 我已经使用统计词干生成了词干列表,并希望将其嵌入TERRIER IR。
您必须创建一个将StemmerTermPipeline扩展到org.terrier.terms包中的类。
例如:
公共类StatisticsStemmer扩展了StemmerTermPipeline {
public StatisticalStemmer(TermPipeline next) {
super(next);
}
@Override
public String stem(String word) {
// your method implementation
}
}
之后,您需要重新编译核心组件并替换lib目录中的terrier-4.0-core.jar文件。
最后,您需要在属性文件中更新术语管道:
termpipelines =停用词,StatisticalStemmer
这样,Terrier将使用您的词梗代替PorterStemmer。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.