繁体   English   中英

Stanford NLP / NER-如何使用提取器和分类器?

[英]Stanford NLP/NER - how to use extractors and classifiers?

斯坦福大学“命名实体识别”软件包随附的演示文件显示了对句子进行分类的示例。 输出选项是字符串,例如:

"I eat apples with Michael and Jordan on mondays" 

=>

 "I eat apples with <PERSON>Michael</PERSON> and 
<PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"

或每个单词的分类图。

有没有一种方法可以将分类图返回到实体列表?

例如:

{
  PERSON : ["Michael", "Peter"]
  DATE : ["mondays"]
}

这是一个最小的bash脚本,它将作为后处理:

echo "I eat apples with <PERSON>Michael</PERSON> and <PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
| grep -Eo '<([^>/]*)>[^<]*'
| awk -F '>' '{nes[$1]=nes[$1]","$2;} END {for(t in nes) print tolower(t)":{"nes[t]"}";}'
| sed 's/:{,/:{/' | tr -d '<'

使用它,您将获得示例列表:

date:{mondays}
person:{Michael,Jordan}

您可能要处理多个条目(“ uniq”还是计数?)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM