[英]Stanford NLP/NER - how to use extractors and classifiers?
斯坦福大学“命名实体识别”软件包随附的演示文件显示了对句子进行分类的示例。 输出选项是字符串,例如:
"I eat apples with Michael and Jordan on mondays"
=>
"I eat apples with <PERSON>Michael</PERSON> and
<PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
或每个单词的分类图。
有没有一种方法可以将分类图返回到实体列表?
例如:
{
PERSON : ["Michael", "Peter"]
DATE : ["mondays"]
}
这是一个最小的bash脚本,它将作为后处理:
echo "I eat apples with <PERSON>Michael</PERSON> and <PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
| grep -Eo '<([^>/]*)>[^<]*'
| awk -F '>' '{nes[$1]=nes[$1]","$2;} END {for(t in nes) print tolower(t)":{"nes[t]"}";}'
| sed 's/:{,/:{/' | tr -d '<'
使用它,您将获得示例列表:
date:{mondays}
person:{Michael,Jordan}
您可能要处理多个条目(“ uniq”还是计数?)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.