Stanford NLP / NER-如何使用提取器和分类器？

Question

斯坦福大学“命名实体识别”软件包随附的演示文件显示了对句子进行分类的示例。 输出选项是字符串，例如：

"I eat apples with Michael and Jordan on mondays"

=>

 "I eat apples with <PERSON>Michael</PERSON> and 
<PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"

或每个单词的分类图。

有没有一种方法可以将分类图返回到实体列表？

例如：

{
  PERSON : ["Michael", "Peter"]
  DATE : ["mondays"]
}

Answer 1

这是一个最小的bash脚本，它将作为后处理：

echo "I eat apples with <PERSON>Michael</PERSON> and <PERSON>Jordan</PERSON> on <DATE>mondays</DATE>"
| grep -Eo '<([^>/]*)>[^<]*'
| awk -F '>' '{nes[$1]=nes[$1]","$2;} END {for(t in nes) print tolower(t)":{"nes[t]"}";}'
| sed 's/:{,/:{/' | tr -d '<'

使用它，您将获得示例列表：

date:{mondays}
person:{Michael,Jordan}

您可能要处理多个条目（“ uniq”还是计数？）。

Stanford NLP / NER-如何使用提取器和分类器？

问题描述

1 个解决方案

解决方案1
0 2014-06-26 20:24:30

Stanford NLP / NER-如何使用提取器和分类器？

问题描述

1 个解决方案

解决方案1 0 2014-06-26 20:24:30

解决方案1
0 2014-06-26 20:24:30