[英]CRF for NER with many classes
我将开发具有许多(100+)类的命名实体识别系统。 假设它们的频率大致相等,那么哪种算法应该表现最好? 根据我对CRF工作原理的理解(很遗憾,距离理想还很远),在这里应该没问题。 但是在某些来源( 谷歌图书 )中,我发现了另一种观点。
那么,CRF是否适用于具有大量类的NER算法?
我们在这里谈论什么样的课程? 不要害羞:)
您最好使用分层方法:
有少量的根类,例如“产品”,“人”,“地点”。 第一遍找出哪个是哪个。
然后,对于每个根类,都有子类,例如“汽车产品”,“电子产品”等。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.