[英]CRF for NER with many classes
我將開發具有許多(100+)類的命名實體識別系統。 假設它們的頻率大致相等,那么哪種算法應該表現最好? 根據我對CRF工作原理的理解(很遺憾,距離理想還很遠),在這里應該沒問題。 但是在某些來源( 谷歌圖書 )中,我發現了另一種觀點。
那么,CRF是否適用於具有大量類的NER算法?
我們在這里談論什么樣的課程? 不要害羞:)
您最好使用分層方法:
有少量的根類,例如“產品”,“人”,“地點”。 第一遍找出哪個是哪個。
然后,對於每個根類,都有子類,例如“汽車產品”,“電子產品”等。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.