[英]Training a CRF without sentence boundaries
是的,您可以進行訓練而無需將輸入序列分為句子-只需對所有內容使用較大的序列即可。 例如, https://github.com/scrapinghub/webstruct針對HTML頁面執行此操作。
句子中的拆分順序提供了附加信息(硬邊界),但是CRF可以在沒有它的情況下工作。 另請參閱: https : //stats.stackexchange.com/questions/197291/sequence-length-when-training-a-conditional-random-field-crf 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.