[英]Mallet CRF SimpleTagger Performance Tuning
對於使用Java庫Mallet的SimpleTagger類作為條件隨機字段(CRF)的用戶,這是一個問題。 假設我已經在使用多線程選項來獲得可用的最大CPU數量(這種情況):我應該從哪里開始,如果我需要它運行得更快,應該嘗試些什么?
一個相關的問題是,是否有一種方法可以類似於隨機梯度下降法來加快訓練過程?
我想做的培訓類型很簡單:
Input:
Feature1 ... FeatureN SequenceLabel
...
Test Data:
Feature1 ... FeatureN
...
Output:
Feature1 ... FeatureN SequenceLabel
...
(這些功能是我對自己代碼中的數據所做的處理的輸出。)
我很難讓除Mallet之外的任何CRF分類器都能正常工作,但是我可能不得不再次回溯並重新審視其他實現之一,或者嘗試一個新的實現。
請看一下這篇論文: http : //www.stanford.edu/~acoates/papers/LeNgiCoaLahProNg11.pdf
似乎隨機梯度下降法很難調整和並行化。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.