[英]Mallet CRF SimpleTagger Performance Tuning
对于使用Java库Mallet的SimpleTagger类作为条件随机字段(CRF)的用户,这是一个问题。 假设我已经在使用多线程选项来获得可用的最大CPU数量(这种情况):我应该从哪里开始,如果我需要它运行得更快,应该尝试些什么?
一个相关的问题是,是否有一种方法可以类似于随机梯度下降法来加快训练过程?
我想做的培训类型很简单:
Input:
Feature1 ... FeatureN SequenceLabel
...
Test Data:
Feature1 ... FeatureN
...
Output:
Feature1 ... FeatureN SequenceLabel
...
(这些功能是我对自己代码中的数据所做的处理的输出。)
我很难让除Mallet之外的任何CRF分类器都能正常工作,但是我可能不得不再次回溯并重新审视其他实现之一,或者尝试一个新的实现。
请看一下这篇论文: http : //www.stanford.edu/~acoates/papers/LeNgiCoaLahProNg11.pdf
似乎随机梯度下降法很难调整和并行化。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.