sklearn-crfsuite 如何處理字符串？

Question

我一直在關注sklearn-crfsuite教程。

用於訓練 CRF model 的特征示例如下所示。

{'+1:postag': 'Fpa',
 '+1:postag[:2]': 'Fp',
 '+1:word.istitle()': False,
 '+1:word.isupper()': False,
 '+1:word.lower()': '(',
 'BOS': True,
 'bias': 1.0,
 'postag': 'NP',
 'postag[:2]': 'NP',
 'word.isdigit()': False,
 'word.istitle()': True,
 'word.isupper()': False,
 'word.lower()': 'melbourne',
 'word[-2:]': 'ne',
 'word[-3:]': 'rne'}

sklearn-crfsuite如何將melbourne等字符串轉換為浮點數，因為 CRF 的特征應該只是浮點數。 文檔中的任何地方都沒有提到這一點。

Answer 1

sklearn-crf 功能采用 python-crfsuite 格式。 每個字符串都被視為鍵：

    * {"string_key": "string_value", ...} dict; that's the same as
      {"string_key=string_value": 1.0, ...}
    * ["string_key1", "string_key2", ...] list; that's the same as
      {"string_key1": 1.0, "string_key2": 1.0, ...}

你可以在這里找到更多： https://github.com/scrapinghub/python-crfsuite/blob/master/pycrfsuite/_pycrfsuite.pyx

sklearn-crfsuite 如何處理字符串？

問題描述

1 個解決方案

解決方案1
0 2020-05-24 19:54:37

sklearn-crfsuite 如何處理字符串？

問題描述

1 個解決方案

解決方案1 0 2020-05-24 19:54:37

解決方案1
0 2020-05-24 19:54:37