cost 245 ms
如何在 sklearn_crfsuite 中設置隨機種子

[英]How to set random seed in sklearn_crfsuite

我目前正在嘗試使用sklearn_crfsuite庫來實現 NER model。 訓練代碼簡單如下: 代碼是做十次重復訓練,我的目標是觀察 10 個不同的分數並將它們平均作為最終分數。 然而,每次重復都會給出相同的分數,盡管我在每個循環中重新初始化了 model。 問題是,我如何正確設置隨機種子,以 ...

我的 sklearn_crfsuite 模型沒有學到任何東西

[英]My sklearn_crfsuite model does not learn anything

我正在嘗試按照此處的教程創建注釋預測模型,但我的模型沒有學到任何東西。 這是我的訓練數據和標簽的示例: [{'bias': 1.0, 'word.lower()': '\\nreference\\nissue\\ndate\\ndgt86620\\n4\\n \\n19-dec-05\\nf ...

在簡歷 (NER) 中標記自定義實體

[英]Label custom entities in Resume (NER)

我如何為自定義命名實體執行 NER。 例如,如果我想確定特定單詞是否是簡歷中的技能。 如果 (Java, c++) 出現在我的文本中,我應該能夠將它們標記為技能。 我不想在自定義語料庫中使用 spacy。我想創建數據集,例如,單詞將是我的特征,而標簽(技能)將是我的因變量。 處理這些問題的最佳方法 ...

如何使用詞嵌入作為 CRF (sklearn-crfsuite) model 訓練的特征

[英]How to use word embedding as features for CRF (sklearn-crfsuite) model training

我想開發一個NER model,我想在其中使用詞嵌入功能來訓練CRF model。 代碼在沒有詞嵌入功能的情況下完美運行,但是當我將嵌入作為 CRF 訓練的功能插入時,收到錯誤消息。 這是我的代碼片段的一部分: 當我想訓練 CRF model 時,我收到以下錯誤消息: TypeError: only ...

sklearn-crfsuite 如何處理字符串?

[英]How does sklearn-crfsuite handle strings?

我一直在關注sklearn-crfsuite教程。 用於訓練 CRF model 的特征示例如下所示。 sklearn-crfsuite如何將melbourne等字符串轉換為浮點數,因為 CRF 的特征應該只是浮點數。 文檔中的任何地方都沒有提到這一點。 ...

無法使用crfsuite的C ++ API編譯Tagger的非常簡單的示例

[英]Unable to compile a very simple example of Tagger with the C++ API of crfsuite

我已經從來源( https://github.com/downloads/chokkan/crfsuite/crfsuite-0.12.tar.gz )正確安裝了crfsuite。 但是,當我嘗試編譯一個非常簡單的代碼時,似乎我錯過了一些東西。 這是代碼: 這是要編譯的命令行: ...

2019-09-06 14:11:14   1   30    c++ / crfsuite  
CRFSuite有多少培訓數據?

[英]CRFSuite how much training data?

嗨,我正在使用crfsuite訓練帶有我使用拉丁文本的一些示例數據的crf。 我用O,PERSON和PLACE標記了訓練數據。 測試我訓練有素的模型時,我得到的所有預測值都為O。我懷疑這是因為我沒有足夠的訓練數據。 我的訓練是基於3760字節。 (我知道這有點!-它會使CRF無法正常工作 ...

如何在python crfsuite中使用Conll 2003語料庫

[英]How do I use Conll 2003 corpus in python crfsuite

我已經下載了Conll 2003語料庫(“ eng.train”)。 我想使用它通過python crfsuite訓練來提取實體。 但是我不知道如何加載該文件進行培訓。 我找到了這個例子,但它不是英語的。 同樣,將來我想訓練POS或位置以外的新實體。 我該如何添加這些。 ...

在Keras的LSTM與CRF

[英]LSTM with CRF in Keras

我真的不明白如何結合sklearn_crfsuite和Keras。 我必須制作一個經典的LSTM並且最后一次激活,我使用sklearn_crfsuite? 有人舉個例子嗎? 謝謝, ...

訓練沒有句子界限的CRF

[英]Training a CRF without sentence boundaries

我需要標記HTML文檔中的部分文本。 但是,它主要由日期,公司名稱,地址等形式的文本組成。我計划使用CRF(sklearn-crfsuite) 我的問題是很難將數據集划分為句子。 我們可以訓練沒有句子邊界的CRF模型嗎? CRFSuite或sklearn-crfsuite中的教程不討 ...

在另一個項目的一個Visual Studio Team Services項目中包含一個人工制品?

[英]Include an artefact in one Visual Studio Team Services project in another project?

我正在使用Visual Studio Team服務來構建CRFSuite和LibLBFGS 。 CRFSuite依賴於正在構建的LibLBFGS庫。 我可以毫無問題地構建LibLBFGS。 我希望能夠在構建時使用包含在CRFSuite項目中的LibLBFGS構建生成的庫和頭文件。 希 ...

與CRFSuite一起使用k倍交叉驗證,並將其保存在模型文件中

[英]Use k-fold cross-validation with CRFSuite and save it in a model file

我是CRFSuite庫的新手,但是由於使用了“ -m”選項,我知道如何訓練模型並將其保存在文件中。 但是,我嘗試掌握k折疊交叉驗證,但是“ -m”選項似乎無法將de process保存到文件中。 該命令根本不會創建模型文件。 我能否舉一個簡單的示例,說明如何將C折線交叉驗證與CRFSu ...

如果標簽為“:”,則CRFSuite預測會被吞噬。

[英]CRFSuite predictions are swallowed if label is ':'?

我正在使用CRFSuite進行序列分類(POS標記)。 令我驚訝的是,CRFSuite似乎不喜歡標簽':'實際標簽為':'的單位或標記被完全跳過了(預測輸出中沒有關於缺失或跳過項目的說明) 我使用其他與標點符號相關的標簽,例如“。”。 或',',但它們已正確使用並輸出。 有沒有類 ...

在crfsuite中使用tag作為attibute

[英]Use tag as attibute in crfsuite

我是CRF的新手,我想用CRFsuite標記單詞。 我閱讀了CRFsuite的手冊並了解了訓練數據的格式,但如果我想添加一些帶有“近詞”標簽的功能,那么訓練數據文件是什么樣的? 我有谷歌,但我沒有發現這個問題。 ...

CRF ++或CRFSuite

[英]CRF++ or CRFSuite

我開始使用crf ++和crfsuite(兩者都使用非常相似的文件格式)。 我想做與圖像有關的事情(分割,活動識別等)。 我的主要問題是如何構建培訓文件。 有沒有人使用crf和圖像? 有沒有人解釋我或給一些文件來學習。 提前致謝。 ...

運行CRFSuite示例

[英]Running CRFSuite examples

我正在嘗試使用CRFSuite,但我無法弄清楚如何使用示例/ ner.py和pos.py 確切地說,我如何輸入表格: 要么 例如,我可以從CoNNL模型獲得“yw pos”,但是“chk”部分和pos.py中的所有那些字段我都沒有真正得到。 另外,有沒有辦法用CRFS ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM