cost 158 ms
為什么維特比算法(詞性標注)總是預測一個標簽?

[英]Why does Viterbi algorithm (POS tagging) always predict one tag?

這是我的 HMM 模型類: 它實際上幾乎完全寫在我面前。 我要填補一些空白(最重要的是在我們計算 q 和 back_point 矩陣的 Viterbi 算法中)。 但我認為我做錯了,因為我的模型總是預測這樣的事情: 在上面的例子中,我給了這句話: [['he', 'can', 'stay'] ...

排放概率表的最佳數據結構是什么?

[英]What is the best data structure for an emission probability table?

對於我的項目,我有一個單詞數據集(例如 dog、ran、cat),每個單詞都標有詞性(例如動詞、名詞、形容詞)。 我需要創建一個數據結構來存儲每個單詞將是某個詞性的總數。 我目前正在使用一個 3d 數組,一個單詞是每個數組中的第一個元素,然后是詞性,每個位置后面的實例總數。 下面是一個例子。 這 ...

沒有擬合 HMM 模型的 Viterbi 算法,python

[英]Viterbi algorithm without fitting a HMM model, python

我有一組我確定的觀察和陳述。 我試圖將觀察結果與狀態相關聯,但 hmmlearn 庫只會在將 HMM 擬合到觀察結果后才解碼觀察結果。 擬合改變了不需要的狀態。 是否有不適合模型的 HMM 實現? ...

如何確定語音識別中HMM的觀察序列長度

[英]How to determine length of observation sequence for HMM in speech recognition

我正在重新學習如何使用隱馬爾可夫模型進行語音識別,我有一個問題。 似乎大多數/所有使用HMM的討論都考慮了已知觀測序列的情況:[O1,O2,O3,...,OT]其中T是一個已知數。 但是,如果我們嘗試在語音上實時使用受過訓練的HMM,或者在有人逐個說出一句話的WAV文件中使用經過訓練的HMM ...

如何為隱馬爾可夫模型找到最可能的隱藏狀態序列

[英]How to find the most likely sequences of hidden states for a Hidden Markov Model

維特比算法在隱馬爾可夫模型中找到最可能的隱藏狀態序列。 我目前正在使用hhquark的以下很棒的代碼。 然而,我真正需要的不僅僅是最可能的序列,而是最可能的隱藏狀態序列。 如何修改此代碼以提供前k個最可能的序列? ...

使用多處理模塊運行並行進程,其中一個進程由另一個進程供(依賴)維特比算法

[英]Using multiprocessing module to runs parallel processes where one is fed (dependent) by the other for Viterbi Algorithm

我最近使用了Python的多處理模塊,以加快Hidden Markov模型的前向后退算法,因為前向過濾和后向過濾可以獨立運行。 看到一半的運行時間是令人敬畏的。 我現在嘗試在我的迭代維特比算法中包含一些多處理程序。在該算法中,我嘗試運行的兩個進程不是獨立的。 val_max部分可以獨立 ...

計算維特比正向階段的分支度量

[英]Calculating branch metric in Viterbi forward phase

我一直在研究Viterbi解碼器的一些實現,並注意到一種計算分支度量( 1 )的奇怪方法: “ BM是由信息代碼字c和漢明距離hd與R輸入的乘積計算得出的。” 進行正向相位的函數的輸入是輸入位c,還有漢明距離hd。 我的問題是,當我認為分支度量應為輸入位的漢明距離和網格的分支 ...

如何理解張量流中的'viterbi_decode'

[英]How to understand the 'viterbi_decode' in tensorflow

HMM中使用的傳統維特比算法具有起始概率矩陣( 維特比算法wiki ),但是張量流中的維特比 解碼參數僅需要轉移概率矩陣和發射概率矩陣 。 怎么理解呢? ...

為單詞定義隱藏的馬爾可夫模型

[英]Define hidden markov model for word

我正在嘗試定義一個隱藏的馬爾可夫模型,並使用維特比算法( https://en.wikipedia.org/wiki/Viterbi_algorithm )預測給定的單詞序列是否正確。 為了幫助理解,我嘗試定義模型參數: 語料庫中的字母是abbd 。 由此我定義: 以上正確嗎? ...

如何從另一個文本文件中的一個文本文件中找到與字符串匹配的字符串?

[英]How to find a matching string to a string from one text file in another text file?

我有兩個文本文件。 兩者的內容相同,但格式不同。 在一個文件中,單詞或字母之間有多余的空格。 也有不同的換行符。 例如: 文件1: 文件2: 假設我從“文件1”中選擇了the Knowledge Management字符串the Knowledge Manageme ...

如何在C#中實現維特比算法來拆分連詞?

[英]How can I implement the Viterbi algorithm in C# to split conjoined words?

簡而言之-我想將此處的第一個答案從Python轉換為C#。 我當前的分割連詞的解決方案是指數式的,我想要一個線性解決方案。 我假設輸入文本中沒有空格且大小寫一致。 背景 我希望使用C#將諸如“ wickedweather”之類的組合字符串轉換為單獨的單詞,例如“ wicked w ...

基本隱馬爾可夫模型,維特比算法

[英]Basic Hidden Markov Model, Viterbi algorithm

我對隱馬爾可夫模型相當新,我試圖圍繞理論的一個非常基本的部分。 我想使用HMM作為分類器,因此,給定一個時間序列的數據,我有兩個類:背景和信號。 如何估算每個班級的排放概率? 維特比算法是否需要背景模板和信號來估計概率(數據|狀態)? 或者我完全錯過了這一點? ...

使用Matlab進行卷積碼和維特比解碼

[英]Convolutiona code and viterbi decoding using matlab

我正在嘗試使用Matlab編碼和解碼一條簡單的消息。 該消息表示為msg = [1 0 0 1 1 1 0 1]。 編碼步驟很有用,但是解碼步驟“ viterbi”返回零的二進制字符串“ 0 0 0 0 0 0 0 0 0”,而不是初始消息。 此后的代碼源,我不知道問題出在哪里 非 ...

NLTK ViterbiParser無法解析不在PCFG規則中的單詞

[英]NLTK ViterbiParser fails in parsing words that are not in the PCFG rule

當我運行上面的代碼時,它為句子產生以下輸出,“關燈” - (S(VP(VB轉)(PRT(RP關))(NP(DT)(NNS燈))))(p = 2.53851e-14) 但是,它會引起句子的以下錯誤,“請關掉燈” - ValueError:語法不包含一些輸入詞:u“ ...

嘗試更好地了解VITERBI算法

[英]Trying to understand the VITERBI algorithm a bit better

我目前正在嘗試在python中實現viterbi算法,更具體地說是在線課程中介紹的版本。 就目前而言,該算法以這種方式提出:給定一個帶有K個標記的句子,我們必須生成K個標簽。 我們假設標簽K-1 =標簽K-2 ='*',然后對於k從0到K的設置,我們按如下所示設置令牌的標簽:tag( ...

使用動態編程時,要捕獲整個路徑的最小和?

[英]When using dynamic programming, capturing the entire path for a min-sum?

我正在嘗試使用維特比最小和算法,該算法嘗試通過一堆節點找到一條路徑,該路徑將針對某些固定輸入的總漢明距離(“漢字乘以2並計算所得位數”的總漢明距離)最小化。 我知道找到如何使用DP來計算整體的最小距離,但我用它來捕捉也對應於最小距離對應的路徑有問題。 似乎記住每個節點的路徑確實會占用 ...

為什么Viterbi和Reed-Solomon都用於DVB-T?

[英]Why are both Viterbi and Reed-Solomon used in DVB-T?

根據我的理解,DVB-T數據包通過兩個FEC系統,即Viterbi,數據丟失高達50%,RS,數據丟失高達10%。 這些被稱為外部和內部編碼。 我無法理解第二次RS編碼的必要性(在這種情況下,188字節長的MPEG-TS數據包又增加了20個字節)。 更具體地說,損壞的數據包會發生什 ...

軟維特比解碼器無法正常工作

[英]soft viterbi decoder not working properly

我一直在matlab2009的簡單1/2速率卷積編碼器上研究維特比解碼器。 這是我的代碼 根據此輸入代碼,我得到的代碼= 00 11 10 00 01 10 01 11 11 11 10 00 10 11 00 11這是正確的,但是談論維特比解碼器出現錯誤之后輸出的dcd,即00000 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM