![](/img/trans.png)
[英]Why does Viterbi algorithm (POS tagging) always predict one tag?
這是我的 HMM 模型類: 它實際上幾乎完全寫在我面前。 我要填補一些空白(最重要的是在我們計算 q 和 back_point 矩陣的 Viterbi 算法中)。 但我認為我做錯了,因為我的模型總是預測這樣的事情: 在上面的例子中,我給了這句話: [['he', 'can', 'stay'] ...
[英]Why does Viterbi algorithm (POS tagging) always predict one tag?
這是我的 HMM 模型類: 它實際上幾乎完全寫在我面前。 我要填補一些空白(最重要的是在我們計算 q 和 back_point 矩陣的 Viterbi 算法中)。 但我認為我做錯了,因為我的模型總是預測這樣的事情: 在上面的例子中,我給了這句話: [['he', 'can', 'stay'] ...
[英]What is the best data structure for an emission probability table?
對於我的項目,我有一個單詞數據集(例如 dog、ran、cat),每個單詞都標有詞性(例如動詞、名詞、形容詞)。 我需要創建一個數據結構來存儲每個單詞將是某個詞性的總數。 我目前正在使用一個 3d 數組,一個單詞是每個數組中的第一個元素,然后是詞性,每個位置后面的實例總數。 下面是一個例子。 這 ...
[英]Viterbi algorithm without fitting a HMM model, python
我有一組我確定的觀察和陳述。 我試圖將觀察結果與狀態相關聯,但 hmmlearn 庫只會在將 HMM 擬合到觀察結果后才解碼觀察結果。 擬合改變了不需要的狀態。 是否有不適合模型的 HMM 實現? ...
[英]How to determine length of observation sequence for HMM in speech recognition
我正在重新學習如何使用隱馬爾可夫模型進行語音識別,我有一個問題。 似乎大多數/所有使用HMM的討論都考慮了已知觀測序列的情況:[O1,O2,O3,...,OT]其中T是一個已知數。 但是,如果我們嘗試在語音上實時使用受過訓練的HMM,或者在有人逐個說出一句話的WAV文件中使用經過訓練的HMM ...
[英]How to find the most likely sequences of hidden states for a Hidden Markov Model
維特比算法在隱馬爾可夫模型中找到最可能的隱藏狀態序列。 我目前正在使用hhquark的以下很棒的代碼。 然而,我真正需要的不僅僅是最可能的序列,而是最可能的隱藏狀態序列。 如何修改此代碼以提供前k個最可能的序列? ...
[英]Using multiprocessing module to runs parallel processes where one is fed (dependent) by the other for Viterbi Algorithm
我最近使用了Python的多處理模塊,以加快Hidden Markov模型的前向后退算法,因為前向過濾和后向過濾可以獨立運行。 看到一半的運行時間是令人敬畏的。 我現在嘗試在我的迭代維特比算法中包含一些多處理程序。在該算法中,我嘗試運行的兩個進程不是獨立的。 val_max部分可以獨立 ...
[英]Calculating branch metric in Viterbi forward phase
我一直在研究Viterbi解碼器的一些實現,並注意到一種計算分支度量( 1 )的奇怪方法: “ BM是由信息代碼字c和漢明距離hd與R輸入的乘積計算得出的。” 進行正向相位的函數的輸入是輸入位c,還有漢明距離hd。 我的問題是,當我認為分支度量應為輸入位的漢明距離和網格的分支 ...
[英]How to understand the 'viterbi_decode' in tensorflow
HMM中使用的傳統維特比算法具有起始概率矩陣( 維特比算法wiki ),但是張量流中的維特比 解碼參數僅需要轉移概率矩陣和發射概率矩陣 。 怎么理解呢? ...
[英]Define hidden markov model for word
我正在嘗試定義一個隱藏的馬爾可夫模型,並使用維特比算法( https://en.wikipedia.org/wiki/Viterbi_algorithm )預測給定的單詞序列是否正確。 為了幫助理解,我嘗試定義模型參數: 語料庫中的字母是abbd 。 由此我定義: 以上正確嗎? ...
[英]How to find a matching string to a string from one text file in another text file?
我有兩個文本文件。 兩者的內容相同,但格式不同。 在一個文件中,單詞或字母之間有多余的空格。 也有不同的換行符。 例如: 文件1: 文件2: 假設我從“文件1”中選擇了the Knowledge Management字符串the Knowledge Manageme ...
[英]How can I implement the Viterbi algorithm in C# to split conjoined words?
簡而言之-我想將此處的第一個答案從Python轉換為C#。 我當前的分割連詞的解決方案是指數式的,我想要一個線性解決方案。 我假設輸入文本中沒有空格且大小寫一致。 背景 我希望使用C#將諸如“ wickedweather”之類的組合字符串轉換為單獨的單詞,例如“ wicked w ...
[英]Basic Hidden Markov Model, Viterbi algorithm
我對隱馬爾可夫模型相當新,我試圖圍繞理論的一個非常基本的部分。 我想使用HMM作為分類器,因此,給定一個時間序列的數據,我有兩個類:背景和信號。 如何估算每個班級的排放概率? 維特比算法是否需要背景模板和信號來估計概率(數據|狀態)? 或者我完全錯過了這一點? ...
[英]What does this line in the Viterbi algorithm specifically do?
我更關心理解左邊的賦值箭頭,后跟max s'= 1到N。忽略變量的語義。 謝謝! ...
[英]Convolutiona code and viterbi decoding using matlab
我正在嘗試使用Matlab編碼和解碼一條簡單的消息。 該消息表示為msg = [1 0 0 1 1 1 0 1]。 編碼步驟很有用,但是解碼步驟“ viterbi”返回零的二進制字符串“ 0 0 0 0 0 0 0 0 0”,而不是初始消息。 此后的代碼源,我不知道問題出在哪里 非 ...
[英]NLTK ViterbiParser fails in parsing words that are not in the PCFG rule
當我運行上面的代碼時,它為句子產生以下輸出,“關燈” - (S(VP(VB轉)(PRT(RP關))(NP(DT)(NNS燈))))(p = 2.53851e-14) 但是,它會引起句子的以下錯誤,“請關掉燈” - ValueError:語法不包含一些輸入詞:u“ ...
[英]Trying to understand the VITERBI algorithm a bit better
我目前正在嘗試在python中實現viterbi算法,更具體地說是在線課程中介紹的版本。 就目前而言,該算法以這種方式提出:給定一個帶有K個標記的句子,我們必須生成K個標簽。 我們假設標簽K-1 =標簽K-2 ='*',然后對於k從0到K的設置,我們按如下所示設置令牌的標簽:tag( ...
[英]Can we apply Viterbi algorithm if there are cycles in a graph?
我正在嘗試解決可以通過BFS和viterbi算法解決的問題。 但是,如果圖中存在循環,則BFS可能會失敗。 所以我的問題是維特比算法循環安全嗎? ...
[英]When using dynamic programming, capturing the entire path for a min-sum?
我正在嘗試使用維特比最小和算法,該算法嘗試通過一堆節點找到一條路徑,該路徑將針對某些固定輸入的總漢明距離(“漢字乘以2並計算所得位數”的總漢明距離)最小化。 我知道找到如何使用DP來計算整體的最小距離,但我用它來捕捉也對應於最小距離對應的路徑有問題。 似乎記住每個節點的路徑確實會占用 ...
[英]Why are both Viterbi and Reed-Solomon used in DVB-T?
根據我的理解,DVB-T數據包通過兩個FEC系統,即Viterbi,數據丟失高達50%,RS,數據丟失高達10%。 這些被稱為外部和內部編碼。 我無法理解第二次RS編碼的必要性(在這種情況下,188字節長的MPEG-TS數據包又增加了20個字節)。 更具體地說,損壞的數據包會發生什 ...
[英]soft viterbi decoder not working properly
我一直在matlab2009的簡單1/2速率卷積編碼器上研究維特比解碼器。 這是我的代碼 根據此輸入代碼,我得到的代碼= 00 11 10 00 01 10 01 11 11 11 10 00 10 11 00 11這是正確的,但是談論維特比解碼器出現錯誤之后輸出的dcd,即00000 ...