[英]How to build Markov Decision Processes model in Python for string data?
我有一個包含通過 URI 表示的數據的數據集。 我想要 model 可以從我的順序數據中預測數據樣本的前導和后繼的數據。 數據集看起來像這樣:
例如給定“HTTP://example.com/112”,model 生成“HTTP://example.com/296”作為前導,“HTTP://example.com/322”作為后繼。 我想為此數據集構建馬爾可夫決策過程 model 以獲得上述結果。 如果有人能幫我找到適合 Python 的 package,那就太好了。我檢查了“hmmlearn”package,用它我可以實現一個隱藏的馬爾可夫 model。但我的數據沒有隱藏狀態。 另外,我不確定是否應該將這些數據轉換為數值數據,然后我才能構建馬爾可夫 model。
先感謝您!
如果沒有隱藏狀態,則您有一個馬爾可夫鏈。 它們不難自己實現,但如果你想要一個庫,石榴:
from pomegranate import MarkovChain
#say you have two sequences of clicks:
sequences = [['uri1', 'uri5', 'uri3', 'uri5'], ['uri2', 'uri3', 'uri1', 'uri2']]
model = MarkovChain.from_samples(sequences)
學到的轉移概率:
print(model.distributions[1])
uri5 uri5 0.0
uri5 uri3 1.0
uri5 uri1 0.0
uri5 uri2 0.0
uri3 uri5 0.5
uri3 uri3 0.0
uri3 uri1 0.5
uri3 uri2 0.0
uri1 uri5 0.5
uri1 uri3 0.0
uri1 uri1 0.0
uri1 uri2 0.5
uri2 uri5 0.0
uri2 uri3 1.0
uri2 uri1 0.0
uri2 uri2 0.0
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.