簡體   English   中英

如何在 Python 中為字符串數據構建馬爾可夫決策過程 model?

[英]How to build Markov Decision Processes model in Python for string data?

我有一個包含通過 URI 表示的數據的數據集。 我想要 model 可以從我的順序數據中預測數據樣本的前導和后繼的數據。 數據集看起來像這樣: 順序數據集

例如給定“HTTP://example.com/112”,model 生成“HTTP://example.com/296”作為前導,“HTTP://example.com/322”作為后繼。 我想為此數據集構建馬爾可夫決策過程 model 以獲得上述結果。 如果有人能幫我找到適合 Python 的 package,那就太好了。我檢查了“hmmlearn”package,用它我可以實現一個隱藏的馬爾可夫 model。但我的數據沒有隱藏狀態。 另外,我不確定是否應該將這些數據轉換為數值數據,然后我才能構建馬爾可夫 model。

先感謝您!

如果沒有隱藏狀態,則您有一個馬爾可夫鏈。 它們不難自己實現,但如果你想要一個庫,石榴:

from pomegranate import MarkovChain
#say you have two sequences of clicks:
sequences = [['uri1', 'uri5', 'uri3', 'uri5'], ['uri2', 'uri3', 'uri1', 'uri2']]
model = MarkovChain.from_samples(sequences)

學到的轉移概率:

print(model.distributions[1])
uri5    uri5    0.0
uri5    uri3    1.0
uri5    uri1    0.0
uri5    uri2    0.0
uri3    uri5    0.5
uri3    uri3    0.0
uri3    uri1    0.5
uri3    uri2    0.0
uri1    uri5    0.5
uri1    uri3    0.0
uri1    uri1    0.0
uri1    uri2    0.5
uri2    uri5    0.0
uri2    uri3    1.0
uri2    uri1    0.0
uri2    uri2    0.0

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM