簡體   English   中英

用於匹配兩組字符串之間模式的機器學習模型?

[英]A machine learning model for matching pattern between two sets of strings?

我正在嘗試使用機器學習來學習某個服務執行的HTML轉換。 我已將問題分解為模式匹配問題。 現在我正在嘗試學習標簽轉換的模式。 例如,對於相同的數據,我在原始HTML“html,body,div,h1”中使用此模式,並在轉換后的頁面“html,body,div,div,div”中使用以下模式。 我有14000個這樣的數據點,我想訓練一個模型,該模型將從原始頁面輸出模式並輸出轉換后的模式。 我已經研究了一些NLP模型,但要么我完全沒有理解它們,要么它們沒有幫助。 如果有人可以給我任何指針或者最好建議一些基於python的模型,那將是很棒的。

你的問題不夠清楚,無法幫助你得到一些答案,但仍然從我能夠弄清楚你的輸入將是字符串模式的html標簽,你的輸出也是html標簽的字符串模式。

您可以使用雙向LSTM或CRF執行此類任務。 閱讀它們,你會有一個清晰的想法。

但是如果相同的輸入模式給出多個輸出模式,那么大多數ML算法將難以學習。 你可以刪除那些數據點,你會很高興。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM