[英]Real-time data matching algorithm
我有一組(整數)輸入值和一組期望值,例如
000033335502200008777 000033335552200007777
在此示例中,我有零輸入,應將其忽略,並輸入一組非零輸入:
3333 555 22 7777
輸入數據可能有
對於每個這樣的組,我希望具有這樣的匹配率:
3333 (100%) 555 (66.67%) 22 (100%) 7777 (75%)
重要的一點是,在每個組的處理完成后,我需要這個比例:
first ratio after 8 values second ratio after 11 values third ratio after 13 values fourth ratio after 21 values
我應該選擇哪種算法/方法?
先感謝您!
實際上,有一些來自計算生物學和遺傳學的算法可能適用於快速數字匹配,並且也適用於序列模式挖掘領域。
選中SS Sheik,Sumit K. Aggarwal Anindya Poddar N. Balakrishnan,‡和K. Sekar的“ 快速模式匹配算法”
同樣,看起來您可以從研究字符串組成部分之間的匹配的算法中受益。
史密斯-沃特曼 ( Smith-Waterman )和尼德曼(Needleman-Wunsch)是一些著名的人。 對於直接的字符串匹配,我建議研究Jaro-Winkler和Monge-Elkan。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.