簡體   English   中英

實時數據匹配算法

[英]Real-time data matching algorithm

我有一組(整數)輸入值和一組期望值,例如

000033335502200008777
000033335552200007777

在此示例中,我有零輸入,應將其忽略,並輸入一組非零輸入:

3333
555
22
7777

輸入數據可能有

  1. 不同組的長度(550和555)
  2. 組轉移(0055500 0555000)
  3. 錯誤(但接近)值(8777和7777)

對於每個這樣的組,我希望具有這樣的匹配率:

3333 (100%)
555  (66.67%)
22 (100%)
7777 (75%)

重要的一點是,在每個組的處理完成后,我需要這個比例:

first ratio after 8 values
second ratio after 11 values
third ratio after 13 values
fourth ratio after 21 values

我應該選擇哪種算法/方法?

先感謝您!

實際上,有一些來自計算生物學和遺傳學的算法可能適用於快速數字匹配,並且也適用於序列模式挖掘領域。

選中SS Sheik,Sumit K. Aggarwal Anindya Poddar N. Balakrishnan,‡和K. Sekar的“ 快速模式匹配算法”

同樣,看起來您可以從研究字符串組成部分之間的匹配的算法中受益。

史密斯-沃特曼Smith-Waterman )和尼德曼(Needleman-Wunsch)是一些著名的人。 對於直接的字符串匹配,我建議研究Jaro-Winkler和Monge-Elkan。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM