[英]Finding Patterns In Dataset/Array
我有這個數據集:
NAME VALUE1 VALUE2
0 Alpha 100 A1
1 Alpha 100 A1
2 Alpha 200 A2
我想運行一個腳本來查找數據集中的模式。 例如,在這個特定的數據集中,它將找到的規則是:
1)如果名稱 = ALPHA & VALUE1 = 100,那么 VALUE2 = A1
2)IF NAME = ALPHA & VALUE1 = 200, THEN VALUE2 = A2
我知道必須像這樣比較每一列和每一行的值......
ALPHA 100
ALHA 100
ALPHA 200
ALPHA A1
ALPHA A1
ALPHA A2
100 A1
100 A1
200 A2
ALPHA 100 A1
ALPHA 100 A1
ALPHA 200 A2
“ALPHA 100”不正確,因為“ALPHA 200”存在,“ALPHA A1”也一樣,因為“ALPHA A2”存在。
“100 A1”和“200 A2”是正確的,但“ALPHA 100 A1”和“ALPHA 200 A2”是更強的變體,因此是打印出來的。
我該怎么辦?
好的,這是每一行的分類任務。 但我也想為此找到某種非隨機的解決方案。 首先,您可能假設每行內都有所有關系,例如如果 alfa 和 100 則為 a1,如果 alfa 和 A1 則為 100 等,作為條件,您可以在行中獲取任意數量的字段。
然后,當您閱讀下一行時,您會更新規則。 如果你發現一個矛盾的條目,比如 alpha, 300 -> A1 現在你使用你的泛化函數。 這可能是 alpha、100 或 300 -> a1; 或者!!! 阿爾法,區間(100 .. 300)-> A1。 對此沒有普遍的已知方法,這使它變得有趣。 你可能會告訴我你在做什么的確切任務,我有興趣解決這個問題
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.