[英]How can I cluster coordinate values into rows using their Y-axis value?
目前我有一個 dataframe 的 XY 坐標,代表在 OpenCV Python 中檢測到的一些圓。這些圓形成不同的行和列,我想將它們逐行聚類。
然而,有時這些坐標會像下面看到的那樣稍微旋轉。 旋轉可以是順時針和逆時針。
將這些坐標逐行分組在一起的最簡單方法是什么?
這是一個示例 dataframe:
sample=pd.DataFrame({
'X_center': {72: 0.098054,
137: 0.112574,
254: 0.14442,
322: 0.113445,
365: 0.113445,
370: 0.188365,
384: 0.158165,
386: 0.173459,
401: 0.040267,
405: 0.128303,
408: 0.128352,
415: 0.174039,
451: 0.187688,
454: 0.159326,
482: 0.158213,
500: 0.024828,
519: 0.010309,
603: 0.08489,
606: 0.188946,
613: 0.128932,
684: 0.114026,
688: 0.141709,
717: 0.172878,
738: 0.143113,
816: 0.054787,
824: 0.157778,
841: 0.187639,
876: 0.069064,
890: 0.128448,
908: 0.024247,
937: 0.186865,
939: 0.083293,
964: 0.069306,
974: 0.098587,
976: 0.158794,
1035: 0.171474,
1037: 0.084842,
1097: 0.143016,
1100: 0.159181,
1106: 0.054835,
1111: 0.173652,
1189: 0.114413,
1199: 0.113639,
1209: 0.025312,
1214: 0.084067,
1283: 0.156326,
1313: 0.127142,
1447: 0.099313,
1494: 0.142145,
1535: 0.083922,
1557: 0.174426,
1580: 0.172733,
1607: 0.114413,
1618: 0.039009,
1626: 0.055609,
1820: 0.0997,
1866: 0.043945,
1877: 0.070322,
1890: 0.084842,
1909: 0.128448,
1951: 0.173217,
1952: 0.144275,
1978: 0.052221,
1988: 0.112235,
2002: 0.127384,
2063: 0.009825,
2106: 0.129174,
2113: 0.005033,
2137: 0.158939,
2182: 0.010357},
'Y_center': {72: 0.118009,
137: 0.101591,
254: 0.197024,
322: 0.118112,
365: 0.150077,
370: 0.148589,
384: 0.117599,
386: 0.148999,
401: 0.199025,
405: 0.117137,
408: 0.13371,
415: 0.180605,
451: 0.116983,
454: 0.196614,
482: 0.13335,
500: 0.060595,
519: 0.198923,
603: 0.18235,
606: 0.1804,
613: 0.165623,
684: 0.165829,
688: 0.054284,
717: 0.117394,
738: 0.118266,
816: 0.182863,
824: 0.101796,
841: 0.085428,
876: 0.150539,
890: 0.149615,
908: 0.038122,
937: 0.053207,
939: 0.118676,
964: 0.166855,
974: 0.150077,
976: 0.149666,
1035: 0.037917,
1037: 0.166496,
1097: 0.149359,
1100: 0.165469,
1106: 0.166496,
1111: 0.164802,
1189: 0.181632,
1199: 0.133915,
1209: 0.18312,
1214: 0.134582,
1283: 0.038019,
1313: 0.102258,
1447: 0.166034,
1494: 0.086455,
1535: 0.150128,
1557: 0.196408,
1580: 0.101539,
1607: 0.197383,
1618: 0.120062,
1626: 0.198102,
1820: 0.197435,
1866: 0.038481,
1877: 0.198102,
1890: 0.197281,
1909: 0.08589,
1951: 0.133043,
1952: 0.181683,
1978: 0.087276,
1988: 0.039251,
2002: 0.054797,
2063: 0.15136,
2106: 0.197075,
2113: 0.082555,
2137: 0.181016,
2182: 0.167317}}
為時已晚,您現在應該已經找到了解決方案。 但我希望我的回答對你有用。
如果“稍微旋轉”是指在您的示例中發生的程度,不用擔心,即使是 k-means 也可以很好地處理它。 我使用silhouette score來查找聚類的數量,結果似乎是正確的:
import math
from sklearn.cluster import KMeans
from sklearn import metrics
from getSample import getSample
x, y = getSample() # gets coordinates of points in numpy arrays
maxScore = -math.inf
for k in range(2, 21):
model = KMeans(n_clusters=k)
C = model.fit(y.reshape(-1, 1))
score = metrics.silhouette_score(
y.reshape(-1, 1), C.labels_.astype(float), metric='euclidean')
if score > maxScore:
maxScore = score
bestC = C
print(bestC.n_clusters)
print(bestC.cluster_centers_) # y-intercept of horizontal lines, each representing a layer
10
[0.038358 0.05572075 0.0855208 0.101796 0.11802644 0.13372
0.1498409 0.16610233 0.18170863 0.19757927]
但是當旋轉角度太大以至於圖層在 y 范圍內重疊時,問題就出現了。 在這種情況下,我們必須首先確定旋轉的角度。 我建議這樣的算法:
這樣,找到了一些彼此最近的一對點,它們位於彼此的左側和右側,並且從左側點到右側點的方向形成了一個向量。 這些向量最有可能處於同一方向並顯示層的方向。
x, y = getSample(rotation=a)
iPairs = range(len(x))
pairs = np.array(list(itertools.combinations(iPairs, 2)))
vx = x[pairs[:, 0]]-x[pairs[:, 1]]
vy = y[pairs[:, 0]]-y[pairs[:, 1]]
hClose = np.abs(vx) > np.abs(vy)
vx = vx[hClose]
vy = vy[hClose]
mag = np.sqrt(np.square(vx) + np.square(vy))
iClosest = np.argsort(mag)[:int(len(x)*.2)]
vx = vx[iClosest]
vy = vy[iClosest]
iFlip = vx<0.0
vx[iFlip] = -vx[iFlip]
vy[iFlip] = -vy[iFlip]
layerSlope = np.mean(vy) / np.mean(vx)
a2 = math.atan2(np.mean(vy), np.mean(vx))
print("Error: %.1f°"%(math.degrees(abs(a-a2))))
如果與提供的示例相反,層的點之間的距離可能不相等,則必須在平均之前對矢量進行歸一化。
找到層的斜率后,作品的rest和沒有旋轉的情況一樣。 唯一的區別是,這次不是在點的 y 分量上進行聚類,而是在它們與通過原點且斜率等於找到的值的直線的垂直距離上進行聚類。
y2 = y - layerSlope * x
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.