簡體   English   中英

兩個不同變量之間的哪個距離函數?

[英]which distance function between two different variables?

計算兩個物體之間距離的最佳度量是什么? 對象由四個參數(在過程之前和之后的兩個相同變量)表示。

目標是在整個集合中將數據點成對分配。 另外,每對數據點應彼此接近/相似。

數據

正態分布和歸一化分布:軸上的大小不同時外觀相同。

功能縮放

您可以使用任何測量功能。 人們最常使用歐幾里德距離,但是最佳距離很大程度上取決於情況。 否則,您始終可以嘗試所有功能以觀察最准確的功能。

我建議您做的事情就是縮放功能(如果您有多個功能)。 通過縮放要素,可以確定每個要素在歐幾里得公式中的“影響力”。

如果您擁有一項似乎比另一項重要得多的功能,則可以將其縮放到稍大的數字。 如果所有要素的權重相等,則應將它們全部縮小為相同的數字范圍,通常為[-0.5, 0.5]

兩點之間並沒有真正的“馬哈拉諾比斯距離”,一些特征縮放可能是您最好的選擇。 同樣,最近鄰居似乎並不是解決此問題的最佳算法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM