[英]SAS/R calculate distance between two groups
我想計算兩組之間的距離。 我很困擾。
我有兩個數據集。 一個是關於公司,一個是關於員工。
我想弄清楚他們的年齡(聘用雇員的公司和雇員的年齡)如何相似。 我想我也需要標准化。
我的數據集是這樣的:
person person_age company company_age industry
1 50 1 5 1
2 40 1 5 1
3 30 2 1 1
4 20 2 1 1
5 25 3 8 2
以下代碼將重現我的data.frame:
person <- 1:5
person_age <- c(50,40,30,20,25)
company <- c(1,1,2,2,3)
company_age <- c(5,5,1,1,8)
industry <- c(1,1,1,1,2)
myData <- data.frame(person, person_age, company, company_age, industry)
請幫我。 我不介意使用SAS或R。我很困惑。
因此,如果您只想要每個人的年齡上的歐幾里得距離,您可以執行以下操作:
d <- dist(myData[c("person","person_age")])
您的問題仍然異常嚴重。 例如,“計算每個人與一家公司之間的歐幾里得距離”是什么意思?
如果您只想知道每個人與他們工作的公司之間的距離,可以將其編碼為:
with(myData, ((person_age - company_age)^2)^.5 )
這只是二維歐幾里得距離公式
這篇文章討論有關計算歐幾里得距離。 將數據轉換為兩個向量,然后按照以下步驟操作。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.