簡體   English   中英

SAS / R計算兩組之間的距離

[英]SAS/R calculate distance between two groups

我想計算兩組之間的距離。 我很困擾。

我有兩個數據集。 一個是關於公司,一個是關於員工。

我想弄清楚他們的年齡(聘用雇員的公司和雇員的年齡)如何相似。 我想我也需要標准化。

  1. 計算每個人與公司之間的歐式距離。 (公司中有4-5人)
  2. 計算每個人與公司之間在行業層面上的歐式距離。

我的數據集是這樣的:

person person_age    company company_age industry              

1        50             1       5         1

2        40             1       5         1

3        30             2        1        1

4        20             2        1        1

5        25             3        8        2

以下代碼將重現我的data.frame:

person <- 1:5
person_age <- c(50,40,30,20,25)
company <- c(1,1,2,2,3)
company_age <- c(5,5,1,1,8)
industry <- c(1,1,1,1,2)
myData <- data.frame(person, person_age, company, company_age, industry)

請幫我。 我不介意使用SAS或R。我很困惑。

因此,如果您只想要每個人的年齡上的歐幾里得距離,您可以執行以下操作:

d <- dist(myData[c("person","person_age")])

您的問題仍然異常嚴重。 例如,“計算每個人與一家公司之間的歐幾里得距離”是什么意思?

如果您只想知道每個人與他們工作的公司之間的距離,可以將其編碼為:

 with(myData, ((person_age - company_age)^2)^.5 ) 

這只是二維歐幾里得距離公式

這篇文章討論有關計算歐幾里得距離。 將數據轉換為兩個向量,然后按照以下步驟操作。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM