如何在R中拉出一定距離內的點？

Question

我有一個由（x，y）給出的參數空間， x值為1:5 ， y值為1:8 。 假設我的當前點p位於(2,5) （它以紅色着色）。 我的目標是嘗試在距離點p （藍色點）一個單位距離內拉出所有點。

我想知道是否有一種有效的方法來做到這一點。 假設我的變量以下列方式存儲：

xrange <- 1:5
yrange <- 1:8
grid <- expand.grid(xrange,yrange)
p <- data.frame(x=2,y=5)

我想以這種方式存儲p下面的其他點：

res <- data.frame(x=c(1,1,1,2,2,3,3,3),y=c(4,6,4,5,6,4,5,6))
res <- rbind(p,res)
> res
  x y
1 2 5
2 1 4
3 1 6
4 1 4
5 2 5
6 2 6
7 3 4
8 3 5
9 3 6

最終目標是使參數空間超過2維。 所以我最終希望找到所有與歐幾里德距離相距s點，並且類似地得到一個結果數據幀，每列是參數空間中的一個參數，每一行都是一個帶坐標的點(x,y,z,..,etc)從其列。

編輯我已經嘗試了以下實現，如果我想要一個圓或歐幾里德距離s ，這似乎工作。 我不確定解決方案的效率如何。

eucdist <- function(z,p){

      return(dist(rbind(z, p)))
    }

# in this case s=1 since that is the <= condition
res <- do.call(rbind,lapply(1:nrow(grid),function(m) if(eucdist(as.numeric(grid[m,]),as.numeric(p[1,])) <= 1){return(grid[m,])}))

更多信息：目前，我的參數空間是離散的，如上圖所示。 最終，一些參數也將與離散參數連續混合。 非常感謝！

Answer 1

可以通過以下方式有效地計算網格上每個點與目標點p的歐氏距離：

dist <- sqrt(rowSums(mapply(function(x,y) (x-y)^2, grid, p)))

基本上，內部mapply調用將產生與grid大小相同的矩陣，但該點與該維度中的目標點的距離為平方; 然后rowSums和sqrt有效地計算歐氏距離。

在這種情況下，您將包含與目標點的sqrt(2)歐幾里德距離的任何內容：

grid[dist < 1.5,]
#    Var1 Var2
# 16    1    4
# 17    2    4
# 18    3    4
# 21    1    5
# 22    2    5
# 23    3    5
# 26    1    6
# 27    2    6
# 28    3    6

使用mapply （在維度上操作）和rowSums比使用遍歷網格上的各個點的方法更有效，計算到目標點的距離。 要看到這一點，請考慮一個稍大的示例，其中包含三個維度中的1000個隨機分布點：

set.seed(144)
grid <- data.frame(x=rnorm(1000), y=rnorm(1000), z=rnorm(1000))
p <- data.frame(x=rnorm(1), y=rnorm(1), z=rnorm(1))
lim <- 1.5
byrow <- function(grid, p, lim) grid[apply(grid, 1, function(x) sqrt(sum((x-p)^2))) < lim,]
vectorized <- function(grid, p, lim) grid[sqrt(rowSums(mapply(function(x,y) (x-y)^2, grid, p))) < lim,]
identical(byrow(grid, p, lim), vectorized(grid, p, lim))
[1] TRUE
library(microbenchmark)
# Unit: microseconds
#                      expr       min         lq        mean      median         uq        max neval
#       byrow(grid, p, lim) 446792.71 473428.137 500680.0431 495824.7765 521185.093 579999.745    10
#  vectorized(grid, p, lim)    855.33    881.981    954.1773    907.3805   1081.658   1108.679    10

矢量化方法比循環遍歷行的方法快500倍。

這種方法可用於你有更多點（本例中為100萬）的情況：

set.seed(144)
grid <- data.frame(x=rnorm(1000000), y=rnorm(1000000), z=rnorm(1000000))
p <- data.frame(x=rnorm(1), y=rnorm(1), z=rnorm(1))
lim <- 1.5
system.time(vectorized(grid, p, lim))
#    user  system elapsed 
#   3.466   0.136   3.632

Answer 2

以下是使用包FNN 。 結果與您的結果不同，因為您的解決方案有（1 4）和（2 5）兩次。 該解決方案也適用於邊界數據。 如果x或y為1，或者在矩陣的邊緣，則只有6個最近鄰居。

library(FNN)
x <-2
y <- 5
pt <-grid[grid$Var1==x & grid$Var2==y ,] #target point
distance <-knnx.dist(grid,pt,k=9) #distance from pt
k <-length(distance[distance<2]) #distance is less than 2. Useful for border data 
nearest <-knnx.index(grid,pt,k=k) #find index of k nearest neighbors

grid[nearest,]

   Var1 Var2
22    2    5
23    3    5
27    2    6
21    1    5
17    2    4
26    1    6
28    3    6
18    3    4
16    1    4

我看到你也要求更高的尺寸。 它仍然可以用於跟隨變化：

x <-2
y <- 5
z <-3
pt <-grid[grid$Var1==x & grid$Var2==y & grid$Var3==z ,] #3-dimensional point
distance <-knnx.dist(grid,pt,k=27) #increase to k=27
k <-length(distance[distance<2])
nearest <-knnx.index(grid,pt,k=k)
grid[nearest,]

如何在R中拉出一定距離內的點？

問題描述

2 個解決方案

解決方案1
2 已采納 2015-12-15 20:43:09

解決方案2
0 2015-12-15 20:48:24

如何在R中拉出一定距離內的點？

問題描述

2 個解決方案

解決方案1 2 已采納 2015-12-15 20:43:09

解決方案2 0 2015-12-15 20:48:24

解決方案1
2 已采納 2015-12-15 20:43:09

解決方案2
0 2015-12-15 20:48:24