繁体   English   中英

在Polygon内生成坐标

[英]Generate coordinates inside Polygon

我想将多边形的值合并到一个精细的规则网格中。 例如,我有以下坐标:

data = 2.353
data_lats = np.array([57.81000137,  58.15999985,  58.13000107,  57.77999878])
data_lons = np.array([148.67999268,  148.69999695,  148.47999573,  148.92999268])

我的常规网格看起来像这样:

delta = 0.25
grid_lons = np.arange(-180, 180, delta)
grid_lats = np.arange(90, -90, -delta)
llx, lly = np.meshgrid( grid_lons, grid_lats )
rows = lly.shape[0]
cols = llx.shape[1]
grid = np.zeros((rows,cols))

现在我可以很容易地找到与我的多边形中心对应的网格像素:

centerx, centery = np.mean(data_lons), np.mean(data_lats)
row = int(np.floor( centery/delta ) + (grid.shape[0]/2))
col = int(np.floor( centerx/delta ) + (grid.shape[1]/2))
grid[row,col] = data

但是,可能有几个网格像素仍然与多边形相交。 因此,我想在我的多边形(data_lons,data_lats)中生成一串坐标,并像以前一样找到它们对应的网格像素。 您是否建议随机或系统地生成坐标? 我失败了,但我还在努力。

注意:一个数据集包含大约80000个多边形,因此它必须非常快(几秒钟)。 这也是我选择这种方法的原因,因为它没有考虑重叠区域...(就像我之前的问题数据分类:不规则多边形到常规网格很慢)

您需要测试以下方法,看它是否足够快。 首先,你应该修改所有的lats和lons,使它们(可能是分数)索引进入你的网格:

idx_lats = (data_lats - lat_grid_start) / lat_grid step
idx_lons = (data_lons - lon_grid_start) / lon_grid step

接下来,我们要将多边形拆分为三角形。 对于任何凸多边形,您可以将多边形的中心作为所有三角形的一个顶点,然后将多边形的顶点作为连续对。 但是如果你的多边形都是四边形,那么将它们分成2个三角形会更快,第一个使用顶点0,1,2,第二个使用0,2,3。

要知道某个点是否在三角形内部,我将使用此处描述的重心坐标方法。 第一个函数检查一堆点是否在三角形内:

def check_in_triangle(x, y, x_tri, y_tri) :
    A = np.vstack((x_tri[0], y_tri[0]))
    lhs = np.vstack((x_tri[1:], y_tri[1:])) - A
    rhs = np.vstack((x, y)) - A
    uv = np.linalg.solve(lhs, rhs)
    # Equivalent to (uv[0] >= 0) & (uv[1] >= 0) & (uv[0] + uv[1] <= 1)
    return np.logical_and(uv >= 0, axis=0) & (np.sum(uv, axis=0) <= 1)

给定一个三角形的顶点,你可以通过在三角形的边界框中的格点上运行上面的函数来获得其中的格点:

def lattice_points_in_triangle(x_tri, y_tri) :
    x_grid = np.arange(np.ceil(np.min(x_tri)), np.floor(np.max(x_tri)) + 1)
    y_grid = np.arange(np.ceil(np.min(y_tri)), np.floor(np.max(y_tri)) + 1)
    x, y = np.meshgrid(x_grid, y_grid)
    x, y = x.reshape(-1), y.reshape(-1)
    idx = check_in_triangle(x, y, x_tri, y_tri)
    return x[idx], y[idx]

对于四边形,您只需将最后一个函数调用两次:

def lattice_points_in_quadrilateral(x_quad, y_quad) :
    return map(np.concatenate,
               zip(lattice_points_in_triangle(x_quad[:3], y_quad[:3]),
                   lattice_points_in_triangle(x_quad[[0, 2, 3]],
                                              y_quad[[0, 2, 3]])))

如果在示例数据上运行此代码,则会返回两个空数组:这是因为四边形点的顺序是令人惊讶的:索引0和1定义一个对角线,2和3定义另一个。 我上面的函数是期望在多边形周围排序顶点。 如果你真的以另一种方式做事,你需要在lattice_points_in_triangle内更改第二次调用lattice_points_in_quadrilateral以便使用的索引是[0, 1, 3] lattice_points_in_quadrilateral [0, 1, 3]而不是[0, 2, 3] lattice_points_in_quadrilateral [0, 2, 3]

而现在,随着这种变化:

>>> idx_lats = (data_lats - (-180) ) / 0.25
>>> idx_lons = (data_lons - (-90) ) / 0.25
>>> lattice_points_in_quadrilateral(idx_lats, idx_lons)
[array([952]), array([955])]

如果将网格的分辨率更改为0.1:

>>> idx_lats = (data_lats - (-180) ) / 0.1
>>> idx_lons = (data_lons - (-90) ) / 0.1
>>> lattice_points_in_quadrilateral(idx_lats, idx_lons)
[array([2381, 2380, 2381, 2379, 2380, 2381, 2378, 2379, 2378]),
 array([2385, 2386, 2386, 2387, 2387, 2387, 2388, 2388, 2389])]

时机方面,在我的系统中,这种方法对于您的需求来说太慢了10倍:

In [8]: %timeit lattice_points_in_quadrilateral(idx_lats, idx_lons)
1000 loops, best of 3: 269 us per loop

所以你看20秒以上。 处理你的80,000个多边形。

我通过简单地计算角像素之间的坐标来研究快速而肮脏的解决方案。 看一看:

dlats = np.zeros((data_lats.shape[0],4))+np.nan
dlons = np.zeros((data_lons.shape[0],4))+np.nan
idx = [0,1,3,2,0] #rearrange the corner pixels

for cc in range(4):
    dlats[:,cc] = np.mean((data_lats[:,idx[cc]],data_lats[:,idx[cc+1]]), axis=0)
    dlons[:,cc] = np.mean((data_lons[:,idx[cc]],data_lons[:,idx[cc+1]]), axis=0)

data_lats = np.column_stack(( data_lats, dlats ))
data_lons = np.column_stack(( data_lons, dlons ))

因此,红点代表原始角 - 蓝色代表它们之间的中间像素。

在此输入图像描述

我可以再一次这样做并包括中心像素(geo [:,[4,9]])

dlats = np.zeros((data.shape[0],8))
dlons = np.zeros((data.shape[0],8))

for cc in range(8):
    dlats[:,cc] = np.mean((data_lats[:,cc], geo[:,4]), axis=0)
    dlons[:,cc] = np.mean((data_lons[:,cc], geo[:,9]), axis=0)

data_lats = np.column_stack(( data_lats, dlats, geo[:,4] ))
data_lons = np.column_stack(( data_lons, dlons, geo[:,9] ))

在此输入图像描述

这非常好用,我可以将每个点直接指定给它对应的网格像素,如下所示:

row = np.floor( data_lats/delta ) + (llx.shape[0]/2)
col = np.floor( data_lons/delta ) + (llx.shape[1]/2)

然而最后的装箱现在需要大约7秒! 如何加快此代码的速度:

for ii in np.arange(len(data)):
    for cc in np.arange(data_lats.shape[1]):
        final_grid[row[ii,cc],col[ii,cc]] += data[ii]
        final_grid_counts[row[ii,cc],col[ii,cc]] += 1

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM