[英]Fast performance array processing in Numpy/Python
我试图找出处理存储在几个numpy数组中的坐标和测量数据的最佳方式(最快的性能)。
我需要计算从每个网格点(附图中的绿色,lon,alt值)到每个测量位置(lat,lon,alt,附加图像中灰色的目标范围)的距离。 看到有数百个网格点,以及为每个网格点计算的数千个测量范围,我想以最有效的方式迭代数组
我试图决定如何存储网格和测量的LLA测量值,然后根据测量范围值和实际范围之间的差值计算网格上每个点的平均平方误差的理想方法。 。
关于如何最好地存储这些值,然后在网格中迭代以确定每次测量的范围的任何想法都将非常受欢迎。 谢谢!!!
目前,我正在使用2D网格网格来存储网格的LLA值
# Create a 2D Grid that will be used to store the MSE estimations
# First, create two 1-D arrays representing the X and Y coordinates of our grid
x_delta = abs(xmax-xmin)/gridsize_x
y_delta = abs(ymax-ymin)/gridsize_y
X = np.arange(xmin,xmax+x_delta,x_delta)
Y = np.arange(ymin,ymax+y_delta,y_delta)
# Next, pass arrays to meshgrid to return 2-D coordinate matrices from the 1-D coordinate arrays
grid_lon, grid_lat = np.meshgrid(X, Y)
我有测量类中存储的测量值的LLA点和范围值
measurement_lon = [measurement.gps.getlon() for measurement in target_measurements]
measurement_lat = [measurement.gps.getlat() for measurement in target_measurements]
measurement_range = [measurement.getrange() for measurement in target_measurements]
测量类
class RangeMeasurement:
def __init__(self, lat, lon, alt, range):
self.gps = GpsLocation(lat,lon,alt)
self.range = range
用于范围计算的非常糟糕的伪代码(迭代且非常慢)
for i in len(grid_lon):
for j in len(measurement_lat):
range_error += distance(grid_lon[i],grid_lat[i],measurement_lon[j],measurement_lat[j])-measurement_range[j]
我认为scipy.spatial.distance模块将帮助您解决这个问题: http ://docs.scipy.org/doc/scipy/reference/spatial.distance.html
您应该将点存储为具有2列和N行的2-d numpy数组,其中N是数组中的点数。 要将grid_lon和grid_lat转换为此格式,请使用
N1 = grid_lon.size
grid_point_array = np.hstack([grid_lon.reshape((N1,1)), grid_lat.reshape((N1,1))])
这将获取grid_lon中的所有值,这些值排列在与网格形状相同的矩形阵列中,并将它们放在具有一列和N行的数组中。 它对grid_lat也是一样的。 然后组合两个单列宽阵列以创建两列阵列。
可以使用类似的方法转换您的测量数据:
N2 = len(measurement_lon)
measurment_data_array = np.hstack([np.array(measurement_lon).reshape((N2,1)),
np.array(measurement_lat).reshape((N2,1))])
一旦您的数据采用这种格式,您就可以使用scipy.spatial.distance轻松找到每对点之间的距离:
d = scipy.spatial.distance.cdist(grid_point_array, measurement_data_array, 'euclidean')
d将是具有N1行和N2列的阵列,并且d [i,j]将是网格点i和测量点j之间的距离。
编辑感谢澄清范围错误。 听起来像一个有趣的项目。 这应该为您提供具有最小累积平方误差的网格点:
measurement_range_array = np.array(measurement_range)
flat_grid_idx = pow(measurement_range_array-d,2).sum(1).argmin()
这利用广播来获得点的测量范围与其与每个网格点的距离之间的差异。 然后对给定网格点的所有误差求和,得到的1-D数组应该是您正在寻找的累积误差。 调用argmin()来查找最小值的位置。 要从展平的索引中获取x和y网格坐标,请使用
grid_x = flat_grid_idx % gridsize_x
grid_y = flat_grid_idx // gridsize_x
(//是整数除法。)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.