[英]Pandas: Check if row has similar values
我正在使用熊猫生成地图的叠加层并使用:
if ((df['latitude'] == new_latitude) & (df['longitude'] == new_longitude)).any():
continue
确保我不会产生重复的分数。 但是我开始产生的点与已经产生的点相差0.001(经度,纬度或两者)。 如何以与上述类似的方式防止这种情况?
您可以从整个序列中减去IIUC,然后仅过滤点:
thresh = 0.001
lat = df.loc[(df['latitude'] - new_latitude).abs() > thresh, 'latitude']
lon = df.loc[(df['longtitude'] - new_longtitude).abs() > thresh, 'longtitude']
这使用abs
来获取绝对值,以生成布尔掩码并过滤掉所有重复的值和接近重复的值。
您可以将numpy.isclose
函数与atol
设置为您的精度:
import numpy as np
prec = 0.001
np.isclose(df['latitude'], new_latitude, atol=prec)
if ((np.isclose(df['latitude'], new_latitude, prec) & (np.isclose(df['longitude'], new_longitude, prec)).any():
continue
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.