[英]Clustering geo data in mongodb
我们有一个拥有> 200K行的mongodb数据库,每个行包含一个点位置(lat,lng)。 我们想创建一个指定地理点和半径的查询,并返回一个簇列表。 每个群集基本上是彼此靠近的位置的聚合。
第一个问题:mongodb是否可以为我们自动创建和维护这些集群? 如果是,我们如何查询mongodb以返回特定地理位置的聚类(而不是实际数据点)。 每个返回的集群都有一个位置和实际数据点的数量(地理标记的行)。 基本上,我们希望它返回k-means聚类算法的等价物。
我们已经创建了一个mongodb geoHaystack索引,似乎是对行进行聚类,但不确定如何使用它来实现上述查询:
db.locations.createIndex({'position':“geoHaystack”,type:1},{bucketSize:1})
或者,我们可以动态使用聚类算法(如https://github.com/spember/geo-cluster)来生成这些聚类,但我假设这将是一个非常缓慢的过程。
有关如何最好地实现此类查询的任何建议?
在MongoDB中, geoHaystack
索引有另一个目的 - 它是一个特殊的索引,经过优化可以在小区域内返回结果。 我认为不能在这里使用。
所以,我认为你可以检索所有点并使用k-means进行聚类。 那应该很快。 之后,您可以将它们另存为其他实体(例如Polygon)并在任何需要的地方使用它。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.