繁体   English   中英

如何在 dataframe 中基于多列组合两行?

[英]How to combine two rows based on multiple columns in a dataframe?

标题说明了一切,我有一个大型数据集,其中包括工厂和纬度和经度等。 我发现一些工厂的经纬度相同,尽管它们的名称略有不同。 如何在 R 中组合具有相同经纬度的工厂行?

纬度 经度 ID
一个。 12.34。 7.86。 不适用
一个。 12.34。 7.86。 4
b 47.56。 27.07。 5.

我正在寻找的 output 是:

纬度 经度 ID
一个。 12.34。 7.86。 4
湾。 47.56。 27.07。 5

底座 R

aggregate(.~latitude+longitude,df,tail,1)

  latitude longitude mill ID
1    12.34      7.86   A.  4
2    47.56     27.07    b  5

我们可以用

library(dplyr)
df1 %>%
  arrange(latitude, longitude, is.na(ID)) %>%
  distinct(latitude, longitude, .keep_all = TRUE)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM