[英]removing duplicates from an arraylist
我正在尝试从arraylist中删除重复的对象,请参见下面的代码:
ArrayList<Customer> customers=new ArrayList<Customer>();
for(int i=0;i<accounts.size();i++){
customers.add(accounts.get(i).getCustomer());
}
for(int i=0;i<customers.size();i++){
for(int j=i+1;j<customers.size();j++){
if(customers.get(i).getSocialSecurityNo().compareTo(customers.get(j).getSocialSecurityNo())==0){
if(customers.get(i).getLastName().compareToIgnoreCase(customers.get(j).getLastName())==0){
if(customers.get(i).getFirstName().compareToIgnoreCase(customers.get(j).getFirstName())==0){
customers.remove(j);
}
}
}
}
}
但是,似乎列表中的最后一个对象没有被处理。 也许有人可以指出错误
尝试添加j--;
删除项目后。 这将为您重新编制索引并解决您的问题。
基本缺点是,由于ListArray是可变的,因此一旦删除一个元素,就必须重新调整索引。
if(customers.get(i).getFirstName().compareToIgnoreCase(customers.get(j).getFirstName())==0){
customers.remove(j--);
}
也尝试从您的i循环中减去一个:
for(int i=0;i<customers.size()-1;i++){
for(int j=i+1;j<customers.size();j++){
public static void removeDuplicates(ArrayList list) {
HashSet set = new HashSet(list);
list.clear();
list.addAll(set);
}
覆盖等于和哈希码正确
custormers =新的ArrayList(新的HashSet(客户))
确保equals和hashmethod正确实现
下面的代码为我工作。 试试看。 您可以操作compare方法以适合您的喜好ArrayList customers = .....;
Set customerlist = new TreeSet(new Comparator(){ArrayList customers = .....;
Set customerlist = new TreeSet(new Comparator(){
@Override public int compare(Customer c1, Customer c2) { return c1.getSocialSecurityNo().compareTo(c2.getSocialSecurityNo()); } }); customerlist.addAll(customers); customers.clear(); customers.addAll(customerlist);
造成麻烦的是您的int j=i+1
。 您需要使用每次迭代的客户列表的最后一个值进行测试。
在将它们添加到上述循环中的列表之前,为什么不检查
if(!cutomers.contains(accounts.get(i).getCustomer())
{
//add them if it doesn't contain
}
它应该可以避免您进行第二次循环
编辑:需要重写equals方法。
因此,关于正确执行此操作:
您的Customer对象应该具有equals()和hashCode()方法,它们可以进行比较。 (或者,每个客户只具有一个Customer对象,这意味着必须调整您的数据模型。然后将使用默认的hashCode / equals。)
如果有,可以将三个嵌套的if替换为一个:
if(customers.get(i).equals(customers.get(j)) {
customers.remove(j);
}
这还不能解决您的问题,但是可以使您更清晰地查看它。 如果查看将哪些对象与其他对象进行比较,则将看到从列表中每次删除对象之后,下一个对象与刚刚删除的对象具有相同的索引,并且不会将当前对象与它。 如前所述, j--
删除后即可解决。
性能更高的解决方案将使用Set(保证不包含重复项)。 在您的情况下, HashSet<Customer>
或LinkedHashSet<Customer>
(如果您关心订单)会很好。
然后,您的整个代码将归结为:
Set<Customer> customerSet = new HashSet<Customer>();
for(Account acc : accounts){
customerSet.add(acc.getCustomer());
}
List<Customer> customers = new ArrayList<Customer>(customerSet);
如果您确实不需要列表(即索引访问),则省略最后一行,而只需使用该集即可。
正如其他人提到的,我的第一个想法是使用Sets。 另一种方法是使用Java的foreach版本,而不是使用索引。 通用方法:
public static ArrayList removeDuplicates(ArrayList origList) {
ArrayList newList = new ArrayList();
for (Object m : origList) {
if (!newList.contains(m)) {
newList.add(m);
}
}
return newList;
}
在测试中,我只使用了Strings。 我建议在适合类型安全的地方将客户插入代码中。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.