我可以使用什么数据结构来计算国家/地区代码的出现次数？

Question

我需要一些最不合适的数据结构。

以下是我正在使用的内容：我有一堆数据处理行，每行都有自己的国家/地区代码。

我希望得到每个国家/地区代码在整个过程中重复多少次。

Answer 1

您可以尝试HashMap 。 使用HashMap，您可以使用国家/地区代码作为密钥，并将每个显示的次数计为该密钥中存储的值。 如果您是第一次遇到特定的国家/地区代码，请将其插入到地图中，初始值为1; 否则，增加现有值。

HashMap<String, Integer> myMap = new HashMap<String, Integer>();

for (... record : records) {
    String countryCode = record.getCountryCode();

    int curVal;
    if (myMap.containsKey(countryCode)) {
        curVal = myMap.get(countryCode);
        myMap.put(countryCode, curVal + 1);
    } else {
        myMap.put(countryCode, 1);
    }
}

// myMap now contains the count of each country code, which
// can be used for whatever purpose needed.

Answer 2

我会使用HashMap，国家代码作为键，计数作为值。 从您的集合构建地图，并增加计数（如果它已经在地图中）。

Answer 3

使用国家/地区代码String作为键创建映射，将当前计数作为值。

当然，您意识到您可以直接从SQL查询中获取此类内容：

select country_code, count(country_code)
from your_table
group by country_code
order by country_code

您将获得包含国家/地区代码和计数对的ResultSet。 这很容易加载到地图中。

Answer 4

Guava提供AtomicLongMap

Answer 5

用HashMap之外的其他东西来完成答案。

如果您的国家/地区代码列表很容易变成非稀疏的数字序列，请尝试使用int[]或long[] 。
如果您的国家/地区代码范围稀疏，但没有很多元素，请创建CountryCode 枚举并使用EnumMap存储金额：

例：

Map<CountryCode, Long> countryCodeAppearances = 
       new EnumMap<CountryCode,Long>(CountryCode.class);

轻量级数据结构将表现更好，并减少内存/垃圾收集开销。 所以，数组应该是最快的。 EnumMap是一种隐藏的宝石，在适当的情况下也可以为您带来性能提升。

我可以使用什么数据结构来计算国家/地区代码的出现次数？

问题描述

5 个解决方案

解决方案1
8 已采纳 2011-09-21 19:25:57

解决方案2
3 2011-09-21 19:25:35

解决方案3
2 2011-09-21 19:24:15

解决方案4
0 2014-09-22 13:05:34

解决方案5
0 2011-09-21 19:59:40

我可以使用什么数据结构来计算国家/地区代码的出现次数？

问题描述

5 个解决方案

解决方案1 8 已采纳 2011-09-21 19:25:57

解决方案2 3 2011-09-21 19:25:35

解决方案3 2 2011-09-21 19:24:15

解决方案4 0 2014-09-22 13:05:34

解决方案5 0 2011-09-21 19:59:40

解决方案1
8 已采纳 2011-09-21 19:25:57

解决方案2
3 2011-09-21 19:25:35

解决方案3
2 2011-09-21 19:24:15

解决方案4
0 2014-09-22 13:05:34

解决方案5
0 2011-09-21 19:59:40