从字符串中删除重复字符

Question

我有一个字符串，例如acaddef或bbaaddgg 。 我必须尽快删除所有重复的字符。 因此，例如， pooaatat之后应该看起来像poat和ggaatpop应该看起来像gatpo 。 是否有任何内置函数或算法可以快速完成？ 我试图搜索STL，但没有满意的结果。

Answer 1

好的，所以这里有4种不同的解决方案。

固定阵列

std::string str = "pooaatat";

// Prints "poat"
short count[256] = {0};
std::copy_if(str.begin(), str.end(), std::ostream_iterator<char>(std::cout),
             [&](unsigned char c) { return count[c]++ == 0; });

计算算法+迭代器

std::string str = "pooaatat";

// Prints "poat"
std::string::iterator iter = str.begin();
std::copy_if(str.begin(), str.end(), std::ostream_iterator<char>(std::cout),
             [&](char c) { return !std::count(str.begin(), iter++, c); });

无序集

std::string str = "pooaatat";

// Prints "poat"
std::unordered_set<char> container;
std::copy_if(str.begin(), str.end(), std::ostream_iterator<char>(std::cout),
             [&](char c) { return container.insert(c).second; });

无序地图

std::string str = "pooaatat";

// Prints "poat"
std::unordered_map<char, int> container;
std::copy_if(str.begin(), str.end(), std::ostream_iterator<char>(std::cout),
             [&](char c) { return container[c]++ == 0; });

Answer 2

AFAIK，没有内置的算法来做到这一点。 如果要仅删除连续的重复字符，则std::unique算法有效。

但是，您可以遵循以下简单方法：

如果字符串仅包含ASCII字符，则可以形成一个布尔数组A [256]，表示是否已经遇到相应的字符。

然后，如果A [character]仍为0（并使A [character] = 1），则只需遍历输入字符串并将字符复制到输出。

如果字符串包含任意字符，那么您可以使用std::unordered_map或char的std::map到int。

Answer 3

内置的正则表达式应该是高效的，即

#include <regex>
[...]

const std::regex pattern("([\\w ])(?!\\1)");
string s = "ssha3akjssss42jj 234444 203488842882387 heeelloooo";
std::string result;

for (std::sregex_iterator i(s.begin(), s.end(), pattern), end; i != end; ++i)
    result.append((*i)[1]);

std::cout << result << std::endl;

当然，您可以根据需要修改cpaturing组。 好消息是它已经在Visual Studio 2010 tr1中得到支持。 但是，gcc 4.8似乎与正则表达式迭代器有问题。

从字符串中删除重复字符

问题描述

3 个解决方案

解决方案1
3 已采纳 2014-09-20 09:03:51

固定阵列

计算算法+迭代器

无序集

无序地图

解决方案2
3 2014-09-20 09:07:55

解决方案3
0 2014-09-20 13:49:19

从字符串中删除重复字符

问题描述

3 个解决方案

解决方案1 3 已采纳 2014-09-20 09:03:51

固定阵列

计算算法+迭代器

无序集

无序地图

解决方案2 3 2014-09-20 09:07:55

解决方案3 0 2014-09-20 13:49:19

解决方案1
3 已采纳 2014-09-20 09:03:51

解决方案2
3 2014-09-20 09:07:55

解决方案3
0 2014-09-20 13:49:19