繁体   English   中英

如何在字符串中获取 std::set 字符作为字符串?

[英]How can I get a std::set of characters in a string, as strings?

我有一个std::string 我想要其中的一组唯一字符,每个字符都表示为std::string

我可以轻松获得字符集:

std::string some_string = ...
std::set<char> char_set(some_string.begin(), some_string.end());

我可以将它们转换为这样的字符串:

std::set<std::string> string_set;
for (char c: char_set) {
    string_set.emplace(1, c);
}

但这样的做法似乎很别扭。 有没有更好的(最好是标准库单行)方法来做到这一点?

transform可以用作单行:

transform(begin(some_string), end(some_string),
          inserter(string_set, begin(string_set)),
          [] (char c) -> std::string { return {c}; });

我不建议使用这个解决方案,因为它非常难以理解。 通常,您希望编写直观且易于理解的代码。 您在答案中所写的内容已经足够了,我不建议您寻找捷径,以便在牺牲清晰度的同时将代码缩减为单线。

您可以使用:

std::for_each(some_string.begin(), some_string.end(),
              [&string_set] (char c) -> void { string_set.insert(std::string({c}));});

您还可以使用:

   for (char c: some_string)
   {
      string_set.insert(std::string{c});
   }

工作计划:

#include <iostream>
#include <string>
#include <set>
#include <algorithm>

int main()
{
   std::string some_string = "I want the set of unique characters in it";
   std::set<std::string> string_set;
   for (char c: some_string)
   {
      string_set.insert(std::string{c});
   }

   for (std::string const& s: string_set)
   {
      std::cout << s << std::endl;
   }
}

输出:

I
a
c
e
f
h
i
n
o
q
r
s
t
u
w

有没有更好的(最好的标准库单行)方式来做到这一点?

不会。您在C ++标准库中找到的任何内容都适用于更复杂的情况,它们会简化您必须编写的代码。 在您的情况下, 您的代码更简单 试图强迫自己使用标准库中的某些内容会使您的代码更加复杂。

已经发布了三个答案来证明这一点 - 它们完全符合您的要求,但它们几乎无法读取,并且当编译器无法优化它们时会增加不必要的开销。

你的for循环是更好的解决方案。 它很简单,它向读者传达了意图,编译器很容易进行优化。 没有理由浪费时间寻找一个简单问题的更复杂的解决方案。

所有解决方案都是正确的,但您应该始终选择最简单的正确解决方案。 写更少的代码,而不是更多。

我怀疑你想要的是一个好主意,如果你真的坚持,你可以创建一个支持从char隐式转换的类,隐式转换为std::string ,并且可以与其自身的另一个实例或字符串进行比较:

class cvt {
    char val;
public:
    cvt(char val) : val(val) {}

    bool operator<(cvt other) const { return val < other.val; }

    bool operator<(std::string const &s) const {
        return !s.empty() && val < s[0];
    }
    friend bool operator<(std::string const &s, cvt const &c) {
        return !s.empty() && s[0] < c.val;
    }
    operator std::string() const { return std::string(1, val); }
};

有了这个,我们可以创建我们的set<cvt> ,但是使用它就像它是一个set<std::string> (因为它中的元素可以/将隐式转换为std::string并与std::string进行比较):

int main() {
    std::string some_string = "ZABCDECD";

    // Create our (sort of) set<string> from characters in some_string:
    std::set<cvt> char_set(some_string.begin(), some_string.end());

    // An actual set<string> to use with it:    
    std::set<std::string> strings{ "A", "C", "E", "F", "Y" };

    // demonstrate compatibility:
    std::set_intersection(char_set.begin(), char_set.end(), strings.begin(), strings.end(),
        std::ostream_iterator<std::string>(std::cout, "\n"));
}

住在Coliru

如果我们在Godbolt上查看为此生成的代码 ,我们会发现它几乎都是语法糖 - 实际为cvt类生成的唯一代码是复制字节以从char创建cvt的微小位,并将cvtstring进行比较。 其他一切都已经过优化。

如果我们确定我们的字符串不会为空,我们可以简化比较以return val < s[0]; return s[0] < val; 在这种情况下,它们也会被优化掉,所以使用cvt生成的唯一代码是从源复制一个字节来构造一个cvt对象。

根据您的想法,这可能符合您的要求。 这是一个相当多的额外输入,但它很好地优化 - 到将cvt与字符串进行比较可能比将stringstring进行比较要快得多。 到目前为止,最大的缺点可能源于质疑你的基本前提,并想知道为什么你不会只写一个循环并完成它。

string setToString(const set<char> &s) {
    string str = "";
    std::accumulate(s.begin(), s.end(), str);
    return str;
}

也许这可能有用。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM