繁体   English   中英

如何按不同 std::vector 的值对 std::vector 进行排序?

[英]How do I sort a std::vector by the values of a different std::vector?

我有几个std::vector ,长度都一样。 我想对这些向量之一进行排序,并对所有其他向量应用相同的转换。 有没有一种巧妙的方法来做到这一点? (最好使用 STL 或 Boost)? 一些向量包含int s,其中一些包含std::string s。

伪代码:

std::vector<int> Index = { 3, 1, 2 };
std::vector<std::string> Values = { "Third", "First", "Second" };

Transformation = sort(Index);
Index is now { 1, 2, 3};

... magic happens as Transformation is applied to Values ...
Values are now { "First", "Second", "Third" };

friol 的方法与您的方法结合使用时很好。 首先,构建一个由数字 1... n组成的向量,以及向量中指示排序顺序的元素:

typedef vector<int>::const_iterator myiter;

vector<pair<size_t, myiter> > order(Index.size());

size_t n = 0;
for (myiter it = Index.begin(); it != Index.end(); ++it, ++n)
    order[n] = make_pair(n, it);

现在您可以使用自定义排序器对这个数组进行排序:

struct ordering {
    bool operator ()(pair<size_t, myiter> const& a, pair<size_t, myiter> const& b) {
        return *(a.second) < *(b.second);
    }
};

sort(order.begin(), order.end(), ordering());

现在您已经在 order 中捕获了重新排列的order (更准确地说,在项目的第一个组件中)。 您现在可以使用此顺序对其他向量进行排序。 可能有一个非常聪明的就地变体同时运行,但在其他人提出它之前,这里有一个不是就地变体。 它使用order作为每个元素新索引的查找表。

template <typename T>
vector<T> sort_from_ref(
    vector<T> const& in,
    vector<pair<size_t, myiter> > const& reference
) {
    vector<T> ret(in.size());

    size_t const size = in.size();
    for (size_t i = 0; i < size; ++i)
        ret[i] = in[reference[i].first];

    return ret;
}
typedef std::vector<int> int_vec_t;
typedef std::vector<std::string> str_vec_t;
typedef std::vector<size_t> index_vec_t;

class SequenceGen {
  public:
    SequenceGen (int start = 0) : current(start) { }
    int operator() () { return current++; }
  private:
    int current;
};

class Comp{
    int_vec_t& _v;
  public:
    Comp(int_vec_t& v) : _v(v) {}
    bool operator()(size_t i, size_t j){
         return _v[i] < _v[j];
   }
};

index_vec_t indices(3);
std::generate(indices.begin(), indices.end(), SequenceGen(0));
//indices are {0, 1, 2}

int_vec_t Index = { 3, 1, 2 };
str_vec_t Values = { "Third", "First", "Second" };

std::sort(indices.begin(), indices.end(), Comp(Index));
//now indices are {1,2,0}

现在您可以使用“索引”向量来索引“值”向量。

将您的值放入Boost Multi-Index 容器中,然后迭代以按您想要的顺序读取值。 如果您愿意,您甚至可以将它们复制到另一个向量。

我想到的只有一个粗略的解决方案:创建一个向量,它是所有其他向量的总和(一个结构向量,如 {3,Third,...},{1,First,...}),然后对其进行排序向量,然后再次拆分结构。

Boost 或使用标准库可能有更好的解决方案。

我认为您真正需要的是(如果我错了,请纠正我)是一种以某种顺序访问容器元素的方法。

我不会重新排列我的原始集合,而是从数据库设计中借用一个概念:保留一个索引,按特定标准排序。 这个索引是一个额外的间接索引,提供了很大的灵活性。

这样就可以根据类的不同成员生成多个索引。

using namespace std;

template< typename Iterator, typename Comparator >
struct Index {
    vector<Iterator> v;

    Index( Iterator from, Iterator end, Comparator& c ){
        v.reserve( std::distance(from,end) );
        for( ; from != end; ++from ){
            v.push_back(from); // no deref!
        }
        sort( v.begin(), v.end(), c );
    }

};

template< typename Iterator, typename Comparator >
Index<Iterator,Comparator> index ( Iterator from, Iterator end, Comparator& c ){
    return Index<Iterator,Comparator>(from,end,c);
}

struct mytype {
    string name;
    double number;
};

template< typename Iter >
struct NameLess : public binary_function<Iter, Iter, bool> {
    bool operator()( const Iter& t1, const Iter& t2 ) const { return t1->name < t2->name; }
};

template< typename Iter >
struct NumLess : public binary_function<Iter, Iter, bool> {
    bool operator()( const Iter& t1, const Iter& t2 ) const { return t1->number < t2->number; }
};

void indices() {

    mytype v[] =    { { "me"    ,  0.0 }
                    , { "you"   ,  1.0 }
                    , { "them"  , -1.0 }
                    };
    mytype* vend = v + _countof(v);

    Index<mytype*, NameLess<mytype*> > byname( v, vend, NameLess<mytype*>() );
    Index<mytype*, NumLess <mytype*> > bynum ( v, vend, NumLess <mytype*>() );

    assert( byname.v[0] == v+0 );
    assert( byname.v[1] == v+2 );
    assert( byname.v[2] == v+1 );

    assert( bynum.v[0] == v+2 );
    assert( bynum.v[1] == v+0 );
    assert( bynum.v[2] == v+1 );

}

您可能可以定义一个自定义的“外观”迭代器来满足您的需求。 它会将迭代器存储到所有向量,或​​者从第一个向量的偏移量中导出除第一个向量之外的所有向量的迭代器。 棘手的部分是迭代器取消引用的内容:想像 boost::tuple 之类的东西并巧妙地使用 boost::tie。 (如果你想扩展这个想法,你可以使用模板递归地构建这些迭代器类型,但你可能永远不想写下它的类型 - 所以你要么需要 c++0x auto 或一个包装函数来进行范围排序)

如果您只是想根据单个keys向量的 来遍历所有向量,那么 xtofl 答案的稍微紧凑一点的变体。 创建一个置换向量并使用它来索引其他向量。

#include <boost/iterator/counting_iterator.hpp>
#include <vector>
#include <algorithm>

std::vector<double> keys = ...
std::vector<double> values = ...

std::vector<size_t> indices(boost::counting_iterator<size_t>(0u), boost::counting_iterator<size_t>(keys.size()));
std::sort(begin(indices), end(indices), [&](size_t lhs, size_t rhs) {
    return keys[lhs] < keys[rhs];
});

// Now to iterate through the values array.
for (size_t i: indices)
{
    std::cout << values[i] << std::endl;
}

这将是 Konrad 答案的附录,因为它是一种将排序顺序应用于向量的就地变体的方法。 无论如何,因为编辑不会通过,我会把它放在这里

这是一个时间复杂度稍高的就地变体,这是由于检查布尔值的原始操作。 额外的空间复杂度是一个向量,它可以是一个空间高效的编译器相关实现。 如果可以修改给定的顺序本身,则可以消除向量的复杂性。

这是一个时间复杂度稍高的就地变体,这是由于检查布尔值的原始操作。 额外的空间复杂度是一个向量,它可以是一个空间高效的编译器相关实现。 如果可以修改给定的顺序本身,则可以消除向量的复杂性。 这是算法正在做什么的一个例子。 如果顺序是 3 0 4 1 2,则由位置索引指示的元素的移动将是 3--->0; 0--->1; 1--->3; 2--->4; 4--->2。

template<typename T>
struct applyOrderinPlace
{
void operator()(const vector<size_t>& order, vector<T>& vectoOrder)
{
vector<bool> indicator(order.size(),0);
size_t start = 0, cur = 0, next = order[cur];
size_t indx = 0;
T tmp; 

while(indx < order.size())
{
//find unprocessed index
if(indicator[indx])
{   
++indx;
continue;
}

start = indx;
cur = start;
next = order[cur];
tmp = vectoOrder[start];

while(next != start)
{
vectoOrder[cur] = vectoOrder[next];
indicator[cur] = true; 
cur = next;
next = order[next];
}
vectoOrder[cur] = tmp;
indicator[cur] = true;
}
}
};

ltjax 的答案是一个很好的方法 - 实际上是在 boost 的 zip_iterator http://www.boost.org/doc/libs/1_43_0/libs/iterator/doc/zip_iterator.html 中实现的

无论你提供什么迭代器,它都会打包成一个元组。

然后,您可以根据元组中迭代器值的任意组合为排序创建自己的比较函数。 对于这个问题,它只是元组中的第一个迭代器。

这种方法的一个很好的特点是它允许您保持每个单独向量的内存连续(如果您正在使用向量并且这就是您想要的)。 您也不需要存储单独的整数索引向量。

这是一个相对简单的实现,它使用有序和无序names之间的索引映射,用于将ages与有序names匹配:

void ordered_pairs()
{
    std::vector<std::string> names;
    std::vector<int> ages;

    // read input and populate the vectors
    populate(names, ages);

    // print input
    print(names, ages);

    // sort pairs
    std::vector<std::string> sortedNames(names);
    std::sort(sortedNames.begin(), sortedNames.end());

    std::vector<int> indexMap;
    for(unsigned int i = 0; i < sortedNames.size(); ++i)
    {
        for (unsigned int j = 0; j < names.size(); ++j)
        {
            if (sortedNames[i] == names[j]) 
            {
                indexMap.push_back(j);
                break;
            }
        }
    }
    // use the index mapping to match the ages to the names
    std::vector<int> sortedAges;
    for(size_t i = 0; i < indexMap.size(); ++i)
    {
        sortedAges.push_back(ages[indexMap[i]]);
    }

    std::cout << "Ordered pairs:\n";
    print(sortedNames, sortedAges); 
}

为了完整起见,这里是函数populate()print()

void populate(std::vector<std::string>& n, std::vector<int>& a)
{
    std::string prompt("Type name and age, separated by white space; 'q' to exit.\n>>");
    std::string sentinel = "q";

    while (true)
    {
        // read input
        std::cout << prompt;
        std::string input;
        getline(std::cin, input);

        // exit input loop
        if (input == sentinel)
        {
            break;
        }

        std::stringstream ss(input);

        // extract input
        std::string name;
        int age;
        if (ss >> name >> age)
        {
            n.push_back(name);
            a.push_back(age);
        }
        else
        {
            std::cout <<"Wrong input format!\n";
        }
    }
}

和:

void print(const std::vector<std::string>& n, const std::vector<int>& a)
{
    if (n.size() != a.size())
    {
        std::cerr <<"Different number of names and ages!\n";
        return;
    }

    for (unsigned int i = 0; i < n.size(); ++i)
    {
         std::cout <<'(' << n[i] << ", " << a[i] << ')' << "\n";
    }
}

最后, main()变成:

#include <iostream>
#include <sstream>
#include <string>
#include <vector>
#include <algorithm>

void ordered_pairs();
void populate(std::vector<std::string>&, std::vector<int>&);
void print(const std::vector<std::string>&, const std::vector<int>&);

//=======================================================================
int main()
{
    std::cout << "\t\tSimple name - age sorting.\n";
    ordered_pairs();
}
//=======================================================================
// Function Definitions...
**// C++ program to demonstrate sorting in vector
// of pair according to 2nd element of pair
#include <iostream>
#include<string>
#include<vector>
#include <algorithm>

using namespace std;

// Driver function to sort the vector elements
// by second element of pairs
bool sortbysec(const pair<char,char> &a,
              const pair<int,int> &b)
{
    return (a.second < b.second);
}

int main()
{
    // declaring vector of pairs
    vector< pair <char, int> > vect;

    // Initialising 1st and 2nd element of pairs
    // with array values
    //int arr[] = {10, 20, 5, 40 };
    //int arr1[] = {30, 60, 20, 50};
    char arr[] = { ' a', 'b', 'c' };
    int arr1[] = { 4, 7, 1 };

    int n = sizeof(arr)/sizeof(arr[0]);

    // Entering values in vector of pairs
    for (int i=0; i<n; i++)
        vect.push_back( make_pair(arr[i],arr1[i]) );

    // Printing the original vector(before sort())
    cout << "The vector before sort operation is:\n" ;
    for (int i=0; i<n; i++)
    {
        // "first" and "second" are used to access
        // 1st and 2nd element of pair respectively
        cout << vect[i].first << " "
             << vect[i].second << endl;

    }

    // Using sort() function to sort by 2nd element
    // of pair
    sort(vect.begin(), vect.end(), sortbysec);

    // Printing the sorted vector(after using sort())
    cout << "The vector after sort operation is:\n" ;
    for (int i=0; i<n; i++)
    {
        // "first" and "second" are used to access
        // 1st and 2nd element of pair respectively
        cout << vect[i].first << " "
             << vect[i].second << endl;
    }
    getchar();
    return 0;`enter code here`
}**

使用 C++11 lambdas 和基于 Konrad Rudolph 和 Gabriele D'Antona 答案的 STL 算法:

template< typename T, typename U >
std::vector<T> sortVecAByVecB( std::vector<T> & a, std::vector<U> & b ){

    // zip the two vectors (A,B)
    std::vector<std::pair<T,U>> zipped(a.size());
    for( size_t i = 0; i < a.size(); i++ ) zipped[i] = std::make_pair( a[i], b[i] );

    // sort according to B
    std::sort(zipped.begin(), zipped.end(), []( auto & lop, auto & rop ) { return lop.second < rop.second; }); 

    // extract sorted A
    std::vector<T> sorted;
    std::transform(zipped.begin(), zipped.end(), std::back_inserter(sorted), []( auto & pair ){ return pair.first; }); 

    return sorted;
}

这么多人问这个问题,但没有人想出满意的答案。 这是一个 std::sort 帮助器,可以同时对两个向量进行排序,只考虑一个向量的值。 该方案基于自定义的RadomIt(随机迭代器),直接对原始向量数据进行操作,无需临时副本、结构重排或附加索引:

C++,根据另一个向量对一个向量进行排序

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM