在 Pandas 中对列值进行排序

Question

在以下数据框中，在每一行中，我希望name1值是name1和name2之间的较小值。

data = {'name1': ['Jason', 'Molly', 'Tina', 'yuma', 'Amy'],
        'name2': ['Cochice', 'Pima', 'Santa', 'Maria', 'Yuma'],
        'val': [12, 22, 4, 9, 7],
        'db' : ['xx','yy', 'zz', 'mm', 'aa']}
df = DataFrame(data)
df


db  name1   name2   val
xx  Jason   Cochice 12
yy  Molly   Pima    22
zz  Tina    Santa   4
mm  yuma    Maria   9
aa  Amy Yuma    7

据我所知，排序只能按行完成。 如何以这种方式排列值？

预期的输出是：

db  name1   name2   val
xx  Cochice Jason   12
yy  Molly   Pima    22
zz  Santa   Tina    4
mm  Amy     Maricopa    9
aa  Amy     Yuma    7

Answer 1

您可以将apply与sorted一起使用，但首先是set_index和最后是reset_index ：

print (df.set_index('val').apply(sorted, axis=1).reset_index())
   val    name1  name2
0    2  Cochice  Jason
1    2    Molly   Pima
2    3    Santa   Tina
3    3      Amy  Maria
4    3      Amy   Yuma

与np.sort类似的解决方案：

print (df.set_index('val').apply(np.sort, axis=1).reset_index())
   val    name1  name2
0    2  Cochice  Jason
1    2    Molly   Pima
2    3    Santa   Tina
3    3      Amy  Maria
4    3      Amy   Yuma

如果多列使用subset ：

df[['name1','name2']] = df[['name1','name2']].apply(np.sort, axis=1)
print (df)
   db    name1  name2  val
0  xx  Cochice  Jason    2
1  yy    Molly   Pima    2
2  zz    Santa   Tina    3
3  mm      Amy  Maria    3
4  aa      Amy   Yuma    3

在 Pandas 中对列值进行排序

问题描述

1 个解决方案

解决方案1
2 已采纳 2016-12-04 09:51:56

在 Pandas 中对列值进行排序

问题描述

1 个解决方案

解决方案1 2 已采纳 2016-12-04 09:51:56

解决方案1
2 已采纳 2016-12-04 09:51:56