[英]Ordering the column values in pandas
在以下数据框中,在每一行中,我希望name1
值是name1
和name2
之间的较小值。
data = {'name1': ['Jason', 'Molly', 'Tina', 'yuma', 'Amy'],
'name2': ['Cochice', 'Pima', 'Santa', 'Maria', 'Yuma'],
'val': [12, 22, 4, 9, 7],
'db' : ['xx','yy', 'zz', 'mm', 'aa']}
df = DataFrame(data)
df
db name1 name2 val
xx Jason Cochice 12
yy Molly Pima 22
zz Tina Santa 4
mm yuma Maria 9
aa Amy Yuma 7
据我所知,排序只能按行完成。 如何以这种方式排列值?
预期的输出是:
db name1 name2 val
xx Cochice Jason 12
yy Molly Pima 22
zz Santa Tina 4
mm Amy Maricopa 9
aa Amy Yuma 7
您可以将apply
与sorted
一起使用,但首先是set_index
和最后是reset_index
:
print (df.set_index('val').apply(sorted, axis=1).reset_index())
val name1 name2
0 2 Cochice Jason
1 2 Molly Pima
2 3 Santa Tina
3 3 Amy Maria
4 3 Amy Yuma
与np.sort
类似的解决方案:
print (df.set_index('val').apply(np.sort, axis=1).reset_index())
val name1 name2
0 2 Cochice Jason
1 2 Molly Pima
2 3 Santa Tina
3 3 Amy Maria
4 3 Amy Yuma
如果多列使用subset
:
df[['name1','name2']] = df[['name1','name2']].apply(np.sort, axis=1)
print (df)
db name1 name2 val
0 xx Cochice Jason 2
1 yy Molly Pima 2
2 zz Santa Tina 3
3 mm Amy Maria 3
4 aa Amy Yuma 3
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.