[英]How to sort a list/tuple of lists/tuples by the element at a given index?
我在列表列表或元組列表中有一些數據,如下所示:
data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]
我想按子集中的第二個元素排序。 意思是,按 2,5,8 排序,其中2
來自(1,2,3)
, 5
來自(4,5,6)
。 這樣做的常見方法是什么? 我應該在我的列表中存儲元組或列表嗎?
sorted_by_second = sorted(data, key=lambda tup: tup[1])
或者:
data.sort(key=lambda tup: tup[1]) # sorts in place
默認排序模式是升序。 要按降序排序,請使用選項reverse=True
:
sorted_by_second = sorted(data, key=lambda tup: tup[1], reverse=True)
或者:
data.sort(key=lambda tup: tup[1], reverse=True) # sorts in place
from operator import itemgetter
data.sort(key=itemgetter(1))
對於按多個條件排序,即例如按元組中的第二個和第三個元素,讓
data = [(1,2,3),(1,2,1),(1,1,4)]
因此定義一個 lambda,它返回一個描述優先級的元組,例如
sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]
如果您想將數組從高到低排序,我只想添加到斯蒂芬的答案中,除了上面的評論之外的另一種方法就是將其添加到行中:
reverse = True
結果如下:
data.sort(key=lambda tup: tup[1], reverse=True)
斯蒂芬的答案是我會使用的答案。 為了完整起見,這里是帶有列表推導式的 DSU(裝飾-排序-取消裝飾)模式:
decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]
或者,更簡潔地說:
[b for a,b in sorted((tup[1], tup) for tup in data)]
正如Python Sorting HowTo 中所述,自 Python 2.4 以來,當關鍵函數可用時,這已不再必要。
為了對元組列表(<word>, <count>)
進行排序,以降序count
和按字母順序排列word
:
data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]
我用這個方法:
sorted(data, key=lambda tup:(-tup[1], tup[0]))
它給了我結果:
[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]
沒有 lambda:
def sec_elem(s):
return s[1]
sorted(data, key=sec_elem)
itemgetter()
比lambda tup: tup[1]
快一些,但增加幅度相對較小(大約 10% 到 25%)。
(IPython 會議)
>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [tuple(values[i,:]) for i in range(len(values))]
>>> tpls[:5] # display sample from list
[(1, 0, 0),
(8, 5, 5),
(5, 4, 0),
(5, 7, 7),
(4, 2, 1)]
>>> sorted(tpls[:5], key=itemgetter(1)) # example sort
[(1, 0, 0),
(4, 2, 1),
(5, 4, 0),
(8, 5, 5),
(5, 7, 7)]
>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop
>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop
>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop
>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop
@Stephen 的回答很中肯! 這是一個更好的可視化示例,
為 Ready Player One 的粉絲們吶喊! =)
>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]
key
是一個函數,將被調用以轉換集合的項目以進行比較......就像 Java 中的compareTo
方法。
傳遞給 key 的參數必須是可調用的。 在這里,使用lambda
創建一個匿名函數(這是一個可調用的)。
lambda 的語法是單詞 lambda 后跟一個可迭代的名稱,然后是單個代碼塊。
在下面的示例中,我們正在對一個元組列表進行排序,這些元組包含特定事件和演員姓名的信息時間。
我們按事件發生的時間排序這個列表——這是元組的第 0 個元素。
注意 - s.sort([cmp[, key[, reverse]]])
將 s 的項目就地排序
我在我的代碼中使用它:
#To sort the list based on each element's second integer (elem[1])
sorted(d2, key=lambda elem: elem[1])
根據您想要對其排序的元素,您可以將其放入
(elem[*insert the index of the element you are sorting it by*])
對元組進行排序非常簡單:
tuple(sorted(t))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.