[英]What is this bucket sort implementation doing?
这是我在Python中进行存储桶排序的代码。
from random import randrange
def insertion_sort(aList):
for i in range(1, len(aList)):
for j in range(i, 0, -1):
if aList[j] < aList[j-1]:
aList[j], aList[j-1] = aList[j-1], aList[j]
return aList
def bucket_sort(aList):
buckets = [[]] * len(aList)
for index, value in enumerate(aList):
buckets_index = value * len(aList) // (max(aList) + 1)
buckets[buckets_index].append(value)
answer = []
for bucket in buckets:
answer.extend(insertion_sort(bucket))
# answer += insertion_sort(bucket)
print(buckets[0])
print("\n")
# return answer
aList = [randrange(10) for _ in range(100)]
print(aList)
print("\n")
answer = bucket_sort(aList)
#print(answer)
怎么了? 运行代码时,我总是发现存储桶中的第一个列表已经排序,存储桶中的其他列表都是它的副本。 每个列表都需要插入排序吗? 我将“ answer”变量用于什么?
我主要依靠这种可视化 。
我立即注意到的一件事是,将变量存储buckets = [[]] * len(aList)
初始化为buckets = [[]] * len(aList)
。 这将使空白列表的副本相同。 这样,此列表的任何修改都会复制到buckets
每个元素中。 将此行更改为:
buckets = [[] for _ in xrange(len(aList))]
要检查列表中的列表是否为单独的对象,可以检查其ID:
print [id(x) for x in buckets]
这应该打印一个唯一编号列表。
我认为这种存储桶排序将更加高效,并且更具Python风格。
def bucket(k):
unique = list(set(k))
values = [k.count(uni) for uni in unique]
result = ([unique[uni] for i in range(values[uni])] for uni in range(len(unique)))
result = sum(result, [])
return result
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.