繁体   English   中英

Python 3字典迭代中的性能:dict [key] vs. dict.items()

[英]Performance in Python 3 dictionary iteration: dict[key] vs. dict.items()

哪个更快,为什么? 或者他们是一样的吗? 答案是否因任何条件(字典大小,数据类型等)而异?

传统:

for key in dict:
    x = dict[key]
    x = key

潮人:

for key, value in dict.items():
    y = value
    y = key

我没有看到完全重复,但如果有一个我很高兴被指出它。

事实证明,实际上存在数量级的差异。

我对性能测试知之甚少,但我尝试做的是创建不同大小的3个dicts,每个较小的dict是较大dict的子集。 然后我通过两个函数(Traditional vs. Hipster)运行了所有三个dicts。 然后我做了100次。

dict1,dict2和dict3的字典大小(键值对的数量)分别为1000,50000,500000。

这里似乎是一个显著差异, d.items()普遍较快是d.items()存在方式上的小字典更快。 这符合预期(Python通常奖励“pythonic”代码)。

结果:

--d[key]--
dict1 -- mean: 0.0001113555802294286, st. dev: 1.9951038526222054e-05
dict2 -- mean: 0.01669296698019025, st. dev: 0.019088713496142
dict3 -- mean: 0.2553815016898443, st. dev: 0.02778986771642094

--d.items()--
dict1 -- mean: 6.005059978633653e-05, st. dev: 1.1960199272812617e-05
dict2 -- mean: 0.00507106617995305, st. dev: 0.009871762371401046
dict3 -- mean: 0.07369932165958744, st. dev: 0.023440325168927384

代码( repl.it )提供结果:

import timeit
import random
import statistics

def traditional(dicty):

  for key in dicty:
    x = dicty[key]
    x = key

def hipster(dicty):

  for key, value in dicty.items():
    y = value
    y = key

def generate_random_dicts():
  random_dict1, random_dict2, random_dict3 = {}, {}, {}

  for _ in range(1000):
    key = generate_random_str_one_to_ten_chars()
    val = generate_random_str_one_to_ten_chars()
    random_dict1[key] = val
    random_dict2[key] = val
    random_dict3[key] = val

  for _ in range(49000):
    key = generate_random_str_one_to_ten_chars()
    val = generate_random_str_one_to_ten_chars()
    random_dict2[key] = val
    random_dict3[key] = val

  for _ in range(450000):
    key = generate_random_str_one_to_ten_chars()
    val = generate_random_str_one_to_ten_chars()
    random_dict3[key] = val

  return [random_dict1, random_dict2, random_dict3]

def generate_random_str_one_to_ten_chars():
  ret_str = ""
  for x in range(random.randrange(1,10,1)):
    ret_str += chr(random.randrange(40,126,1))
  return ret_str

dict1, dict2, dict3 = generate_random_dicts()

test_dicts = [dict1, dict2, dict3]

times = {}
times['traditional_times'] = {}
times['hipster_times'] = {}

for _ in range(100):

  for itr, dictx in enumerate(test_dicts):
    start = timeit.default_timer() 
    traditional(dictx)
    end = timeit.default_timer() 
    time = end - start
    try:
      times['traditional_times'][f"dict{itr+1}"].append(time)
    except KeyError:
      times['traditional_times'][f"dict{itr+1}"] = [time]

    start = timeit.default_timer() 
    hipster(dictx)
    end = timeit.default_timer() 
    time = end - start
    try:
      times['hipster_times'][f"dict{itr+1}"].append(time)
    except KeyError:
      times['hipster_times'][f"dict{itr+1}"] = [time]

print("--d[key]--")
for x in times['traditional_times'].keys():
  ltimes = times['traditional_times'][x]
  mean = statistics.mean(ltimes)
  stdev = statistics.stdev(ltimes)
  print(f"{x} -- mean: {mean}, st. dev: {stdev}\n\n")

print("--d.items()--")
for x in times['hipster_times'].keys():
  ltimes = times['hipster_times'][x]
  mean = statistics.mean(ltimes)
  stdev = statistics.stdev(ltimes)
  print(f"{x} -- mean: {mean}, st. dev: {stdev}")

此代码只需要通过字典一次从中检索所有内容:

for key, value in dict.items():

此代码遍历整个字典一次,但只检索键:

for key in dict:
    x = dict[key]

然后,对于每个键,它必须再次进入字典以查找值。 所以,它必须更慢。

尽管如此,整个事情纯粹是学术性的,在现实生活中并没有真正意义。 当你的应用程序开始太慢时,你通过迭代字典的方式导致缓慢的可能性非常小。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM