base64编码哈希输入？

Question

我正在尝试调试为什么某些东西不能正常工作，并观察到b64encode似乎没有像我想象的那样工作：

import base64

base64.b64encode( bytes("the cat sat on the mat", "utf-8") )
>> b'dGhlIGNhdCBzYXQgb24gdGhlIG1hdA=='

base64.b64encode( bytes("cat sat on the mat", "utf-8") )
>> b'Y2F0IHNhdCBvbiB0aGUgbWF0'

第二个输入字符串在开始时只有很小的差异，那么为什么每个字符串的输出几乎不包含相似性？ 本来预计只有每个输出的开始有点不同。

Answer 1

Base64将3个输入字节映射到4个输出字节。

由于您添加了4个输入字节，因此意味着所有剩余字节“移位”到输出中的不同位置。

注意第一个例子上的== （填充）在第二个例子上消失了。

尝试添加或删除3个输入字节的倍数：

   cat sat on the mat
my cat sat on the mat

Answer 2

Base64是一个完全确定的可逆转换，但它不是基于每个字符运行的（因为您也可以从输出长度观察不是输入的倍数）。

相反，通过将三个字节（24比特）组成四个6比特数（因此基数64 = 2 ^ 6），一次编码三个字节（24比特）的组。 如果输入长度不是三的倍数，则填充并通过在输出的末尾加上=字符来表示。

因此，如果在这个三字节帧上对齐，则不同输入中的公共子串只会在输出中显示为公共子串，并分组为相同的三元组。

the cat sat on the mat
dGhlIGNhdCBzYXQgb24gdGhlIG1hdA==

he cat sat on the mat
aGUgY2F0IHNhdCBvbiB0aGUgbWF0

e cat sat on the mat
ZSBjYXQgc2F0IG9uIHRoZSBtYXQ=

 cat sat on the mat
IGNhdCBzYXQgb24gdGhlIG1hdA==

请注意，如果您截断正好三个字符（“the”，留下空格），输出将再次被识别。

base64编码哈希输入？

问题描述

2 个解决方案

解决方案1
3 已采纳 2019-04-29 13:42:52

解决方案2
2 2019-04-29 14:03:09

base64编码哈希输入？

问题描述

2 个解决方案

解决方案1 3 已采纳 2019-04-29 13:42:52

解决方案2 2 2019-04-29 14:03:09

解决方案1
3 已采纳 2019-04-29 13:42:52

解决方案2
2 2019-04-29 14:03:09