[英]Why does MD5 Hash For FileStream and String Differ C#
我使用System.Security.Cryptography.MD5从String和包含相同字符串的文件生成MD5哈希。 但是哈希值不同。
这是从字符串生成的代码
byte[] data = Encoding.ASCII.GetBytes("The quick brown fox jumps over the lazy dog");
byte[] hash = MD5.Create().ComputeHash(data);
return BitConverter.ToString(hash).Replace("-", "").ToLower();
这是我从文件生成哈希时的代码
internal static string CalculateFileHashTotal(string fileLocation)
{
using(var md5 = MD5.Create())
{
using (var stream = File.OpenRead(fileLocation))
{
byte[] b = md5.ComputeHash(stream);
stream.Close();
return BitConverter.ToString(b).Replace("-", "").ToLower();
}
}
}
字符串中的哈希是正确的,所以我假设文件中的哈希读取了一些额外的东西或者没有读取整个文件。 我在Google上找不到答案。
有任何想法吗?
散列不同,因为数据不同。
该文件是UTF-8,而不是ASCII,因此您应该使用UTF-8编码将字符串转换为字节以获得相同的结果:
byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");
此外,该文件可能在开头包含BOM(字节顺序标记) 。 这包含在数据中,因为文件不是作为文本读取的。
在数据开头添加UTF-8 BOM将提供相同的哈希:
byte[] bom = { 239, 187, 191 };
byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");
byte[] bomdata = new byte[bom.Length + data.Length];
bom.CopyTo(bomdata, 0);
data.CopyTo(bomdata, bom.Length);
byte[] hash = MD5.Create().ComputeHash(bomdata);
你是否修剪了文件中的字符串空格和新行?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.