[英]Shortest way to represent UInt64 as a string
我得到一个可能很大的数字 (UInt.MaxValue: 18446744073709551615) 作为一个正常的 base10 数字。 这个数字最终会成为一个文件名:12345678945768.txt
由于 Windows 上的文件名不仅限于数字,我想将其“压缩”为较短的字符串,但需要确保字符串可以映射回数字。
对于较小的数字:0001365555,十六进制比其他任何东西都要短得多。 到目前为止,我发现的所有内容都表明 Base64 是最短的,但事实并非如此。
到目前为止,我已经尝试过这个:
//18446744073709551615 - 20
UInt64 i = UInt64.MaxValue; // 0001365555
//"//////////8=" - 12
string encoded = Convert.ToBase64String(BitConverter.GetBytes(i));
//"FFFFFFFFFFFFFFFF" - 16
string hexed = i.ToString("X");
//"MTg0NDY3NDQwNzM3MDk1NTE2MTU=" - 28
string utf = Convert.ToBase64String(System.Text.Encoding.ASCII.GetBytes(i.ToString()));
有没有更好的方法来“压缩”整数以转换类似于十六进制但使用 00-zz 而不仅仅是 00-FF?
提前致谢!
到目前为止,我发现的所有内容都表明 Base64 是最短的,但事实并非如此。
您不想使用 Base64。 Base64 编码的文本可以使用/
字符,这在 Windows 上的文件名中是不允许的。 你需要想出别的办法。
还有什么?
好吧,您可以编写自己的基本转换,可能是这样的:
public static string Convert(ulong number)
{
var validCharacters = "qwertyuiopasdfghjklzxcvbnmQWERTYUIOPASDFGHJKLZXCVBNM1234567890!@#$%^&()_-";
char[] charArray = validCharacters.ToCharArray();
var buffer = new StringBuilder();
var quotient = number;
ulong remainder;
while (quotient != 0)
{
remainder = quotient % (ulong)charArray.LongLength;
quotient = quotient / (ulong)charArray.LongLength;
buffer.Insert(0, charArray[remainder].ToString());
}
return buffer.ToString();
}
这是一个“base-73”结果, validCharacters
字符越多,输出越小。 随意添加更多内容,只要它们在您的文件系统中是合法字符即可。
你允许的字符集是什么? 如果您可以识别 7132 个可以安全使用的不同 Unicode 字符,则可以将 64 位数字编码为五个 Unicode 字符。 另一方面,并非所有文件系统都支持此类字符。 如果可以识别 139 个合法字符,则可以将数据压缩为 9 个字符的字符串。 使用 85,您可以使用十个字符的字符串。
你误用了 Base64。
(System.Text.Encoding.ASCII.GetBytes(i.ToString())
这会生成一个字节序列,其中包含 base10 编码的整数,并在 base64 中再次对其进行编码。 这显然是低效的。
您需要获取整数的原始字节并使用 base64 对其进行编码。 哪种编码最有效取决于您想要允许的字符数。 如果你想要笑
并且您应该在数组的一侧修剪 0 个字节。
var bytes=BitConverter.GetBytes(input);
int len=8;
for(int i=7;i>=0;i--)
{
if(bytes[i]!=0)
{
len=i+1;
break;
}
}
string s=Convert.ToBase64String(bytes,0,len).ReplaceString('/','-');
请注意,这在大端系统上不会按预期工作。
但也许您应该避免使用字节编码,而只使用基数更高的整数编码。
一个简单的版本可能是:
string digitChars="0123..."
while(i!=0)
{
int digit=i%digitChars.Length;
i/=digitChars.Length;
result=digitChars[digit]+result;
}
这是一些使用上面 vcsjones 答案的代码,但也包括反向转换。 就像他的回答一样,如果需要减少字符串大小,请随意添加更多字符。 下面的字符为 ulong.MaxValue 生成大小为 13 的字符串。
private const string _conversionCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
public static string UlongToCompressedString(ulong number)
{
char[] charArray = _conversionCharacters.ToCharArray();
var buffer = new System.Text.StringBuilder();
var quotient = number;
ulong remainder;
while (quotient != 0)
{
remainder = quotient % (ulong)charArray.LongLength;
quotient = quotient / (ulong)charArray.LongLength;
buffer.Insert(0, charArray[remainder].ToString());
}
return buffer.ToString();
}
public static ulong? CompressedStringToULong(string compressedNumber)
{
if (compressedNumber == null)
return null;
if (compressedNumber.Length == 0))
return 0;
ulong result = 0;
int baseNum = _conversionCharacters.Length;
ulong baseMult = 1;
for (int i=compressedNumber.Length-1; i>=0; i--)
{
int cPos = _conversionCharacters.IndexOf(compressedNumber[i]);
if (cPos < 0)
return null;
result += baseMult * (ulong)cPos;
baseMult *= (ulong)baseNum;
}
return result;
}
这是一个实现:非常长的正整数的基本转换
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.