字符串編碼 memory 利用率

Question

str = 'text ....' //lets say size=100mb
str_utf8_size = len(str.encode('utf8'))

在 python 3 中，我想知道 Python 的str.encode()在 memory 利用率方面的工作原理

在上面的代碼中，它是否創建了 str 的副本並使用了兩倍的 memory (=200mb?)

Answer 1

在上面的代碼中，它是否創建了 str 的副本並使用了兩倍的 memory (=200mb?)

不，編碼的字符串可以小於或大於字符串。 例子：

aaa...aa毛
string size:  2000076
encoded size: 1000036

õõõ...õõõ
string size:  1000073
encoded size: 2000033

生成該代碼的代碼（在線嘗試！）：

for s in 'a' * 10**6 + '毛', 'õ' * 10**6:
    print(f'{s[:3]}...{s[-3:]}')
    print('string size: ', s.__sizeof__())
    print('encoded size:', s.encode('utf8').__sizeof__())
    print()

字符串編碼 memory 利用率

問題描述

1 個解決方案

解決方案1
1 2022-02-02 01:06:14

字符串編碼 memory 利用率

問題描述

1 個解決方案

解決方案1 1 2022-02-02 01:06:14

解決方案1
1 2022-02-02 01:06:14