将 Python 字典列表附加到文件而不加载它

Question

假设我需要一个包含字典列表的数据库文件：

文件：

[
  {"name":"Joe","data":[1,2,3,4,5]},
  {   ...                         },
           ...
]

我需要一个函数来接收如上所示的字典列表并将其附加到文件中。 有没有办法实现这一点，比如使用 json （或任何其他方法），而不加载文件？

EDIT1：注意：我需要的是将新词典附加到光盘上现有的文件中。

Answer 1

您可以使用 json 转储字典，每行一个。 现在每一行都是您编写的单个 json dict。 您丢失了外部列表，但您可以通过简单的追加到现有文件来添加记录。

import json
import os

def append_record(record):
    with open('my_file', 'a') as f:
        json.dump(record, f)
        f.write(os.linesep)

# demonstrate a program writing multiple records
for i in range(10):
    my_dict = {'number':i}
    append_record(my_dict)

该列表可以稍后组装

with open('my_file') as f:
    my_list = [json.loads(line) for line in f]

该文件看起来像

{"number": 0}
{"number": 1}
{"number": 2}
{"number": 3}
{"number": 4}
{"number": 5}
{"number": 6}
{"number": 7}
{"number": 8}
{"number": 9}

Answer 2

如果需要保持文件是有效的json，可以按如下方式进行：

import json

with open (filepath, mode="r+") as file:
    file.seek(0,2)
    position = file.tell() -1
    file.seek(position)
    file.write( ",{}]".format(json.dumps(dictionary)) )

这将打开文件进行读取和写入。 然后，它转到文件的末尾（从末尾开始的零字节）以找出文件结尾的位置（相对于文件的开头）并返回最后一个字节，这在 json 文件中预期表示字符] 。 最后，它将一个新字典附加到结构中，覆盖文件的最后一个字符并将其保持为有效的 json。 它不会将文件读入内存。 在 Python 3.4.3 中使用 ANSI 和 utf-8 编码文件进行测试，其中包含小型和大型 (5 GB) 虚拟文件。

一个变体，如果你还导入了os模块：

import os, json

with open (filepath, mode="r+") as file:
    file.seek(os.stat(filepath).st_size -1)
    file.write( ",{}]".format(json.dumps(dictionary)) )

它定义文件的字节长度到少一个字节的位置（如前面的示例）。

Answer 3

如果您不希望实际加载文件，那么使用json进行处理并不是真正正确的方法。 您可以使用内存映射文件……并且永远不会将文件实际加载到内存中memmap数组可以打开文件并在“磁盘上”构建一个数组，而无需将任何内容加载到内存中。

创建一个内存映射的字典数组：

>>> import numpy as np
>>> a = np.memmap('mydict.dat', dtype=object, mode='w+', shape=(4,))
>>> a[0] = {'name':"Joe", 'data':[1,2,3,4]}
>>> a[1] = {'name':"Guido", 'data':[1,3,3,5]}
>>> a[2] = {'name':"Fernando", 'data':[4,2,6,9]}
>>> a[3] = {'name':"Jill", 'data':[9,1,9,0]}
>>> a.flush()
>>> del a

现在读取数组，而不加载文件：

>>> a = np.memmap('mydict.dat', dtype=object, mode='r')

创建列表时，文件的内容会加载到内存中，但这不是必需的——您可以使用磁盘上的数组而不加载它。

>>> a.tolist()
[{'data': [1, 2, 3, 4], 'name': 'Joe'}, {'data': [1, 3, 3, 5], 'name': 'Guido'}, {'data': [4, 2, 6, 9], 'name': 'Fernando'}, {'data': [9, 1, 9, 0], 'name': 'Jill'}]

创建一个可以索引文件的内存映射数组所需的时间可以忽略不计（例如纳秒），而不管文件的大小（例如 100 GB）。

Answer 4

使用与 user3500511 相同的方法...

假设我们有两个字典列表（dicts，dicts2）。 dicts 被转换为 json 格式的字符串。 Dicts 被保存到一个新文件 - test.json。 Test.json 重新打开，字符串对象使用正确的分隔符进行格式化。 使用重新格式化的对象，可以附加 dict2 并且文件仍然保持 JSON 对象的正确结构。

import json

dicts = [{ "name": "Stephen", "Number": 1 }
         ,{ "name": "Glinda", "Number": 2 }
         ,{ "name": "Elphaba", "Number": 3 }
         ,{ "name": "Nessa", "Number": 4 }]

dicts2= [{ "name": "Dorothy", "Number": 5 }
         ,{ "name": "Fiyero", "Number": 6 }]


f = open("test.json","w")
f.write(json.dumps(dicts))
f.close()

f2 = open("test.json","r+")
f2.seek(-1,2)
f2.write(json.dumps(dicts2).replace('[',',',1))
f2.close()

f3 = open('test.json','r')
f3.read()

将 Python 字典列表附加到文件而不加载它

问题描述

4 个解决方案

解决方案1
27 已采纳 2013-08-06 18:55:11

解决方案2
7

解决方案3
1 2016-03-27 11:50:02

解决方案4
0 2017-04-04 18:19:11

将 Python 字典列表附加到文件而不加载它

问题描述

4 个解决方案

解决方案1 27 已采纳 2013-08-06 18:55:11

解决方案2 7

解决方案3 1 2016-03-27 11:50:02

解决方案4 0 2017-04-04 18:19:11

解决方案1
27 已采纳 2013-08-06 18:55:11

解决方案2
7

解决方案3
1 2016-03-27 11:50:02

解决方案4
0 2017-04-04 18:19:11