[英]How do I decompress multiple json gzip files in a column?
我有一列中有数千个 json.gz 文件的 csv 文件。 我的目标是遍历列中的所有行以解压缩每个 json.gz 文件。
指数 | 地点 |
---|---|
0 | '0_location_data.json.gz' |
1 | '1_location_data.json.gz' |
我的代码:
import pandas as pd
import itertools, gzip
jsonfilename = list(df['location])
it = (gzip.open(f, 'rt') for f in jsonfilename)
for line in itertools.chain.from_iterable(it):
print(line)
我的错误:
OSError: [Errno 22] Invalid argument: '0_location_data.json.gz'
我的目标是解压缩所有这些文件,然后我可以将它们标准化为 csv。
it = (gzip.open(f, 'rb') for f in jsonfilename)
鉴于 gzip 生成二进制文件,这可能是正确的参数。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.