[英]Unzipping multiple .gz files into single text file using Python
我正在尝试将 multiple.gz 扩展文件解压缩到 single.txt 文件中。 所有这些文件都有 json 条数据。
我尝试了以下代码:
from glob import glob
import gzip
for fname in glob('.../2020-04/*gz'):
with gzip.open(fname, 'rb') as f_in:
with open('.../datafiles/202004_twitter/decompressed.txt', 'wb') as f_out:
shutil.copyfileobj(f_in, f_out)
但是 decompressed.txt 文件只有 last.gz 文件的数据。
只需将f_out
移到外面,这样您就可以在遍历输入文件之前打开它并保持该句柄打开。
from glob import glob
import gzip
with open('.../datafiles/202004_twitter/decompressed.txt', 'wb') as f_out:
for fname in glob('.../2020-04/*gz'):
with gzip.open(fname, 'rb') as f_in:
shutil.copyfileobj(f_in, f_out)
请改用"wba"
模式。 a
以 append 模式打开。 w
单独将在打开时删除文件。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.