繁体   English   中英

使用 python 平均多个 netCDF4 文件

[英]Averaging multiple netCDF4 files with python

我在 python 菜鸟中有点 netCDF 所以请原谅这个菜鸟问题。

我有一个文件夹,里面装满了大约 3650 个 netCDF4 文件。 每天一个文件,持续十年。 尼罗河被命名为 yyyymmdd.nc(例如 20100101,20100102,20100103 等)。 每个.nc 文件都包含同一区域(汤加专属经济区的一部分)的某个时间点的纬度、经度和温度。

我想要做的是从所有文件中计算每个纬度和经度的平均温度,即我想最终得到一个具有相同纬度和经度以及 10 年平均温度的文件。

我尝试过不同的东西/版本的代码,通常,它们最终看起来像这样......

files = glob('*.nc')
ds = xr.open_mfdataset(files,)
mean = np.mean(ds['temp'][:, 0].values)

......此代码将为我提供所有.nc 文件的 a.nc 文件中的平均温度,而不是基于 lat 和 lon 的十年文件中的平均温度。

非常感谢所有和任何帮助。

谢谢你。

假设您正在使用 linux/macOS,这可以使用我的 nctoolkit 包轻松完成(请参阅此处的详细信息)。

下面将计算所有文件的平均值,然后计算 plot 结果:

import nctoolkit as nc
files = glob('*.nc')
ds = nc.open_data(file)
ds.ensemble_mean()
ds.plot()

nctoolkit 默认使用 CDO 作为后端,但也可以使用 NCO,这可以提高性能。 所以以下可能会更快:

import nctoolkit as nc
files = glob('*.nc')
ds = nc.open_data(file)
ds.ensemble_mean(nco=True)
ds.plot()

您可以使用 cdo package 在输入文件名中使用通配符来执行此操作。 不过,我只用少量文件对其进行了测试,但需要注意的是,您可能会达到系统打开文件数量的限制。

from cdo import *
cdo=Cdo()
cdo.ensmean(input='*.nc',output='ensmean.nc')

这基本上相当于命令行调用 cdo

cdo ensmean *.nc ensmean.nc 

也就是说,在我看来,将它们放在一起然后使用 timmean 会更好:

cdo.timmean(input=cdo.mergetime(input='*.nc'),output='timmean.nc')

这又是 python 等价于

cdo mergetime *.nc all.nc
cdo timmean all.nc timmean.nc 

尝试两者,看看哪个有效/最快:-)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM