如何将NetCDF变量浮点数据读入Numpy数组，其精度和比例与原始NetCDF浮点值相同？

Question

我有一个NetCDF文件，其中包含一个带有精度/ scale == 7/2的浮点值的变量，即有可能的值从-99999.99到99999.99。

当我从NetCDF变量中获取一些值并在我的调试器中查看它时，我看到我现在在数组中的值比我在原始NetCDF中看到的更精确/比例。 例如，当我查看ToosUI / ncdump查看器中的值时，它们显示为'-99999.99'或'12 .45'但是当我查看切片数组中的值时，它们看起来像'-99999.9921875'（更大的比例长度）。因此，如果我使用'-99999.99'作为指示缺少数据点的预期值，那么我将无法与切片数组中的内容匹配，因为这些值具有更大的比例长度和附加数字缩放不仅仅是填充的零。

例如，如果我对NetCDF数据集中的某个点执行ncdump，我会看到这个：

Variable: precipitation(0:0:1, 40:40:1, 150:150:1)

float precipitation(time=1348, lat=180, lon=360);
  :units = "mm/month";
  :long_name = "precipitation totals";

 data:

  {
    {
      {-99999.99}
    }
  }

但是，如果我从变量得到一片数据，如下所示：

value = precipitationVariable[0:1:1, 40:41:1, 150:151:1]

然后我在我的调试器（Eclipse / PyDev）中看到它：

value == ndarray: [[[-99999.9921875]]]

因此，似乎我读入Numpy数组的NetCDF数据集值没有以与NetCDF文件中原始值相同的精度/比例读取。 或者NetCDF中的值实际上与我在阅读它时看到的相同，但是由于ncdump程序本身的某些格式设置，通过ncdump向我显示的内容被截断。

任何人都可以建议这里发生了什么？ 在此先感谢您的帮助。

BTW我在Windows XP机器上使用Python 2.7.3开发此代码，并在此处提供的NetCDF4 API使用Python模块： https ： //code.google.com/p/netcdf4-python/

Answer 1

没有简单的方法可以做你想要的，因为numpy将值存储为单精度，因此它们将始终具有0.99之后的尾随数字。

但是，netCDF已经提供了丢失数据的机制（参见最佳实践指南）。 netCDF文件是如何编写的？ missing_value是一个特殊的变量属性，应该用于指示缺少的值。 在C和Fortran接口中，创建文件时，所有变量值都将设置为缺失。 如果您一次性编写变量，则可以将missing_value属性设置为缺少值的索引数组。 查看有关C和Fortran接口中填充值的更多信息。 这是推荐的方法。 python netCDF4模块可以很好地处理这些缺失值，并且这些数组在numpy中被读作掩码数组。

如果您必须使用当前拥有的文件，那么我建议您创建一个掩码来覆盖缺失值周围的值：

import numpy as np
value = precipitationVariable[:]
mask = (value < -99999.98) & (value > -100000.00) 
value = np.ma.MaskedArray(value, mask=mask)

如何将NetCDF变量浮点数据读入Numpy数组，其精度和比例与原始NetCDF浮点值相同？

问题描述

1 个解决方案

解决方案1
7 已采纳 2013-05-31 08:02:28

如何将NetCDF变量浮点数据读入Numpy数组，其精度和比例与原始NetCDF浮点值相同？

问题描述

1 个解决方案

解决方案1 7 已采纳 2013-05-31 08:02:28

解决方案1
7 已采纳 2013-05-31 08:02:28