簡體   English   中英

帶有 Python 的 NetCDF4 文件 - 在數據幀之前進行過濾

[英]NetCDF4 file with Python - Filter before dataframing

由於 NetCDF4 文件很大,當我想將其轉換為 Pandas dataframe 時出現 MemoryError。但是我不需要 .netCDF4 文件中的所有內容,所以我想知道是否可以先剪切文件,然后再轉換進入 dataframe

我的文件如下所示: 在此處輸入圖像描述

xr 用於 xarray 庫時間變量包含從 2019-01-01 到 2019-01-31 的所有時間不幸的是我無法在哥白尼網站上過濾但我只需要 09:00:00 的時間

你知道我該怎么做嗎? 使用 xarray 庫或其他方式。

謝謝

您可以使用sel來過濾您的數據集:

import pandas as pd
import xarray as xr
import datetime

# Load a demo dataset
ds = xr.tutorial.load_dataset('air_temperature')

# Keep only 12:00 rows
df = ds.sel(time=datetime.time(12)).to_dataframe()

Output:

>>> df
                                       air
lat  time                lon              
75.0 2013-01-01 12:00:00 200.0  242.299988
                         202.5  242.199997
                         205.0  242.299988
                         207.5  242.500000
                         210.0  242.889999
...                                    ...
15.0 2014-12-31 12:00:00 320.0  296.889984
                         322.5  296.589996
                         325.0  295.690002
                         327.5  295.489990
                         330.0  295.190002

[967250 rows x 1 columns]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM