[英]groupby multiple coords along a single dimension in xarray
我有一個沿單個維度具有多個坐標的 xarray。 在下面的示例中,坐標a
和b
沿維度dim1
定義。 我將如何使用沿相同維度定義的兩個坐標進行groupby
? 與這個問題不同,我不是要按照不同的維度進行分組,而是要對一個維度進行分組。
import xarray as xr
d = xr.DataArray([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]],
coords={
'a': ('dim1',['A', 'A', 'B', 'B']),
'b': ('dim1',['1', '2', '1', '2']),
'c': ('dim2',['x', 'y', 'z'])
},
dims=['dim1', 'dim2'])
d.groupby(['a','b']) # this gives: TypeError: `group` must be an xarray.DataArray or the name of an xarray variable or dimension
這是我目前的解決方法:
import numpy as np
import xarray as xr
def groupby_multicoords(da, fields):
common_dim = da.coords[fields[0]].dims[0]
tups_arr = np.empty(len(da[common_dim]), dtype=object)
tups_arr[:] = list(zip(*(da[f].values for f in fields)))
return da.assign_coords(grouping_zip=xr.DataArray(tups_arr, dims=common_dim)).groupby('grouping_zip')
然后, groupby_multicoords(da=d, fields=['a', 'b'])
但是,在分組之后,我仍然保留了“grouping_zip”坐標。 我將不勝感激用d.groupby(['a','b'])
替換它..
您可以使用.stack(new=[“dim1”,”dim2”)
它們堆疊到單個 MultiIndex 中,然后按該維度.stack(new=[“dim1”,”dim2”)
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.