![](/img/trans.png)
[英]renaming __xarray_dataarray_variable__ in xarray dataarray
[英]Sparse DataArray Xarray search
在xarray中使用DataArray對象,找到具有值的所有單元格的最佳方法是!= 0。
例如在熊貓中我會這樣做
df.loc[df.col1 > 0]
我的具體例子我正在試着看三維腦成像數據。
first_image_xarray.shape
(140, 140, 96)
dims = ['x','y','z']
查看xarray.DataArray.where的文檔,看起來我想要這樣的東西:
first_image_xarray.where(first_image_xarray.y + first_image_xarray.x > 0,drop = True)[:,0,0]
但我仍然得到零的數組。
<xarray.DataArray (x: 140)>
array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., -0., 0., -0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
Dimensions without coordinates: x
另外 - 一個側面的問題 - 為什么有一些負零? 這些值是否舍入為-0。 實際上等於-0.009876之類的東西?
(回答主要問題)
你快到了。 但是,輕微的語法差異在這里有很大的不同。 一方面,這里是使用“基於值”的掩碼過濾>0
值的解決方案。
# if you want to DROP values which do not suffice a mask condition
first_image_xarray[:,0,0].where(first_image_xarray[:,0,0] > 0, drop=True)
要么
# if you want to KEEP values which do not suffice a mask condition as nan
first_image_xarray[:,0,0].where(first_image_xarray[:,0,0] > 0, np.nan)
另一方面,你的嘗試沒有按照你的希望工作的原因是因為在first_image_xarray.x
,它指的是數組中元素的索引 (在x
方向上)而不是引用元素的值 。 因此,只有輸出的第一個元素應該是nan
而不是0
因為它只不足以滿足切片[:,0,0]
的掩碼條件。 是的,您正在創建一個“基於索引”的掩碼。
以下小型實驗(希望如此)闡明了這一重要區別。
假設我們有DataArray
,它只包含0
和1
(維度與問題的原始帖子(OP) (140,140,96)
)。 首先讓我們來掩蓋它基於指數 OP做的:
import numpy as np
import xarray as xr
np.random.seed(0)
# create a DataArray which randomly contains 0 or 1 values
a = xr.DataArray(np.random.randint(0, 2, 140*140*96).reshape((140, 140, 96)), dims=('x', 'y', 'z'))
# with this "index-based" mask, only elements where index of both x and y are 0 are replaced by nan
a.where(a.x + a.y > 0, drop=True)[:,0,0]
Out:
<xarray.DataArray (x: 140)>
array([ nan, 0., 1., 1., 0., 0., 0., 1., 0., 0., 0., 0.,
0., 1., 0., 1., 0., 1., 0., 0., 0., 1., 0., 0.,
1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0., 1.,
1., 0., 0., 0., 1., 1., 1., 0., 0., 1., 0., 0.,
1., 0., 1., 1., 0., 0., 1., 0., 0., 1., 1., 1.,
0., 0., 0., 1., 1., 0., 1., 0., 1., 1., 0., 0.,
0., 0., 1., 1., 0., 1., 1., 1., 1., 0., 1., 0.,
0., 0., 0., 0., 0., 0., 1., 0., 1., 1., 0., 0.,
0., 0., 1., 0., 1., 0., 0., 0., 0., 1., 0., 1.,
0., 0., 1., 0., 0., 0., 0., 0., 1., 1., 0., 0.,
0., 1., 0., 0., 1., 0., 0., 1.])
Dimensions without coordinates: x
使用上面的掩碼,只有x
和y
索引都為0
的元素才會轉為nan
,而其余部分根本沒有被改變或掉落。
相反,所提出的方案掩模DataArray
基於所述值 DataArray
的元素。
# with this "value-based" mask, all the values which do not suffice the mask condition are dropped
a[:,0,0].where(a[:,0,0] > 0, drop=True)
Out:
<xarray.DataArray (x: 65)>
array([ 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1.])
Dimensions without coordinates: x
這成功地刪除了所有不足以基於DataArray
元素的值的掩碼條件的值 。
(回答問題)
至於DataArray
中-0
和0
的原點,從負側或正側向0
舍入值將是可能的:在此處進行相關討論如何在numpy中將負數舍入為零時消除額外減號? 以下是此案例的一個小例子。
import numpy as np
import xarray as xr
xr_array = xr.DataArray([-0.1, 0.1])
# you can use either xr.DataArray.round() or np.round() for rounding values of DataArray
xr.DataArray.round(xr_array)
Out:
<xarray.DataArray (dim_0: 2)>
array([-0., 0.])
Dimensions without coordinates: dim_0
np.round(xr_array)
Out:
<xarray.DataArray (dim_0: 2)>
array([-0., 0.])
Dimensions without coordinates: dim_0
另外,在NumPy數組中獲取-0
的另一種可能是numpy.set_printoptions(precision=0)
,它隱藏在小數點之下,如下所示(但我知道這次不是這種情況,因為你使用的是DataArray
) :
import numpy as np
# default value is precision=8 in ver1.15
np.set_printoptions(precision=0)
np.array([-0.1, 0.1])
Out:
array([-0., 0.])
無論如何,我最好的猜測是在數據准備和預處理階段,轉換為-0
應該是手動的和有意的而不是自動的。
希望這可以幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.