繁体   English   中英

馈入多维数据集时的python h5py错误

[英]python h5py bug when feeding multidimensional dataset

这是我的问题,它在情况1中有效,在情况2中无效:

import h5py
import numpy as np

data = np.random.randint(0,256,(5,), np.uint8)

f = h5py.File('test.h5','w')
f.create_dataset('1',(3,5), np.uint8)
f.create_dataset('2',(1,3,5), np.uint8)

print("case 1 before:\n",f['1'].value)
# case 1 before:
#  [[0 0 0 0 0]
#  [0 0 0 0 0]
#  [0 0 0 0 0]]

f['1'][0] = data
print("case 1 after:\n",f['1'].value)
# case 1 after:
#  [[ 75 215 125 175 193]
#  [  0   0   0   0   0]
#  [  0   0   0   0   0]]

print()
print()

print("case 2 before:\n",f['2'].value)
# case 2 before:
#  [[[0 0 0 0 0]
#   [0 0 0 0 0]
#   [0 0 0 0 0]]]

f['2'][0][0] = data
print("case 2 after:\n",f['2'].value)
# case 2 after:
#  [[[0 0 0 0 0]
#   [0 0 0 0 0]
#   [0 0 0 0 0]]]

有人可以向我解释我做错了什么吗? (请不要建议创建一个形状与我的数据集形状相同的np.array,因为我使用的尺寸/尺寸更多!)

进行分配时不要使用链式索引。 代替

f['2'][0][0] = data

采用

f['2'][0,0] = data

f['2'][0]返回一个新数组,其数据是从f['2'] 复制而来的。 f['2'][0][0] = datadata分配给此新数组。 赋值对f['2']无效。

相反, f['2'][0,0] = data修改f['2']


foo.__getitem__(x) ,请记住foo[x]调用foo.__getitem__(x) foo[x] = y调用foo.__setitem__(x, y)

所以f['2'][0][0] = data调用

f.__getitem__('2').__getitem__(0).__setitem(0, data)
  • f.__getitem__('2')返回一个Dataset
  • f.__getitem__('2').__getitem__(0)返回一个NumPy数组
  • f.__getitem__('2').__getitem__(0).__setitem(0, data)修改该NumPy数组

f['2'][0,0] = data调用

f.__getitem__('2').__setitem__((0,0), data)

现在调用了Dataset__setitem__方法,这自然为Dataset提供了修改其内部数据的机会。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM