簡體   English   中英

如何訪問 hdf5 格式的數據集中的圖像?

[英]How to access images in a dataset in hdf5 format?

我從以下網站http://microbia.org/index.php/resources訪問了一個高光譜數據集。 它被稱為“dataset.hdf5”。 我正在嘗試探索里面的數據

import numpy as np
import h5py

hf=h5py.File("dataset.hdf5", 'r')
hf.keys()

Output:

<KeysViewHDF5 ['CSSs', 'IMGs', 'SEGMs', 'agarFootprint', 'circularity', 'convexity', 'hemolysis', 'inertia', 'labels', 'labelsPathogens', 'positions', 'sizes', 'waves']>

dataset_IMGs= hf['IMGs']
dataset_IMGs[:]

Output:

array([b'IMG_WLATRIO_51145900_T1080_TW0H1S1',
       b'IMG_WLATRIO_51145900_T1080_TW0H1S1',
       b'IMG_WLATRIO_51145900_T1080_TW0H1S1', ...,
       b'IMG_WLATRIO_51144600_T1080_TW0H1S1',
       b'IMG_WLATRIO_51144600_T1080_TW0H1S1',
       b'IMG_WLATRIO_51144600_T1080_TW0H1S1'], dtype='|S35') 

我的目標是以原始格式實際提取這些圖像,但我在上面看到的是某種二進制編碼。 我搜索並嘗試了找到的腳本,但沒有一個可以幫助我提取這些圖像。

有沒有人知道什么以及如何提取這些圖像?

我同意@jacub。 此文件中似乎沒有任何圖像數據。 我使用了一個實用程序來獲取數據集及其內容的摘要。 IMGs 是一個文件名數組這是我發現的:

C:\Users\walker\Downloads>ptdump dataset.hdf5
/ (RootGroup) ''
/CSSs (Array(10398, 125)) ''
/IMGs (Array(10398,)) ''
/SEGMs (Array(10398,)) ''
/agarFootprint (Array(10398, 125)) ''
/circularity (Array(10398,)) ''
/convexity (Array(10398,)) ''
/hemolysis (Array(10398,)) ''
/inertia (Array(10398,)) ''
/labels (Array(10398,)) ''
/labelsPathogens (Array(10398,)) ''
/positions (Array(10398, 2)) ''
/sizes (Array(10398,)) ''
/waves (Array(125,)) ''

該鏈接有關於該文件的評論:“高光譜數據庫包含從固體血瓊脂板上的細菌菌落中選擇的光譜特征集合。......該數據庫旨在提供第一個基准來評估圖像分析算法的性能。申請。

您可以使用此標題下的鏈接獲取原始圖像數據: MicrobIA Images Dataset (Beta ver. 0.1) MicrobIA_Dataset...sample.zip在 4 個文件夾中有 20 張圖像。 我會從那里開始。 其他數據集似乎需要我沒有的帳戶/登錄名。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM