[英]Can I visualize the content of a datasets.Dataset?
我正在使用 Huggingface datasets
庫從 pandas dataframe 加載數據集。 代碼與此類似:
from datasets import Dataset
import pandas as pd
df = pd.DataFrame({"a": [1], "b":[1]})
dataset = Dataset.from_pandas(df)
一切都很順利,但是,我想仔細檢查加載的Dataset
的內容。 我一直在尋找類似於我們在 Pandas 中的df.head()
的東西,但我在 Huggingface 官方文檔中一無所獲。 有沒有辦法“讀取”甚至部分加載數據集的內容?
做一個簡單的print(dataset)
不會顯示內容,而只會顯示一些高級信息:
Dataset({
features: ['a', 'b'],
num_rows: 1
})
答案比你想象的要簡單。 做就是了
print(dataset[i])
其中i
是行號(第一個是 0)。
output 將是一個字典,其特征為鍵,行的內容為值。
print(dataset[0])
<<< {
"a": [1],
"b": [1]
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.