簡體   English   中英

我可以可視化 datasets.Dataset 的內容嗎?

[英]Can I visualize the content of a datasets.Dataset?

我正在使用 Huggingface datasets庫從 pandas dataframe 加載數據集。 代碼與此類似:

from datasets import Dataset
import pandas as pd
df = pd.DataFrame({"a": [1], "b":[1]})
dataset = Dataset.from_pandas(df) 

一切都很順利,但是,我想仔細檢查加載的Dataset的內容。 我一直在尋找類似於我們在 Pandas 中的df.head()的東西,但我在 Huggingface 官方文檔中一無所獲。 有沒有辦法“讀取”甚至部分加載數據集的內容?

做一個簡單的print(dataset)不會顯示內容,而只會顯示一些高級信息:

Dataset({
    features: ['a', 'b'],
    num_rows: 1
})

答案比你想象的要簡單。 做就是了

print(dataset[i])

其中i是行號(第一個是 0)。

output 將是一個字典,其特征為鍵,行的內容為值。

print(dataset[0])

<<< {
"a": [1],
"b": [1]
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM