簡體   English   中英

在 Pandas 中讀取 n 個隨機列

[英]Read in n number of random columns in pandas

我有一個 80gb 的 h5 文件,我只想讀一組隨機的 1000 列,並假設我不知道列名。 我們將如何實現這一目標?

您應該首先知道文件中的列數。 讓我們在這里假設 10000。

然后,您可以使用numpy.randompandas.read_hdfcolumns選項的組合

pd.read_hdf('file', columns=sorted(np.random.choice(range(10000), size=1000, replace=False)))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM