![](/img/trans.png)
[英]Remove random N number of rows based on conditions on multiple columns in pandas
[英]Read in n number of random columns in pandas
我有一個 80gb 的 h5 文件,我只想讀一組隨機的 1000 列,並假設我不知道列名。 我們將如何實現這一目標?
您應該首先知道文件中的列數。 讓我們在這里假設 10000。
然后,您可以使用numpy.random和pandas.read_hdf的columns
選項的組合:
pd.read_hdf('file', columns=sorted(np.random.choice(range(10000), size=1000, replace=False)))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.