指定开始和结束行号后，从Python的dataframe / csv文件中选择随机行（数据）？

Question

Using the sample() function I can get the random rows. 使用sample()函数可以获得随机行。 Data set having 1000000 rows of data and I want to have a subset of 20000 rows. 数据集包含1000000行数据，我想拥有20000行的子集。 Importing random lines can be done through this solution 可以通过此解决方案导入随机行

https://stackoverflow.com/a/22259008/8966221 https://stackoverflow.com/a/22259008/8966221

reading a dataset 读取数据集

dataset = read_csv(file_path)

dataset_sub = dataset.sample(20000, random_state=1) dataset_sub =数据集.sample（20000，random_state = 1）

However I want to select random rows between row number 250000 to 750000 . 但是我想选择行号250000到750000之间的随机行。 Any possible solution in that regard?. 在这方面有什么可能的解决方案？

Answer 1

您可以做的是创建一个包含行号在250000到750000之间的行的DataFrame，然后从中选择20000个随机行。

dataset_sub = dataset.loc[250000:750000].sample(20000, random_state=1)

Answer 2

I think you need this: 我认为您需要这样做：

dataset = read_csv(file_path)
dataset_sub = dataset.sample(random.randint(250000,750000), random_state=1)

Answer 3

I think the following code works: 我认为以下代码有效：

import random
a=random.sample(range(250000,750000), 20000)
data=dataset.loc[a]

指定开始和结束行号后，从Python的dataframe / csv文件中选择随机行（数据）？

问题描述

reading a dataset 读取数据集

3 个解决方案

解决方案1
1 2018-11-19 07:10:31

解决方案2
0 2018-11-19 07:08:12

解决方案3
0 已采纳 2018-11-22 15:21:55

指定开始和结束行号后，从Python的dataframe / csv文件中选择随机行（数据）？

问题描述

reading a dataset 读取数据集

3 个解决方案

解决方案1 1 2018-11-19 07:10:31

解决方案2 0 2018-11-19 07:08:12

解决方案3 0 已采纳 2018-11-22 15:21:55

解决方案1
1 2018-11-19 07:10:31

解决方案2
0 2018-11-19 07:08:12

解决方案3
0 已采纳 2018-11-22 15:21:55