從 pandas dataframe 中隨機選擇 n 行並將它們移動到新的 df 而不重復

Question

我有一個 140 名學生的 dataframe，我需要將每個學生隨機分配給 5 個 TA（評分者）中的一個。

一個例子是

graders = ['K', 'M', ]

df = pd.DataFrame({
    'First name': ['John', 'Paul', 'George','Ringo'], 
    'Last name':['Lennon', 'McCartney', 'Harrison', 'Star'], 
    })

df['Grader'] = ''

我如何將評分者“K”隨機分配給 3 名學生，然后將 rest 分配給“M”，以確保學生不能同時進入兩組。

我已經在這里閱讀了許多答案，但沒有人為我澄清，任何幫助將不勝感激。

Answer 1

您可以分配一個隨機數 1-5，然后將 map 這些數字分配給 TA。 但是，這並不能保證每個 TA 獲得總數的 1/5。

import pandas as pd
import numpy as np

df['id'] = np.random.randint(1,6, df.shape[0]) # make a new column of random ints 1-5
df['Grader'] = df['id'].map({1:'a',2:'b',3:'c',4:'d',5:'e'}) # turns 1 to 'a', 2 to 'b', etc. Change this to your actual TAs.

Answer 2

使用df.sample ：

In [1291]: df['Grader'] = 'M' # Assign `M` to all the students at first

In [1299]: df.loc[df.sample(n=3).index, 'Grader'] = 'K' # Randomly choose 3 students and change their Grader to 'K'

In [1300]: df
Out[1300]: 
  First name  Last name Grader
0       John     Lennon      K
1       Paul  McCartney      M
2     George   Harrison      K
3      Ringo       Star      K

從 pandas dataframe 中隨機選擇 n 行並將它們移動到新的 df 而不重復

問題描述

2 個解決方案

解決方案1
1 2021-12-07 17:07:15

解決方案2
0 2021-12-07 17:01:33

從 pandas dataframe 中隨機選擇 n 行並將它們移動到新的 df 而不重復

問題描述

2 個解決方案

解決方案1 1 2021-12-07 17:07:15

解決方案2 0 2021-12-07 17:01:33

解決方案1
1 2021-12-07 17:07:15

解決方案2
0 2021-12-07 17:01:33