簡體   English   中英

基於唯一值的隨機行

[英]Random rows based on unique values

我想從 DF 中獲取 2 個隨機但不同的人員 ID,並將其放入另一個 DF

Person_id 郵政 積極的
567 是的 不活躍
678 是的 積極的
567 不活躍
689 是的 積極的
680 是的 不活躍
689 積極的
df['person_id'].sample(n=100, random_state=1)

此代碼未獲取唯一的 person_id 值,僅將該列放在 df 中。 我需要獲取該特定列的許多唯一值,並將其與所有其他列一起放入 df 中。

df.person_id.sample(n=100, random_state=1).groupby('person_id')

我也試過這個,但它創建了一個奇怪的 object

有小費嗎?

df = pd.DataFrame({'person_id': [567, 678, 567, 689, 680, 689],
                   'post': ['yes', 'yes', 'no', 'yes', 'yes', 'no'],
                   'active': ['inactive', 'active', 'inactive', 'active', 'inactive', 'active']})

到 select 兩個隨機的唯一人員 ID:

selected = df['person_id'].drop_duplicates().sample(n=2)

要為選定的人員 ID 創建包含所有行的數據框:

df[df['person_id'].isin(selected)]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM