Pandas create multiple dataframe based on group from another dataframe

Question

I have a pandas dataframe

df=pd.DataFrame({'Name':['Jhon','Andy','Jenny','Joan','Paul','Rosa'],
                 'Position':['Programmer','Designer','Programmer','Designer','Analyst','Analyst']})

I want to create multiple of other dataframe based on the Position, and named each dataframe as "Job_as_"

Expected output would be

Job_as_Programmer=['Jhon','Jeny']
Job_as_Designer=['Andy','Jhon']

Answer 1

You could create a dictionary:

{"Job_as_"+ x : df.loc[df.Position==x, "Name"].to_list() for x in df.Position.unique()}

Output

{
 'Job_as_Programmer': ['Jhon', 'Jenny'],
 'Job_as_Designer': ['Andy', 'Joan'],
 'Job_as_Analyst': ['Paul', 'Rosa']
}

Answer 2

Use pandas.DataFrame.groupby with pandas.Series.add_prefix :

df2 = df.groupby("Position")["Name"].apply(list)
df2.add_prefix("Job_as_").to_dict()

Output:

{'Job_as_Analyst': ['Paul', 'Rosa'],
 'Job_as_Designer': ['Andy', 'Joan'],
 'Job_as_Programmer': ['Jhon', 'Jenny']}

Answer 3

you could just use groupby as below:

import pandas as pd
df=pd.DataFrame({'Name':['Jhon','Andy','Jenny','Joan','Paul','Rosa'],
                     'Position':['Programmer','Designer','Programmer','Designer','Analyst','Analyst']})
newDf = df.groupby(["Position" , "Name"]).first()
newDf #To Print Table

Output:

Position    Name
Analyst     Paul
            Rosa

Designer    Andy
            Joan

Programmer  Jenny
            Jhon

Pandas create multiple dataframe based on group from another dataframe

Question

3 answers

solution1
1 2020-09-11 08:51:08

solution2
1 2020-09-11 08:54:39

solution3
0 2020-09-11 08:53:50

Pandas create multiple dataframe based on group from another dataframe

Question

3 answers

solution1 1 2020-09-11 08:51:08

solution2 1 2020-09-11 08:54:39

solution3 0 2020-09-11 08:53:50

solution1
1 2020-09-11 08:51:08

solution2
1 2020-09-11 08:54:39

solution3
0 2020-09-11 08:53:50