[英]Convert Pandas Column which Consist of list of JSON into new columns
我有3列的DataFrame:
order_id user_id Details
5c7c9 A [{"amount": "160",'id':'p2'},{"amount": "260",'id':'p3'}]
5c5c4 B [{"amount": "10",'id':'p1'},{"amount": "260",'id':'p3'}]
我希望最終的Dataframe像這樣:
order_id user_id amount id
5c7c9 A 160 p2
5c7c9 A 260 p3
5c5c4 B 10 p1
5c5c4 B 260 p3
您可以使用:
s=pd.DataFrame([[x] + [z] for x, y in zip(df1.index,df1.Details) for z in y])
s=s.merge(df1,left_on=0,right_index=True).drop(['Details',0],1)
print(s.pop(1).apply(pd.Series).join(s))
amount id order_id user_id
0 160 p2 5c7c9 A
1 260 p3 5c7c9 A
2 10 p1 5c5c4 B
3 260 p3 5c5c4 B
首先,如果有必要,首先通過ast.literal_eval
將值轉換為字典,然后將字典理解與DataFrame
構造函數和concat
使用,最后使用DataFrame.join
將其添加到原始DataFrame.join
中:
import ast
#df['Details'] = df['Details'].apply(ast.literal_eval)
df1 = (pd.concat({k: pd.DataFrame(v) for k, v in df.pop('Details').items()})
.reset_index(level=1, drop=True))
df = df.join(df1, rsuffix='_').reset_index(drop=True)
print (df)
order_id user_id amount id
0 5c7c9 A 160 p2
1 5c7c9 A 260 p3
2 5c5c4 B 10 p1
3 5c5c4 B 260 p3
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.