[英]How to convert dictionary of DataFrames into individual DataFrames (Python, Pandas)
我有一个原始的 dataframe,有 4 列(例如,我们称它们为 product_id、year_month、week、order_amount)和 > 50,000 行。 有 240 个单独的 product_id 值,每个值在数据中的行为都不同,因此我想根据单独的 product_id 从原始数据框创建单独的数据框。 我能够通过利用来做到这一点:
dict_of_productid = {k: v for k, v in df.groupby('product_id)}
这创建了一个字典,键为 product_id,值为列:product_id、year_month、week、order_amount。 字典中的每个项目还维护了原始 df 的索引。 例如:如果 product_id = dvvd56 在 row# 4035 上,那么在字典中它将在为 product_id dvvd56 创建的 dataframe 上,但索引仍然是 4035。
我现在坚持的是一个以 df 作为值的字典,但找不到将这些值转换为我可以使用和操作的单个数据帧的方法。 如果有办法做到这一点,请告诉我。 我将不胜感激。 谢谢你
我找到了一种方法 go 关于这个,但我不知道这是否是最合适的方法,但它可能有助于进一步的答案以澄清我想做什么。
第一步是将唯一值转换为列表,然后按顺序对它们进行排序:
product_id_list = df['product_id'].value_counts().index.to_list()
product_id_list = sorted(product_id_list)
完成此操作后,我创建了一个公式,然后使用 product_id_list 的各个值对其进行迭代:
def get_df(key):
for k in key:
df_productid = dict_of_productid[k]
return df_productid
for c, i in enumerate(product_id_list):
globals()[f'df_{c}'] = get_df([f'{i}'])
这让我现在可以将创建的字典的所有值分离到单独的数据框中,我可以在不明确说明产品 ID 的情况下调用这些数据框。 我可以执行df_1
并获得 dataframe。
(我不知道这是否是最有效的方式 go 关于这个)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.