簡體   English   中英

在單獨的數據框中收集 ID

[英]Collecting ids in separate dataframe

通過 id 對我的數據進行分組后,我陷入了困境。 現在我想用相同的 id 收集它們的完整信息。

當前 => 在使用 group by id 后我得到了這個結果。 預期 => 具有所有信息的每個相同 id,如圖所示

輸出應該像

dfs=pd.read_excel('tns1.xlsx')
grp = dfs.groupby('entity_id')
da  = grp.groups
for entity_id,show in grp:
  print(show)
  print(da)

現在我也有預期的輸出,但問題是我正在正確地提取它們然后使用下面的循環在 excel 中寫入我正在嘗試提取但我不認為它除了運行數千次之外還可以正確提取因為有很多行

因此,您可以收集要列出的個人數據,然后將其寫入 csv。

用於說明的數據設置

import pandas as pd
from io import StringIO
raw_data="""
entity_id,Name,Status,Date
2244,Abhi,Active,10-06-2021
2244,Abhi2,Blocked,10-06-2021
6666,other1,Blocked,10-06-2021
6666,other,Active,10-06-2021
"""
dfs=pd.read_csv(StringIO(raw_data))

將所有 dfs 附加到列表中:

grp = dfs.groupby('entity_id')
da  = grp.groups
groups_as_list=[]

for entity_id,show in grp:
    groups_as_list.append(show)# append all dfs in a list

然后將數據幀列表寫入 csv。

with open("my_results.csv","w") as f:# open file for write
    for each_df in groups_as_list:
            each_df.to_csv(f,index=False)
            f.write("\n") # write empty line to csv

所以結果將如下所示:(您可以根據需要進一步調整) 在此處輸入圖片說明

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM