簡體   English   中英

從現有的 df (python - pandas) 創建新的 df

[英]Create new df from existing df (python - pandas)

我創建了一個數據框 df1 如下所示,

data = {'ID':[1,2,3,4,5,6,7,8,9,10],
        'date_1':['2021-03-01','2021-03-02','2021-04-03','2021-03-04','2021-03-05','2021-03-06','2021-03-07','2021-03-08','2021-03-09','2021-03-10'],
        'date_2': ['2021-03-06','2021-03-07','2021-03-08','2021-03-09','2021-03-10','2021-03-11','2021-03-12','2021-03-13','2021-03-14','2021-03-15']
       }
df1 = pd.DataFrame(data, columns = ['ID','date_1','date_2'])
df1

這是 df1 output 在此處輸入圖像描述

我正在嘗試創建一個新的 dataframe df2,其中只有來自 df1 的一列“date_3”。 理想情況下,df2 中的“date_3”列應該只返回 df1 中滿足以下語句條件的行(日期)(真),

df1['date_1'] <= df1['date_2']

下面是我的方法,但我只是得到有條件的 output (True/False) 而不是實際的日期值,

data = [df1['date_1'] <= df1['date_2']]
headers = ['date_3']
df2 = pd.concat(data, axis=1, keys=headers)
df2

這是df2的output 在此處輸入圖像描述

利用:

In [489]: df2 = df[df['date_1'] <= df['date_2']]['date_1'].to_frame('date_3')

In [490]: df2
Out[490]: 
       date_3
0  2021-03-01
1  2021-03-02
3  2021-03-04
4  2021-03-05
5  2021-03-06
6  2021-03-07
7  2021-03-08
8  2021-03-09
9  2021-03-10

正如@ScottBoston 所建議的,避免鏈索引:

df2 = df.loc[df['date_1'] <= df['date_2'], 'date_1'].to_frame('date_3')

這個:

df2 = df.loc[df["date_1"]<= df["date_2"], ["ID", "date_1"]].copy()

df2.rename(columns= {"date_1": "date_3"})

將首先根據您的條件進行子集化,僅保留 ID 和 date_1 列,然后您可以重命名該列

它還明確表明您會獲得一份副本,並且如果您進行任何修改,它將阻止您獲得任何 setWithCopyWarnings

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM