簡體   English   中英

使用列中的現有數據創建新的 Dataframe

[英]Creating a new Dataframe using existing data in a column

我正在嘗試根據以下 Dataframe 鏈接中顯示的數據創建一個新的 dataframe。 基本上我需要根據“關鍵字類型”的值創建 6 個新列,這為我提供每行的每篇文章以及所有相應的關鍵字類型信息。 因此,列將是文章 ID、運動、比賽、上下文等……而第一行將是文章 1 的相應信息。 我每篇文章都需要它,這樣我就可以將它加入另一個數據框的文章列並將此信息帶入。有沒有一種有效的方法來做到這一點? 點擊此處查看 Dataframe

當前結構:

Article ID  | Keyword Type | Keyword Value  
Article 1   | Sport        | Football  
Article 1   | Team         | Manchester United  
Article 1   | Language     | English
Article 1   | Context      | News

預期 Output:

Article ID | Sport    | Team              | Language  | Context  
Article 1  | Football | Manchester United | English   | News

請執行下列操作:

res = pd.pivot_table(df, columns="Keyword Type", index="Article ID", aggfunc=lambda x:x)
res = res.droplevel(0, axis="columns")

結果是:

           Context Language     Sport               Team
Article ID                                              
Article 1     News  English  Football  Manchester United

set_indexunstack的組合可以得到你想要的 output:

df.set_index(['Article ID','Keyword Type'])
  .unstack()
  .droplevel(0,axis=1)
  .rename_axis(None,axis=1)


            Context     Language     Sport         Team
Article ID              
Article 1   News        English     Football    Manchester United

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM