簡體   English   中英

合並 pandas 中的兩個數據幀

[英]Combine two dataframes in pandas

我有 2 個數據框:

東風:

portfolio  symbol  id  var1  var2  var3 

df1:

symbol  sector  market  count 

我想將列部門和市場從 df1 添加到 df。 df1 具有符號的唯一值,因此 dataframe 比原始 dataframe 的 df 更小。

我試着做:

pd.merge(df,df1,on='symbol',how='outer')

但是 output 的行數超出了預期。 任何人都可以幫助這里錯過了什么。

謝謝

您是否嘗試過進行內部連接,

df.merge(df1, on='symbol', how='inner')

如果您進行外連接,則行數將是兩者中較長的列(符號列)具有的行數,因此是來自 df 的行數。 如果您只想要唯一符號值的數量,您應該使用內部連接。

抱歉,我沒有意識到如果在第一個 dataframe 中不可用,外連接也會為第二個 dataframe 值創建行。 這就是我得到額外行的原因,為了刪除我添加的 df7 = df.dropna(subset=['symbol'])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM