[英]Combine two dataframes in pandas
我有 2 個數據框:
東風:
portfolio symbol id var1 var2 var3
df1:
symbol sector market count
我想將列部門和市場從 df1 添加到 df。 df1 具有符號的唯一值,因此 dataframe 比原始 dataframe 的 df 更小。
我試着做:
pd.merge(df,df1,on='symbol',how='outer')
但是 output 的行數超出了預期。 任何人都可以幫助這里錯過了什么。
謝謝
您是否嘗試過進行內部連接,
df.merge(df1, on='symbol', how='inner')
如果您進行外連接,則行數將是兩者中較長的列(符號列)具有的行數,因此是來自 df 的行數。 如果您只想要唯一符號值的數量,您應該使用內部連接。
抱歉,我沒有意識到如果在第一個 dataframe 中不可用,外連接也會為第二個 dataframe 值創建行。 這就是我得到額外行的原因,為了刪除我添加的 df7 = df.dropna(subset=['symbol'])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.