![](/img/trans.png)
[英]How to compare two dataframes and calculate the differences in PySpark?
[英]How to Compare Two Columns From Two Dataframes for Differences?
我有兩個 DataFrame,我需要將第一個 DataFrame 中的兩列與另一個 DataFrame 中的兩列進行比較,以比較值的差異。
這是我的第一個 DataFrame 的樣子:
項目編號 | 賣價 |
---|---|
50 | 12 |
50 | 12 |
43 | 15 |
21 | 20 |
66 | 54 |
66 | 102 |
66 | 76 |
這是我的第二個 DataFrame 的樣子:
項目編號 | 價格 |
---|---|
50 | 15 |
50 | 15 |
43 | 15 |
21 | 28 |
66 | 87 |
66 | 87 |
66 | 78 |
現在,如何將我的第一個 DataFrame 中的item_number
和sell_price
與我的第二個 DataFrame 中的item_number
和price
進行比較?
我需要查看所需列的兩個 DataFrame 之間的差異。
我正在尋找這樣的 output:
項目編號 | 賣價 | 價格 |
---|---|---|
50 | 12 | 15 |
50 | 12 | 15 |
21 | 20 | 28 |
66 | 54 | 87 |
66 | 102 | 87 |
66 | 76 | 78 |
這是一個例子:
import pandas as pd
df1=pd.DataFrame({'item_number':[10,20],'sell_price':[20,40]},index=[0,1])
df2=pd.DataFrame({'item_number':[10,20],'price':[15,20]},index=[0,1])
df1['price']=df2['price']
請注意,您實際上是在向原始 df1 添加一列。 如果您願意,您可以隨時重新分配給另一個 df。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.