[英]Pandas Apply with multiple columns as input
對於具有 4 列坐標(經度、緯度)的數據框,我想創建一個第 5 列,該列具有每列兩個位置之間的距離,下面說明了這一點:
dict = [{'x1': '1','y1': '1','x2': '3','y2': '2'},
{'x1': '1','y1': '1','x2': '3','y2': '2'}]
data = pd.DataFrame(dict)
結果,我想要這個:
dict1 = [{'x1': '1','y1': '1','x2': '3','y2': '2','distance': '2.6'},
{'x1': '1','y1': '1','x2': '3','y2': '2','distance': '2.9'}]
data2 = pd.DataFrame(dict)
其中距離是使用 from geopy.distance import great_circle 計算的:
這是我嘗試過的:
data['distance']=data[['x1','y1','x2','y2']].apply(lambda x1,y1,x2,y2: great_circle(x1,y1,x2,y2)。英里,軸 = 1)
但這給了我一個類型錯誤:
類型錯誤:() 缺少 3 個必需的位置參數:“y1”、“x2”和“y2”
任何幫助表示贊賞。
那是因為 lambda 函數只能查看操作數data[['x1','y1','x2','y2']]
,所以你應該修改它如下。 希望這可以幫助!
data['distance']=data[['x1','y1','x2','y2']].apply(lambda df: great_circle(df['x1'],df['y1'],df['x2'],df['y2']).miles, axis=1)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.