簡體   English   中英

Pandas 應用多列作為輸入

[英]Pandas Apply with multiple columns as input

對於具有 4 列坐標(經度、緯度)的數據框,我想創建一個第 5 列,該列具有每列兩個位置之間的距離,下面說明了這一點:

 dict = [{'x1': '1','y1': '1','x2': '3','y2': '2'},
 {'x1': '1','y1': '1','x2': '3','y2': '2'}]
 data = pd.DataFrame(dict)

結果,我想要這個:

dict1 = [{'x1': '1','y1': '1','x2': '3','y2': '2','distance': '2.6'},
{'x1': '1','y1': '1','x2': '3','y2': '2','distance': '2.9'}]   
data2 = pd.DataFrame(dict)

其中距離是使用 from geopy.distance import great_circle 計算的:

這是我嘗試過的:

data['distance']=data[['x1','y1','x2','y2']].apply(lambda x1,y1,x2,y2: great_circle(x1,y1,x2,y2)。英里,軸 = 1)

但這給了我一個類型錯誤:

類型錯誤:() 缺少 3 個必需的位置參數:“y1”、“x2”和“y2”

任何幫助表示贊賞。

那是因為 lambda 函數只能查看操作數data[['x1','y1','x2','y2']] ,所以你應該修改它如下。 希望這可以幫助!

data['distance']=data[['x1','y1','x2','y2']].apply(lambda df: great_circle(df['x1'],df['y1'],df['x2'],df['y2']).miles, axis=1)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM