[英]How Calculate Speed in Pandas Dataframe
我的数据有问题。 我想基于“速度方程式”分析速度。
我的数据是这样的:
df
MAC T_1 X_1 Y_1 T_2 X_2 Y_2 T_3 X_3 Y_3 T_4 X_4 Y_4 T_5 X_5 Y_5 T_6 X_6 Y_6 T_7 X_7 Y_7
ID1 1 1 1 1 1 1 2 1 2 3 1 3 3 1 3 4 1 4 5 1 5
ID2 6 2 5 6 2 5 7 3 5 7 3 5 8 4 5 9 5 5 10 5 4
ID3 1 1 1 2 1 2 3 1 3 3 1 3 4 1 4 5 1 5 6 2 5
我尝试使用以下代码计算速度:
df = pd.read_csv("data.csv") #read data
def v_2(i):
return (df.ix[x,(5+3*(i-1))]-df.ix[x,(2+3*(i-1))])**2 + (df.ix[x,(6+3*(i-1))]-df.ix[x,(3+3*(i-1))])**2
def v(i):
if (df.ix[x,(4+3*(i-1))]-df.ix[x,(1+3*(i-1))]) ==0:
return 0
else:
return math.sqrt(v_2(i)) / (df.ix[x,(4+3*(i-1))]-df.ix[x,(1+3*(i-1))])
for i in range(1,7):
for x in range(3):
v_2(i)
v(i)
print((f"v:{v(i)}",f"i:{i+1}",f"ID:{x+1}"))
当前结果显示如下:
('v:0', 'i:2', 'ID:1')
('v:0', 'i:2', 'ID:2')
('v:1.0', 'i:2', 'ID:3')
('v:1.0', 'i:3', 'ID:1')
('v:1.0', 'i:3', 'ID:2')
('v:1.0', 'i:3', 'ID:3')
('v:1.0', 'i:4', 'ID:1')
('v:0', 'i:4', 'ID:2')
('v:0', 'i:4', 'ID:3')
('v:0', 'i:5', 'ID:1')
('v:1.0', 'i:5', 'ID:2')
('v:1.0', 'i:5', 'ID:3')
('v:1.0', 'i:6', 'ID:1')
('v:1.0', 'i:6', 'ID:2')
('v:1.0', 'i:6', 'ID:3')
('v:1.0', 'i:7', 'ID:1')
('v:1.0', 'i:7', 'ID:2')
('v:1.0', 'i:7', 'ID:3')
我的预期结果成为pd.Dataframe
看起来像这样:
MAC V1 V2 V3 V4 V5 V6
ID1 0 1 1 0 1 1
ID2 0 1 0 1 1 1
ID3 1 1 0 1 1 1
您介意帮助我如何转换数据或更好的分析速度的方法。 先感谢您。
您可以将代码的最后部分替换为:
rows =[]
for i in range(1, 7):
for x in range(3):
v_2(i)
v(i)
row = [v(i), i+1, x+1]
rows.append(row)
df1 = pd.DataFrame(rows, columns=['v', 'i', 'ID'])
df2 = pd.pivot_table(df1, values = 'v', index=['ID'], columns = 'i').reset_index()
df2.columns = ['MAC','V1','V2','V3','V4','V5','V6']
df2.set_index('MAC', inplace=True)
print df2
输出:
V1 V2 V3 V4 V5 V6
MAC
1 0.0 1.0 1.0 0.0 1.0 1.0
2 0.0 1.0 0.0 1.0 1.0 1.0
3 1.0 1.0 0.0 1.0 1.0 1.0
在示例代码中,您并没有在任何地方创建数据框...只是在打印输出: print((f"v:{v(i)}",f"i:{i+1}",f"ID:{x+1}"))
。
一种简单的方法是使用您的数据创建一个字典(即使我不理解您想在其中存储什么数据...),然后创建一个数据框:
data = {'MAC':[], 'V1':[], 'V2':[], 'V3':[], 'V4':[], 'V5':[], 'V6':[],}
for i in range(1,7):
for x in range(3):
data['MAX'].append('ID{}'.format(x+1))
data['V{}'.format(i)].append(v(i))
# do not know where to store v_2(i)
df = pandas.Dataframe(data)
同样,我并没有真正理解最终数据帧中的内容,但是以上提示足以解决问题。
我尝试此代码可能接近我的预期结果:
def v_2(i):
return (df.ix[x,(5+3*(i-1))]-df.ix[x,(2+3*(i-1))])**2 + (df.ix[x,(6+3*(i-1))]-df.ix[x,(3+3*(i-1))])**2
def v(i):
if (df.ix[x,(4+3*(i-1))]-df.ix[x,(1+3*(i-1))]) ==0:
return 0
else:
return math.sqrt(v_2(i)) / (df.ix[x,(4+3*(i-1))]-df.ix[x,(1+3*(i-1))])
df = pd.read_csv("data.csv")
df_result = pd.DataFrame()
for i in range(1,int((len(df.columns)-1)/3)):
v_result = list()
for x in range(len(df.index)):
v_2(i)
v(i)
v_result.append(v(i))
df_result[i]=v_result
df_result.columns = ['V_{}'.format(int(i)+1) for i in df_result.columns]
df_result.index = ['ID_{}'.format(int(i)+1) for i in df_result.index]
df_result
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.