[英]Classify the wind direction in several classes
这是我的问题。
我有一个数据框df ,其中包含名为date和wd的两列。
wd表示风向,范围为(0〜360)。
因此, df表示特定时间范围内某处的风向。
我想将这些风向分为16类:
http://7xrn7f.com1.z0.glb.clouddn.com/16-3-8/30080798.jpg
范围在此处显示。
http://7xrn7f.com1.z0.glb.clouddn.com/16-3-8/8398960.jpg
这是我现在可以处理的:
wd_stat = []
for i in range(0,len(df),1):
wd = df.wd.iloc[i]
### NNE 11.25-33.75
if 11.25 <= wd < 33.75:
wd_stat.append("NNE")
### NE 33.75-56.25
if (33.75 <=wd < 56.25):
wd_stat.append("NE")
### ENE 56.25 - 78.75
if (56.25 <=wd < 78.75):
wd_stat.append("ENE")
if (78.75 <=wd < 101.25):
wd_stat.append("E")
if (101.25 <=wd < 123.75):
wd_stat.append("ESE")
.....not done yet......
我的方法僵化而笨拙。
任何人都可以提出一些建议来高效处理此类分类问题(将数字范围转换为某些字符)。
做这类事情的一种好方法是使用numpy.digitize() 。 它采用bin和值的数组,并返回每个值所属的bin的索引。 在匹配的字符串数组中使用这些索引可获得所需的内容:
import numpy as np
import pandas as pd
df = pd.DataFrame({"wd": pd.Series([20.1,50,8.4,359,243,123])})
directions = np.array('N NNE NE ENE E ESE SE SSE S SSW SW WSW W WNW NW NNW N'.split())
bins = np.arange(11.25, 372, 22.5)
df['wd_stat'] = directions[np.digitize(df['wd'], bins)]
print df
wd wd_stat
0 20.1 NNE
1 50.0 NE
2 8.4 N
3 359.0 N
4 243.0 WSW
5 123.0 ESE
您可以使用loc
:
import pandas as pd
df = pd.DataFrame({"wd": pd.Series([20.1,50,8.4 ])})
print df
wd
0 20.1
1 50.0
2 8.4
print (df.wd >= 11.25 ) & (df.wd < 33.75 )
0 True
1 False
2 False
Name: wd, dtype: bool
df.loc[(df.wd >= 11.25 ) & (df.wd < 33.75 ), 'new'] = 'NNE'
df.loc[(df.wd >= 33.75 ) & (df.wd < 56.25 ), 'new'] = 'NE'
print df
wd new
0 20.1 NNE
1 50.0 NE
2 8.4 NaN
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.