繁体   English   中英

将风向分为几类

[英]Classify the wind direction in several classes

这是我的问题。
我有一个数据框df ,其中包含名为datewd的两列。
wd表示风向,范围为(0〜360)。
因此, df表示特定时间范围内某处的风向。

我想将这些风向分为16类:
http://7xrn7f.com1.z0.glb.clouddn.com/16-3-8/30080798.jpg

范围在此处显示。

http://7xrn7f.com1.z0.glb.clouddn.com/16-3-8/8398960.jpg

这是我现在可以处理的:

wd_stat = []
for i in range(0,len(df),1):
    wd = df.wd.iloc[i]
    ### NNE 11.25-33.75
    if 11.25 <= wd < 33.75:
       wd_stat.append("NNE")    
    ### NE 33.75-56.25   
    if (33.75 <=wd < 56.25):
       wd_stat.append("NE")
    ### ENE 56.25 - 78.75    
    if (56.25 <=wd < 78.75):
       wd_stat.append("ENE") 
    if (78.75 <=wd < 101.25):
       wd_stat.append("E") 
    if (101.25 <=wd < 123.75):
        wd_stat.append("ESE") 
      .....not done yet......

我的方法僵化而笨拙。
任何人都可以提出一些建议来高效处理此类分类问题(将数字范围转换为某些字符)。

做这类事情的一种好方法是使用numpy.digitize() 它采用bin和值的数组,并返回每个值所属的bin的索引。 在匹配的字符串数组中使用这些索引可获得所需的内容:

import numpy as np
import pandas as pd

df = pd.DataFrame({"wd": pd.Series([20.1,50,8.4,359,243,123])})

directions = np.array('N NNE NE ENE E ESE SE SSE S SSW SW WSW W WNW NW NNW N'.split())
bins = np.arange(11.25, 372, 22.5)
df['wd_stat'] = directions[np.digitize(df['wd'], bins)]
print df

      wd wd_stat
0   20.1     NNE
1   50.0      NE
2    8.4       N
3  359.0       N
4  243.0     WSW
5  123.0     ESE

您可以使用loc

import pandas as pd

df = pd.DataFrame({"wd": pd.Series([20.1,50,8.4 ])})
print df
     wd
0  20.1
1  50.0
2   8.4

print (df.wd >= 11.25 ) & (df.wd < 33.75 )
0     True
1    False
2    False
Name: wd, dtype: bool

df.loc[(df.wd >= 11.25 ) & (df.wd < 33.75 ), 'new'] = 'NNE'
df.loc[(df.wd >= 33.75 ) & (df.wd < 56.25 ), 'new'] = 'NE'
print df
     wd  new
0  20.1  NNE
1  50.0   NE
2   8.4  NaN

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM