繁体   English   中英

如何计算描述性统计; 从数据集中选择特征的偏度和峰度?

[英]how to compute descriptive statistics; Skewness and Kurtosis for slected feature from dataset?

我需要在 python 中正确地从数据框中找到所选特征的偏度和峰度。

target( y ) 特征是我需要的选定特征。

import pandas as pd
import numpy.random as rd
data = pd.read_csv('data4filter2.csv')
columns = ['Development Platform','Language Type','Adjusted Function Points','Resource Level']
y = data['Normalised Work Effort'].values
X = data[list(columns)].values

块引用

我猜标准化数据是“标准化工作量”列(只是因为名称?-是的,没有更多信息并回答问题)

from scipy.stats import skew
from scipy.stats import kurtosis

print(skew(y))
1.4698391946407465
print(kurtosis(y))
0.5414032993205269

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM