簡體   English   中英

如何計算描述性統計; 從數據集中選擇特征的偏度和峰度?

[英]how to compute descriptive statistics; Skewness and Kurtosis for slected feature from dataset?

我需要在 python 中正確地從數據框中找到所選特征的偏度和峰度。

target( y ) 特征是我需要的選定特征。

import pandas as pd
import numpy.random as rd
data = pd.read_csv('data4filter2.csv')
columns = ['Development Platform','Language Type','Adjusted Function Points','Resource Level']
y = data['Normalised Work Effort'].values
X = data[list(columns)].values

塊引用

我猜標准化數據是“標准化工作量”列(只是因為名稱?-是的,沒有更多信息並回答問題)

from scipy.stats import skew
from scipy.stats import kurtosis

print(skew(y))
1.4698391946407465
print(kurtosis(y))
0.5414032993205269

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM