我如何使用机器学习预测事件发生的机会？

Question

我有一个事件数据集，包括它们的坐标、一天中的时间、一周中的一天以及特定日期的天气（温度和降雨量）。 我的目标是预测当您输入这些值时该事件发生的可能性。 所以我有很多发生的数据（大约 1500 个条目），但很明显，没有一个没有发生。

我查看了 XGBoost，因为有人建议使用它，但我真的不知道如何使用它，我现在如何应用它总是返回 1。

这是我目前的实现

import xgboost as xgb

#RD is my dataframe 

#I labeled everything with a 1 since xgboost needs to predict something. I have no clue how i could handle this better :)
rd["Label"] = 1

X,y=rd[["HourOfDay",'Type','Lat','Long','DayOfWeek']],rd["Label"]
xg_cl = xgb.XGBClassifier(objective="binary:logistic",
                         n_estimators=10, seed=123)
xg_cl.fit(X,y)

testdf = pd.DataFrame({
    "HourOfDay" : [1],
    "Type" : [2],
    "Lat" : [0],
    "Long" : [0],
    "DayOfWeek" : [6]
})
preds=xg_cl.predict(data =testdf)

这段代码总是给我真实的（1），但我需要它来返回事件发生的机会，我很确定我当前的实现是无用的。

有人可以指出我如何解决这个问题的正确方向吗？

Answer 1

当您 label 每个数据点都带有1并在这些数据点上训练您的 model 时，当然分类器只会预测1 。 它不知道另一个 class 甚至存在。 您需要在训练数据中使用不同的标记示例才能正确拟合分类器。

除此之外，还有一个predict_proba function 返回 class 概率而不是类。

我如何使用机器学习预测事件发生的机会？

问题描述

1 个解决方案

解决方案1
0 2021-03-16 19:29:59

我如何使用机器学习预测事件发生的机会？

问题描述

1 个解决方案

解决方案1 0 2021-03-16 19:29:59

解决方案1
0 2021-03-16 19:29:59