簡體   English   中英

如何知道一個數字是否在R中的確定區間內

[英]How to know if a number is in a determinated interval in R

我有一個包含 3 列的數據集:默認值、高度和重量。

我對變量進行了分箱並在列表中對其進行了混合(我必須這樣做)。 每個分箱都有一個相關的問題,但現在我想將這些問題放在原始數據框中,具體取決於我的觀察結果是哪個桶:例如,數據框

df1 <- data.frame(default=sample(c(0,1), replace=TRUE, size=100, prob=c(0.9,0.1)),
                  height=sample(150:180, 100, replace=T),
                  weight=sample(50:80,100,replace=T))
> head(df1)
#    default  height  weight
# 1       0    172     54
# 2       0    169     71
# 3       0    164     61
# 4       0    156     55
# 5       0    180     66
# 6       0    162     63

垃圾箱(我只會展示第一個)

bins <- lapply(c("height","weight"), function(x) woe.binning(df1, "default", x,
                                                 min.perc.total=0.05,
                                                 min.perc.class=0.05,event.class=1,
                                                 stop.limit = 0.05)[2])
# [[1]]
# [[1]][[1]]
#                woe cutpoints.final cutpoints.final[-1] iv.total.final  0 1 col.perc.a col.perc.b      iv.bins
# (-Inf,156] -46.58742            -Inf                 156      0.1050725 21 5 0.24137931 0.38461538 0.0667299967
# (156,168]   23.91074             156                 168      0.1050725 34 4 0.39080460 0.30769231 0.0198727638
# (168,169]  -10.91993             168                 169      0.1050725  6 1 0.06896552 0.07692308 0.0008689599
# (169, Inf]  25.85255             169                 Inf      0.1050725 26 3 0.29885057 0.23076923 0.0176007627
# Missing           NA             Inf             Missing      0.1050725  0 0 0.00000000 0.00000000           

現在我想用 bins 查看是我的數據。 我想要的輸出與此類似

#    default  height  weight woe_height   woe_weight
# 1       0    160     54      23.91074   -8.180032
# 2       0    140     71     -46.58742   -7.640947 

有什么辦法嗎? 我在這里看到的主要問題是間隔 (a,b) 是strings 我正在考慮使用substr()或類似的東西來分隔邏輯選項中的字符串,但我認為這行不通,而且它不是很優雅。 歡迎任何幫助,提前致謝。

這對你有用嗎?

apply_woe_binning <- function(df, x){

  # woe binning
  w <- woe.binning(df, "default", x,
                   min.perc.total=0.05,
                   min.perc.class=0.05,
                   event.class=1,
                   stop.limit = 0.05)[[2]]

  # create new column name
  new_col <- paste("woe", x, sep = "_")

  # define cuts
  cuts <- cut(df[[x]], w$cutpoints.final)

  # add new column
  df[[new_col]] <- w[cuts, "woe", drop = TRUE]

  df
}

# one by one
df2 <- apply_woe_binning(df1, "height")
df2 <- apply_woe_binning(df2, "weight")


# in a functional
df2 <- Reduce(function(y, x) apply_woe_binning(df = y, x = x), 
              c("height","weight"),
              init = df1)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM