SVM分类-R中的归一化

Question

我想使用SVM分类。 在使用SVM模型之前，如何规范化（或缩放）数据集中每列的特征？

train <- read.csv("train.csv")
test <- read.csv("test.csv")

svm.fit=svm(as.factor(type)~ ., data=train, core="libsvm",kernel="linear",cross=10, probability=TRUE)

Answer 1

您可以在sapply使用scale函数：

scaleddf <- as.data.frame(sapply(train, function(i) if(is.numeric(i)) scale(i) else i))

如果您的数据包含NaN值或方差为0的变量，则可以在使用上述函数之前先处理原始数据集并对其进行子集化。

# get a vector of variables to drop
dropVars <- sapply(train, function(i) {
              if((is.numeric(i) & !any(is.nan(i)) & sd(i) > 0) | is.factor(i) | is.character(i)) TRUE
              else FALSE
              }
# subset test dropping columns that don't fit the criteria
smallerdf <- test[, dropVars]

然后将上面的原始sapply函数应用到smalldf

SVM分类-R中的归一化

问题描述

1 个解决方案

解决方案1
1 已采纳 2016-04-19 20:20:25

SVM分类-R中的归一化

问题描述

1 个解决方案

解决方案1 1 已采纳 2016-04-19 20:20:25

解决方案1
1 已采纳 2016-04-19 20:20:25