[英]One-class Classification
我有 2500 多个样本进行了静态分析,每个样本提取了 300 多个特征。
在这些样本中,我区分了 10 多个APT
类,我的目标是为每个类构建一个单类分类器。
我正在使用 python scikit 库进行机器学习,特别是我面临着一类 SVM。
第一个问题:这种方法还有其他一些好的单类分类器吗?
第二个问题:我必须提出一些可以定义分类器“准确性”的指标。 现在我知道对于一类 SVM 来说,准确度概念并不是那么明确。 我报告我的代码和我的概念:
import numpy as np
import pandas as pd
from sklearn import svm
from sklearn.model_selection import train_test_split
df = pd.read_csv('features_labeled_apt17.csv')
X = df.ix[:,1:341].values
X_train, X_test = train_test_split(X,test_size = 0.3,random_state = 42)
clf = svm.OneClassSVM(nu=0.1,kernel = "linear", gamma =0.1)
y_score = clf.fit(X_train)
pred = clf.predict(X_test)
print(pred)
这些代表代码的输出:
[ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 -1 1 1 1 1 1 1 1 1 1 1 1 1 1 -1 1 1 1 1 1 1 1 1 1 -1 1 1 1 1 1 1 1 1 -1 1 1 1 1 1 1 1 1 -1 1 1 1
1 1 1 1 1 1 1 1 1 1 -1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1]
1当然代表标记良好的样本,而-1代表错误的样本。
第一:你认为这是一个好方法吗? 第二:对于指标,如果我将测试集中的总元素除以错误的标签?
根据我对机器学习算法的理解,您的用例不是应用 oneclass-SVM 分类器的好用例。
通常,oneclass-svm 用于无监督的异常值检测问题。 请参阅此页面以查看 oneclass-svm 检测异常值的实现。
只需显示您的数据框,我就会找到解决您问题的任何新方法。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.