如果不是，可以使用scikit-learn而不是二進制分類來預測變量

Question

我從事葯物科學領域的工作，研究化合物，通過計算其化學性質或描述符，我們可以預測化合物的某些生物學功能。 我使用相同的python和R編程語言，也使用Weka機器學習工具。 Weka為使用SVM和其他支持算法的二進制預測提供了便利。

防爆數據集： 訓練集

Chem_ID   MW LogP HbD HbE IC50 Class_label
  001    232  5    0   2    20    0
  002    280  2    1   4    41    1
  003    240  5    0   2    22    0
  004    300  4    1   5    48    1
  005    245  2    0   2    24    0
  006    255  1    0   2    20    0
  007    299  5    1   4    49    1

測試集

Chem_ID  MW   LogP HbD HbE IC50 Class_label
    000   255  1    0   2    20

在weka中，很少有算法可以預測“ class_label”，也可以預測特定變量（我們通常預測“ IC50”值），scikit-learn或python中具有此功能的任何其他機器學習庫都可以。 如果是，我們如何使用它，謝謝。

Answer 1

是的，這是一個回歸問題。 從簡單的線性回歸到支持向量回歸或決策樹回歸（還有更多），有許多不同的模型可以解決回歸問題。

它們的工作方式類似於二進制分類器：您給他們訓練數據，而不是0/1標簽，而是給他們訓練目標值。 在您的情況下，您將要預測的特征作為目標值並將其從訓練數據中刪除。

簡短示例：

target_values = training_set['IC50']
training_data = training_set.drop('IC50')

clf = LinearRegression()
clf.fit(training_data, target_values)

test_data = test_set.drop('IC50')

predicted_values = clf.predict(test_data)

如果不是，可以使用scikit-learn而不是二進制分類來預測變量

問題描述

1 個解決方案

解決方案1
2 已采納 2016-02-04 13:59:08

如果不是，可以使用scikit-learn而不是二進制分類來預測變量

問題描述

1 個解決方案

解決方案1 2 已采納 2016-02-04 13:59:08

解決方案1
2 已采納 2016-02-04 13:59:08