簡體   English   中英

如果不是,可以使用scikit-learn而不是二進制分類來預測變量

[英]can one predict variable using scikit-learn rather binary classification if yes than how

我從事葯物科學領域的工作,研究化合物,通過計算其化學性質或描述符,我們可以預測化合物的某些生物學功能。 我使用相同的python和R編程語言,也使用Weka機器學習工具。 Weka為使用SVM和其他支持算法的二進制預測提供了便利。

防爆數據集: 訓練集

Chem_ID   MW LogP HbD HbE IC50 Class_label
  001    232  5    0   2    20    0
  002    280  2    1   4    41    1
  003    240  5    0   2    22    0
  004    300  4    1   5    48    1
  005    245  2    0   2    24    0
  006    255  1    0   2    20    0
  007    299  5    1   4    49    1

測試集

Chem_ID  MW   LogP HbD HbE IC50 Class_label
    000   255  1    0   2    20    

在weka中,很少有算法可以預測“ class_label”,也可以預測特定變量(我們通常預測“ IC50”值),scikit-learn或python中具有此功能的任何其他機器學習庫都可以。 如果是,我們如何使用它,謝謝。

是的,這是一個回歸問題。 從簡單的線性回歸支持向量回歸決策樹 回歸 (還有更多),有許多不同的模型可以解決回歸問題。

它們的工作方式類似於二進制分類器:您給他們訓練數據,而不是0/1標簽,而是給他們訓練目標值。 在您的情況下,您將要預測的特征作為目標值並將其從訓練數據中刪除。

簡短示例:

target_values = training_set['IC50']
training_data = training_set.drop('IC50')

clf = LinearRegression()
clf.fit(training_data, target_values)

test_data = test_set.drop('IC50')

predicted_values = clf.predict(test_data)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM