[英]can one predict variable using scikit-learn rather binary classification if yes than how
我從事葯物科學領域的工作,研究化合物,通過計算其化學性質或描述符,我們可以預測化合物的某些生物學功能。 我使用相同的python和R編程語言,也使用Weka機器學習工具。 Weka為使用SVM和其他支持算法的二進制預測提供了便利。
防爆數據集: 訓練集
Chem_ID MW LogP HbD HbE IC50 Class_label
001 232 5 0 2 20 0
002 280 2 1 4 41 1
003 240 5 0 2 22 0
004 300 4 1 5 48 1
005 245 2 0 2 24 0
006 255 1 0 2 20 0
007 299 5 1 4 49 1
測試集
Chem_ID MW LogP HbD HbE IC50 Class_label
000 255 1 0 2 20
在weka中,很少有算法可以預測“ class_label”,也可以預測特定變量(我們通常預測“ IC50”值),scikit-learn或python中具有此功能的任何其他機器學習庫都可以。 如果是,我們如何使用它,謝謝。
是的,這是一個回歸問題。 從簡單的線性回歸到支持向量回歸或決策樹 回歸 (還有更多),有許多不同的模型可以解決回歸問題。
它們的工作方式類似於二進制分類器:您給他們訓練數據,而不是0/1標簽,而是給他們訓練目標值。 在您的情況下,您將要預測的特征作為目標值並將其從訓練數據中刪除。
簡短示例:
target_values = training_set['IC50']
training_data = training_set.drop('IC50')
clf = LinearRegression()
clf.fit(training_data, target_values)
test_data = test_set.drop('IC50')
predicted_values = clf.predict(test_data)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.