如何在機器學習中訓練未標記的數據？

Question

我有近 9000 個實體的數據，我想訓練我的模型並從數據中檢測異常。

我嘗試了幾件事來完成我的工作，而我所做的一件事是

def create_sequences(values, time_steps=TIME_STEPS):
 output = []
 for i in range(len(values) - time_steps):
     output.append(values[i : (i + time_steps)])
 return np.stack(output)

在這里我開始拆分我的訓練數據

x_train = create_sequences(data['HR'].values)
x_train = np.expand_dims(x_train,axis=2)

x_train = create_sequences(data['PULSE'].values)
x_train = np.expand_dims(x_train,axis=2)

x_train = create_sequences(data['SpO2'].values)
x_train = np.expand_dims(x_train,axis=2)

x_train = create_sequences(data['ABPDias'].values)
x_train = np.expand_dims(x_train,axis=2)

x_train = create_sequences(data['ABPMean'].values)
x_train = np.expand_dims(x_train,axis=2)

x_train = create_sequences(data['RESP'].values)
x_train = np.expand_dims(x_train,axis=2)

這是我的模型正在訓練

model = Sequential()
model.add(Conv1D(filters=32, kernel_size=7, padding="same", strides=2, input_shape=(x_train.shape[1],x_train.shape[2])))
model.add(MaxPooling1D(pool_size=1,padding="valid"))
model.add(Dropout(0.2))
model.add(Conv1D(filters=16, kernel_size=7, padding="same", strides=2))
model.add(LSTM(units=20, return_sequences=True))
model.add(Dropout(0.2))
model.add(Conv1DTranspose(filters=16, kernel_size=7, padding="same",strides=2))
model.add(Conv1D(filters=32, kernel_size=7, padding="same"))
model.add(MaxPooling1D(pool_size=2,padding="valid"))
model.add(Conv1DTranspose(filters=32, kernel_size=7, padding="same",strides=4,activation="relu"))
model.add(Conv1DTranspose(filters=1, kernel_size=7, padding="same"))

model.compile(optimizer="adam", loss="mse")

model.summary()



history = model.fit(
 x_train,
 x_train,
 epochs=150,
 batch_size=128,
 validation_split=0.1
)

但這花了很多時間，我錯過了什么？，誰能指導我還有一件事是，我應該將 train_test_split 用於未標記的數據嗎？

Answer 1

沒有標記數據，您無法進行監督學習。 不建議同時使用特征作為輸入和標簽。 您正在尋找的是基於聚類的異常檢測，它屬於無監督學習的范疇。 DBSCAN 可能是這個任務的一個不錯的選擇，它在 scikit-learn 中可用。

如何在機器學習中訓練未標記的數據？

問題描述

1 個解決方案

解決方案1
0 2021-07-28 21:03:17

如何在機器學習中訓練未標記的數據？

問題描述

1 個解決方案

解決方案1 0 2021-07-28 21:03:17

解決方案1
0 2021-07-28 21:03:17