我想按距Python中質心的距離對數據進行分類

Question

我正在用Python創建一個圖像分類器，該分類器將判斷圖像是否是汽車。

這是我的步驟：

我只想找到這些k均值質心，然后將它們保存在文件中以供重用。

我的問題如下：

我有50個預先計算的質心。 我有帶有SIFT描述符的新圖像。 我想為每個描述符找到最接近的質心。

例如：質心1最接近5個描述符，質心2最接近12個描述符，依此類推。 然后，我會將這些數據提供給SVM。

就像kmeans.predict（）一樣，但是我不想每次添加新圖像時都計算k均值。

那么在python中是否有任何函數在超空間中給我50個點（質心），在同一個超空間中給N點，它會根據最近的質心向我返回這些N點的分布？

謝謝

Answer 1

看看scikit-learn文檔中有關模型持久性的文章： http ://scikit-learn.org/stable/modules/model_persistence.html

使用pickle保存模型：

import pickle
with open('kmeans.dat', 'w') as f:
    pickle.dump(kmeans, f)

稍后，您可以使用以下方法再次加載它：

with open('kmeans.dat', 'r') as f:
    kmeans = pickle.load(f)

請注意，您只能加載由相同python版本存儲的模型。