簡體   English   中英

使用sklearn.cluster.KMeans(python + py2exe)時減少dist目錄大小

[英]Reduce dist directory size while using sklearn.cluster.KMeans (python + py2exe)

將python腳本轉換為可執行文件時,我遇到了一些麻煩。 它的大小太大,我無法分發給我的客戶。

好吧,問題是我只使用了一些sklearn代碼,它導致我的分發目錄中總共240 MB。 我知道這不是因為我只使用了一件我不需要其他東西的東西。 但我正在尋找一種方法來減小這個大小,甚至可以替代KMeans類,使用更輕量級的python機器學習包。

如果需要,使用此功能的代碼部分是:

from sklearn.cluster import KMeans
...
# clus is just hanging an object instance of KMeans
clus = KMeans(n_clusters = _numBlocks, random_state = 1, n_jobs = 1)
# and here, I just call its method
_hourmap = clus.fit_predict(Load2Clus)
...

好的kmeans是一個非常簡單的算法,只是你認識的sklearn一小部分。 如果你受到內存限制,我會避免使用sklearn ,這是你使用的整個軟件包的唯一部分。 您也可能不需要numpyscipy和其他可能的包,除非您在代碼中的其他位置使用它們。

你的選擇是:

  • 在Python中實現您自己的K-means版本。
  • 使用這里的簡單kmeans包,它包含了KMeans的C實現。
  • 使用您已經確定的不同輕量級包裝。

這里給出了減少庫存檔大小的其他考慮事項,包括:

  • 排除各種外部庫
  • 排除標准庫的部分內容
  • 壓縮存檔

哪種方式最適合您,取決於您的計划。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM