簡體   English   中英

如何將scikit-learn(make_circle)替換為我自己的數據集?

[英]How to replace scikit-learn (make_circle) to my own dataset?

我正在嘗試將自己的數據集集成到scikit learning中。 我的數據集是分類數據,我編碼為數值數據,它具有3列和100行。 當前的scikit學習數據集是使用make_circle()創建的。

X, Y = make_circles(n_samples=n, noise=0.07, factor=0.4) 

我做了什么?

我使用熊貓讀取數據集。

col_names = ['Relation', 'Entity1', 'Entity2']
# load dataset
pima = pd.read_csv("encode.csv", header=None, names=col_names)
pima.head()

電流輸出:

Relation    Entity1     Entity2
 3       0       0
 0       1       2
 2       9       0
 3       5       3
 1       4       1
 2       6       0
 3       3       4

但是我想將此基於make_circle()的數據集添加到二維空間中。

您必須應用降維並將其縮減為2維。

您可以使用PCAUMAP之類的東西。

檢查這篇文章 它應該非常有用。

使用UMAP:

import umap

reduced = umap.UMAP().fit_transform(pima)

使用PCA:

from sklearn.decomposition import PCA

pca = PCA(n_components=2)
reduced = pca.fit_tranform(pima)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM