[英]How to train a CNN on an unlabeled dataset?
我想對我的未標記數據進行CNN訓練,從我在Keras / Kaggle / TF文檔或Reddit線程上閱讀的內容來看,我似乎必須預先標記我的數據集。 有沒有辦法在無人監督的情況下訓練CNN?
and (where y_train and y_test represent usual meanings) 我不明白如何初始化和 (其中y_train和y_test表示通常的含義)
有關我的數據集的信息如下:
對於我的模型,我需要以下內容:
我做了什么:
and . 我能夠將CSV文件中的數據檢索到一個數據幀中,並將該數據幀拆分為和 。 and values. 但是我不明白如何設置我的和值。
我的問題似乎與MNIST數據集非常相似,除了我沒有標簽。 我可以訓練沒有標簽的模型嗎?
我的代碼當前如下所示:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
# Read the dataset from the CSV file into a dataframe
df = pd.read_csv("bci_dataset.csv")
# Split the dataframe into training and test dataset
train, test = train_test_split(df, test_size=0.2)
x_train = train.iloc[:, :]
x_test = test.iloc[:, :]
print(x_train.shape)
print(x_test.shape)
預先感謝您閱讀本書並幫助我!
您能告訴我們為什么要專門使用CNN嗎? 通常,當從特征到輸出涉及一些復雜性時,將使用神經網絡-人工神經元由於暴露於基本事實(即標簽)而能夠學習不同的行為。 大多數時候,使用神經網絡的研究人員甚至都不知道網絡正在使用輸入數據的哪些特征來得出其輸出結論。
在您給我們的情況下,看起來有點像您知道哪些要素很重要(也就是說,子區域的總和必須大於0才能激活)。 神經網絡不需要真正學習任何東西即可完成其工作。 盡管在此過程中似乎不需要使用神經網絡,但鑒於輸入數據的大小,對您來說自動化它確實很有意義! :)
讓我知道我是否誤解了你的情況?
編輯:將其與MNIST數據集進行對比-因此,為了識別手寫數字,網絡必須學習處理一些歧義。 並非每種手寫都將以相同的方式呈現7。 神經網絡能夠找出7的幾個特征(即7很有可能具有從右上到左下的對角線,具體取決於您的方式書寫,可能會稍微彎曲或偏移或其他任何形式),以及幾個不同版本的7(有些人在其中間使用水平斜線,而其他版本的7則沒有該斜線)。 在這里,神經網絡的用途是弄清所有歧義,並把輸入概率歸為7(因為它已經看到了“知道”為7s的先前圖像)。 但是,在您的情況下,只有一種方法可以呈現您的答案-如果子區域中有任何大於0的元素,則它是活動的! 因此,您不需要訓練網絡就可以執行任何操作-您只需要編寫一些代碼即可自動實現子區域求和。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.