簡體   English   中英

如何在未標記的數據集上訓練CNN?

[英]How to train a CNN on an unlabeled dataset?

我想對我的未標記數據進行CNN訓練,從我在Keras / Kaggle / TF文檔或Reddit線程上閱讀的內容來看,我似乎必須預先標記我的數據集。 有沒有辦法在無人監督的情況下訓練CNN?
and (where y_train and y_test represent usual meanings) 我不明白如何初始化 (其中y_train和y_test表示通常的含義)
有關我的數據集的信息如下:

  1. 我有50,000個尺寸為30 x 30的矩陣。
  2. 每個矩陣均分為9個子區域(為便於理解,由垂直和水平條分隔)。
  3. if it has at least one element equal to 1. If all elements for that subarea are equal to 0, the subarea is . 子區域被認為是 ,如果它具有等於1的至少一種元素。如果該分區的所有元素都等於0,則分區是
  4. 對於下面顯示的第一個示例,我應該獲得活動的子區域的名稱作為輸出,因此這里是(1、4、5、6、7、9)。
  5. 如果沒有子區域處於活動狀態,則如第二個示例中所示,輸出應為0。

第一個示例:輸出-(1、4、5、6、7、9) 第一個示例圖片

第二個示例:輸出-0 第二個示例圖片 創建這些矩陣后,我執行了以下操作:

  1. 將這些矩陣重塑為尺寸為900 x 1的向量后,將它們放在CSV文件中。
  2. 因此,基本上,CSV中的每一行都包含900列,其值為0或1。
  3. 我的分類問題的類是從0-9的數字,其中0表示沒有標簽具有有效(值= 1)值的類。

對於我的模型,我需要以下內容:

  • 輸入:如上所述的900 x 1向量。
  • 輸出: 0-9中的值之一,
    其中1-9代表活動子區域,0代表無活動子區域。

我做了什么:
and . 我能夠將CSV文件中的數據檢索到一個數據幀中,並將該數據幀拆分為 and values. 但是我不明白如何設置我的值。
我的問題似乎與MNIST數據集非常相似,除了我沒有標簽。 我可以訓練沒有標簽的模型嗎?

我的代碼當前如下所示:

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

# Read the dataset from the CSV file into a dataframe
df = pd.read_csv("bci_dataset.csv")

# Split the dataframe into training and test dataset
train, test = train_test_split(df, test_size=0.2)

x_train = train.iloc[:, :]
x_test = test.iloc[:, :]

print(x_train.shape)
print(x_test.shape)

預先感謝您閱讀本書並幫助我!

您能告訴我們為什么要專門使用CNN嗎? 通常,當從特征到輸出涉及一些復雜性時,將使用神經網絡-人工神經元由於暴露於基本事實(即標簽)而能夠學習不同的行為。 大多數時候,使用神經網絡的研究人員甚至都不知道網絡正在使用輸入數據的哪些特征來得出其輸出結論。

在您給我們的情況下,看起來有點像您知道哪些要素很重要(也就是說,子區域的總和必須大於0才能激活)。 神經網絡不需要真正學習任何東西即可完成其工作。 盡管在此過程中似乎不需要使用神經網絡,但鑒於輸入數據的大小,對您來說自動化它確實很有意義! :)

讓我知道我是否誤解了你的情況?

編輯:將其與MNIST數據集進行對比-因此,為了識別手寫數字,網絡必須學習處理一些歧義。 並非每種手寫都將以相同的方式呈現7。 神經網絡能夠找出7的幾個特征(即7很有可能具有從右上到左下的對角線,具體取決於您的方式書寫,可能會稍微彎曲或偏移或其他任何形式),以及幾個不同版本的7(有些人在其中間使用水平斜線,而其他版本的7則沒有該斜線)。 在這里,神經網絡的用途是弄清所有歧義,並把輸入概率歸為7(因為它已經看到了“知道”為7s的先前圖像)。 但是,在您的情況下,只有一種方法可以呈現您的答案-如果子區域中有任何大於0的元素,則它是活動的! 因此,您不需要訓練網絡就可以執行任何操作-您只需要編寫一些代碼即可自動實現子區域求和。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM