特征相似性的连体网络

Question

我有大约 20k 个不同域的图像，这些图像已经使用 GLCM 和 HOG 提取了特征。 每张图像的特征尺寸约为 2000。 我想使用连体网络找到特征之间的相似性。我将所有内容都存储在 dataframe 中。 我不确定我们如何为神经网络提供输入特征。 使用 1DCNN / Dense 层只有一种可能性。

encoder = models.Sequential(name='encoder')
encoder.add(layer=layers.Dense(units=1024, activation=activations.relu, input_shape=[n_features]))
encoder.add(layers.Dropout(0.1))
encoder.add(layer=layers.Dense(units=512, activation=activations.relu))
encoder.add(layers.Dropout(0.1))
encoder.add(layer=layers.Dense(units=256, activation=activations.relu))
encoder.add(layers.Dropout(0.1))

在上面的代码中，我们只将特征数量作为编码器的输入，但我的两张图像的特征数量是相同的。 我应该分别训练两个编码器并在最后加入它们以形成嵌入层吗？ 但是我应该如何测试？

Answer 1

对于连体网络，您可能希望拥有一个网络，并在不同的数据集上对其进行训练。

所以说你有两组数据X0和X1具有相同的形状，你会做

from tensorflow.keras import models
from tensorflow.keras import layers
from tensorflow.python.keras.utils import losses_utils


# number of features
n_features = 2000

# fake data w/batch size 4
X0 = tf.random.normal([4, n_features])
X1 = tf.random.normal([4, n_features])

# siamese encoder model
encoder = models.Sequential(name='encoder')
encoder.add(layer=layers.Dense(
    units=1024, activation="relu", input_shape=[n_features]))
encoder.add(layers.Dropout(0.1))
encoder.add(layer=layers.Dense(units=512, activation="relu"))
encoder.add(layers.Dropout(0.1))
encoder.add(layer=layers.Dense(units=256, activation="relu"))
encoder.add(layers.Dropout(0.1))

# send both sets of data through same model
enc0 = encoder(X0)
enc1 = encoder(X1)

# compare the two outputs
compared = tf.keras.losses.CosineSimilarity(
    reduction=losses_utils.ReductionV2.NONE)(enc0, enc1)
print(f"cosine similarity of output: {compared.numpy()}")
# cosine similarity of output: [-0.5785658, -0.6405066, -0.57274437, -0.6017716]

# now do optimization ...

有很多方法可以比较 output，余弦相似度就是其中之一，但我只是将其包括在内以进行说明，您可能需要一些其他指标。

Answer 2

只有一个网络只是重复的。 所有的权重都是共享的。 因此，您正在训练一个网络，只需在每个学习步骤中运行两次即可。 如果来自相同的 class，您应该从您的数据集中选择两个样本和 label 为 1，否则为 0。

from tensorflow.keras import models
from tensorflow.keras import layers
import tensorflow.keras.backend as K

n_features = 2000

def cos_similarity(x):
    x1,x2 = x
    return K.sum(x1*x2)/(K.sqrt(K.sum(x1*x1))*K.sqrt(K.sum(x2*x2)))

inp1 = layers.Input(shape=(n_features))
inp2 = layers.Input(shape=(n_features))

encoder = models.Sequential(name='encoder')
encoder.add(layer=layers.Dense(
    units=1024, activation="relu", input_shape=[n_features]))
encoder.add(layers.Dropout(0.1))
encoder.add(layer=layers.Dense(units=512, activation="relu"))
encoder.add(layers.Dropout(0.1))
encoder.add(layer=layers.Dense(units=256, activation="relu"))
encoder.add(layers.Dropout(0.1))

out1 = encoder(inp1)
out2 = encoder(inp2)

similarity = layers.Lambda(cos_similarity)([out1,out2])

model = models.Model(inputs=[inp1,inp2],outputs=[similarity])

model.compile(optimizer='adam',loss='mse')

为了测试，首先你应该计算你说它有 2000 个特征的 HOG 特征。 然后运行

model.predict(hog_feature)

你有 output 功能。 顺便说一句，我建议不要使用 hog 功能和连体网络。 仅使用此网络提取图像特征。 更改输入形状并使用图像进行训练。

特征相似性的连体网络

问题描述

2 个解决方案

解决方案1
1 2021-02-22 17:52:24

解决方案2
1 2021-02-22 19:35:57

特征相似性的连体网络

问题描述

2 个解决方案

解决方案1 1 2021-02-22 17:52:24

解决方案2 1 2021-02-22 19:35:57

解决方案1
1 2021-02-22 17:52:24

解决方案2
1 2021-02-22 19:35:57