创建CoreML LRCN模型

Question

您好，在此先感谢您或提供的任何帮助或指导！

我的问题来自于Apple CoreML文档站点上发布的一篇文章。 在WWDC 2017讲座中也涵盖了本文的主题，我发现它很有趣。 我最近发布了一个问题，该问题与我正在从事的同一项目的一部分有关，并且可以轻松解决。 但是，随着我进一步努力，我发现自己不了解该模型的一部分是如何实现的。

首先，我要在Keras中建立一个模型，该模型的Tensorflow后端在时间分布式包装器中使用卷积层。 在卷积部分之后，单个LSTM层连接到密集层作为输出。 目标是创建一个多对多结构，以填充图像序列将每个项目分类。 我将在下面发布该模型的代码。

我计划培训和部署该网络的计划可能会提出其他问题，但是如果它们引起麻烦，我将在此单独发布。 它涉及到使用时间分布式包装器进行训练，然后将其剥离模型并在CoreML转换时加载已包装层的权重，因为时间分配包装器不适用于CoreML。

我的问题是这样的：

在上述文章（以及我在GitHub上找到的CormeML示例项目）中，实现非常聪明。 由于CoreML（或至少库存转换器）不支持将图像序列作为输入，因此图像一次被馈入，并且LSTM状态作为输入与输出预测一起从网络传递出去。 对于序列中的下一个图像，用户将图像以及上一个时间步的LSTM状态传递给该图像，以便该模型可以“从中断处拾取”，以便将单个输入作为序列进行处理。 它为LSTM状态形成了一个循环（Apple文章对此进行了详细介绍）。 现在，对于实际问题部分...

如何在像Keras这样的库中实现这一点？ 到目前为止，我已经成功使用功能性API和LSTM层上的“ return_state”设置输出LSTM状态，并将其路由到辅助输出。 很简单 （至少对我而言）不是那么简单，是如何将该状态传回网络以进行下一个预测。 我已经查看了LSTM层的源代码和文档，但看不到任何作为状态输入而跳出的内容。 我唯一能想到的就是可能使LSTM层成为其自己的模型，并使用“ initial_state”进行设置，但是基于我发现的Keras GitHub上的一篇文章，看来该模型需要自定义调用功能，我不确定如何在CoreML中使用它。 仅供参考，我打算将隐藏状态和单元状态都循环到模型中或从模型中循环出来，除非这不是必需的，并且仅应使用隐藏状态，如Apple模型中所示。

再次感谢。 提供的任何帮助总是感激不尽！

我当前的模型如下所示：

image_input = Input(shape=(max_sequence_length, 224, 224, 3))
hidden_state_input = Input(shape=((None, 256)))
cell_state_input = Input(shape=((None, 256)))

convolutional_1 = TimeDistributed(Conv2D(64, (3, 3), activation='relu', data_format = 'channels_last'))(image_input)
pooling_1 = TimeDistributed(MaxPooling2D((2, 2), strides=(1, 1)(convolutional_1)

convolutional_2 = TimeDistributed(Conv2D(128, (4,4), activation='relu'))(pooling_1)
pooling_2 = TimeDistributed(MaxPooling2D((2, 2), strides=(2, 2)))(convolutional_2)

convolutional_3 = TimeDistributed(Conv2D(256, (4,4), activation='relu'))(pooling_2)
pooling_3 = TimeDistributed(MaxPooling2D((2, 2), strides=(2, 2)))(convolutional_3)

flatten_1 = TimeDistributed(Flatten())(pooling_3)
dropout_1 = TimeDistributed(Dropout(0.5))(flatten_1)

lstm_1, state_h, state_c = LSTM(256, return_sequences=True, return_state=True, stateful=False, dropout=0.5)(dropout_1)

dense_1 = TimeDistributed(Dense(num_classes, activation='sigmoid'))(lstm_1)

model = Model(inputs = [image_input, hidden_state_input, cell_state_input], outputs = [dense_1, state_h, state_c])

链接到Apple文章： https : //developer.apple.com/documentation/coreml/core_ml_api/making_predictions_with_a_sequence_of_inputs

使用使用类似方法的示例模型链接到GitHub存储库： https : //github.com/akimach/GestureAI-CoreML-iOS

链接到有关自定义调用函数的Keras GitHub帖子： https : //github.com/keras-team/keras/issues/2995

Answer 1

事实证明coremltools转换器将在转换过程中自动添加状态输入和输出。

Keras转换器_topology.py，第215行供参考。

创建CoreML LRCN模型

问题描述

1 个解决方案

解决方案1
0 已采纳 2018-01-29 10:32:25

创建CoreML LRCN模型

问题描述

1 个解决方案

解决方案1 0 已采纳 2018-01-29 10:32:25

解决方案1
0 已采纳 2018-01-29 10:32:25