将 SSD object 检测 model 转换为 TFLite 并将其从 float 量化为 uint8 用于 EdgeTPU

Question

我在将 SSD object 检测 model 转换为 EdgeTPU 的 uint8 TFLite 时遇到问题。

据我所知，我一直在不同的论坛、堆栈溢出线程和 github 问题中进行搜索，我认为我正在遵循正确的步骤。 我的 jupyter 笔记本上一定有问题，因为我无法实现我的建议。

我正在与您分享我在 Jupyter Notebook 上解释的步骤。 我想会更清楚。

#!/usr/bin/env python
# coding: utf-8

设置

此步骤是克隆存储库。如果你以前做过一次，你可以省略这一步。

import os
import pathlib

# Clone the tensorflow models repository if it doesn't already exist
if "models" in pathlib.Path.cwd().parts:
  while "models" in pathlib.Path.cwd().parts:
    os.chdir('..')
elif not pathlib.Path('models').exists():
  !git clone --depth 1 https://github.com/tensorflow/models

进口

需要的步骤：这仅用于进行导入

import matplotlib
import matplotlib.pyplot as plt
import pathlib
import os
import random
import io
import imageio
import glob
import scipy.misc
import numpy as np
from six import BytesIO
from PIL import Image, ImageDraw, ImageFont
from IPython.display import display, Javascript
from IPython.display import Image as IPyImage

import tensorflow as tf
import tensorflow_datasets as tfds


from object_detection.utils import label_map_util
from object_detection.utils import config_util
from object_detection.utils import visualization_utils as viz_utils
#from object_detection.utils import colab_utils
from object_detection.utils import config_util
from object_detection.builders import model_builder

%matplotlib inline

下载友好的model

对于 tflite，建议使用 SSD 网络。 我已经下载了以下model，它是关于“物体检测”的。 它适用于 320x320 图像。

!tflite_convert --saved_model_dir=/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/saved_model --output_file=/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model.tflite

用于为每个框添加正确 label 的字符串列表。

 PATH_TO_LABELS = '/home/jose/codeWorkspace-2.4.1/tf_2.4.1/models/research/object_detection/data/mscoco_label_map.pbtxt' category_index = label_map_util.create_category_index_from_labelmap(PATH_TO_LABELS, use_display_name=True)

使用 TFLite 导出和运行

Model转换

在这一步中，我将 pb 保存的 model 转换为.tflite

 .tflite_convert --saved_model_dir=/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/saved_model --output_file=/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model.tflite

Model 量化（从浮点到 uint8）

一旦 model 被转换，我需要量化它。 原来的 model 选择一个浮点数作为张量输入。 因为我想在 Edge TPU 上运行它，所以我需要输入和 output 张量为 uint8。

生成校准数据集。

 def representative_dataset_gen(): folder = "/home/jose/codeWorkspace-2.4.1/tf_2.4.1/images_ssd_mb2_2" image_size = 320 raw_test_data = [] files = glob.glob(folder+'/*.jpeg') for file in files: image = Image.open(file) image = image.convert("RGB") image = image.resize((image_size, image_size)) #Quantizing the image between -1,1; image = (2.0 / 255.0) * np.float32(image) - 1.0 #image = np.asarray(image).astype(np.float32) image = image[np.newaxis,:,:,:] raw_test_data.append(image) for data in raw_test_data: yield [data]

（不要运行这个）。这是上述步骤，但具有随机值

如果您没有数据集，您也可以引入随机生成的值，就像它是图像一样。 这是我以前这样做的代码：

 ####THIS IS A RANDOM-GENERATED DATASET#### def representative_dataset_gen(): for _ in range(320): data = np.random.rand(1, 320, 320, 3) yield [data.astype(np.float32)]

要求model转换

converter = tf.lite.TFLiteConverter.from_saved_model('/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/saved_model') converter.optimizations = [tf.lite.Optimize.DEFAULT] converter.target_spec.supported_ops = [tf.lite.OpsSet.TFLITE_BUILTINS_INT8, tf.lite.OpsSet.SELECT_TF_OPS] converter.inference_input_type = tf.uint8 converter.inference_output_type = tf.uint8 converter.allow_custom_ops = True converter.representative_dataset = representative_dataset_gen tflite_model = converter.convert()

警告：

转换步骤返回警告。

警告：absl：对于包含无法量化的不受支持的操作的 model 输入， inference_input_type属性将默认为原始类型。 警告：absl：对于包含无法量化的不受支持的操作的 model 输出， inference_output_type属性将默认为原始类型。

这让我觉得转换是不正确的。

保存 model

 with open('/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model_full_integer_quant.tflite'.format('/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/saved_model'), 'wb') as w: w.write(tflite_model) print("tflite convert complete. - {}/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model_full_integer_quant.tflite".format('/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/saved_model'))

测试

测试一：获取TensorFlow版本

我读到建议为此使用 nightly 。 所以就我而言，版本是 2.6.0

 print(tf.version.VERSION)

测试 2：获取输入/输出张量详细信息

interpreter = tf.lite.Interpreter(model_path="/home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model_full_integer_quant.tflite") interpreter.allocate_tensors() print(interpreter.get_input_details()) print("@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@") print(interpreter.get_output_details())

测试 2 结果：

我得到以下信息：

[{'name': 'serving_default_input:0', 'index': 0, 'shape': array([ 1, 320, 320, 3], dtype=int32), 'shape_signature': array([ 1, 320, 320, 3], dtype=int32), 'dtype': <class 'numpy.uint8'>, 'quantization': (0.007843137718737125, 127), 'quantization_parameters': {'scales': array([0.00784314], dtype= float32), 'zero_points': 数组([127], dtype=int32), 'quantized_dimension': 0}, 'sparsity_parameters': {}}] @@@@@@@@@@@@@@@@@ @@@@@@@@@@@@@@@@@

[{'name': 'StatefulPartitionedCall:31', 'index': 377, 'shape': array([ 1, 10, 4], dtype=int32), 'shape_signature': array([ 1, 10, 4] , dtype=int32), 'dtype': <class 'numpy.float32'>, 'quantization': (0.0, 0), 'quantization_parameters': {'scales': array([], dtype=float32), 'zero_points ': array([], dtype=int32), 'quantized_dimension': 0}, 'sparsity_parameters': {}}, {'name': 'StatefulPartitionedCall:32', 'index': 378, 'shape': array( [ 1, 10], dtype=int32), 'shape_signature': array([ 1, 10], dtype=int32), 'dtype': <class 'numpy.float32'>, 'quantization': (0.0, 0) , 'quantization_parameters': {'scales': array([], dtype=float32), 'zero_points': array([], dtype=int32), 'quantized_dimension': 0}, 'sparsity_parameters': {}}, { 'name': 'StatefulPartitionedCall:33', 'index': 379, 'shape': array([ 1, 10], dtype=int32), 'shape_signature': array([ 1, 10], dtype=int32), 'dtype': <class 'numpy.float32'>, 'quantization': (0.0, 0), 'quantization_parameters': {'scales': array([], dtype=float32), 'zero_poin ts': array([], dtype=int32), 'quantized_dimension': 0}, 'sparsity_parameters': {}}, {'name': 'StatefulPartitionedCall:34', 'index': 380, 'shape': array ([1], dtype=int32), 'shape_signature': array([1], dtype=int32), 'dtype': <class 'numpy.float32'>, 'quantization': (0.0, 0), 'quantization_parameters ': {'scales': array([], dtype=float32), 'zero_points': array([], dtype=int32), 'quantized_dimension': 0}, 'sparsity_parameters': {}}]

所以，我认为它没有正确量化它

将生成的 model 转换为 EdgeTPU

 .edgetpu_compiler -s /home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model_full_integer_quant.tflite

jose@jose-VirtualBox:~/python-envs$ edgetpu_compiler -s /home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model_full_integer_quant.tflite Edge TPU 编译器版本 15.0.340273435

Model 在 1136 毫秒内编译成功。

Input model: /home/jose/codeWorkspace-2.4.1/tf_2.4.1/tflite/model_full_integer_quant.tflite Input size: 3.70MiB Output model: model_full_integer_quant_edgetpu.tflite Output size: 4.21MiB On-chip memory used for caching model parameters: 3.42 MiB On-chip memory remaining for caching model parameters: 4.31MiB Off-chip memory used for streaming uncached model parameters: 0.00B Number of Edge TPU subgraphs: 1 Total number of operations: 162 Operation log: model_full_integer_quant_edgetpu.log

Model 编译成功，但 Edge TPU 并不支持所有操作。 model 的一部分将在 CPU 上运行，这会更慢。 如果可能，请考虑更新您的 model 以仅使用 Edge TPU 支持的操作。 有关详细信息，请访问 g.co/coral/model-reqs。 将在 Edge TPU 上运行的操作数：112 将在 CPU 上运行的操作数：50

操作员计数状态

LOGISTIC 1 操作在其他方面受支持，但由于某些未指定的限制而未映射 DEPTHWISE_CONV_2D 14 不支持多个子图 DEPTHWISE_CONV_2D 37 映射到边缘 TPU QUANTIZE 1 映射到边缘 TPU QUANTIZE 4 否则支持操作，但由于某些未指定而未映射限制 CONV_2D
58 映射到边缘 TPU CONV_2D 14
不支持多个子图 DEQUANTIZE
1 操作正在处理不受支持的数据类型 DEQUANTIZE 1 操作在其他方面受支持，但由于某些未指定的限制而未映射 CUSTOM 1
操作正在处理不受支持的数据类型 ADD
2 不支持多于一个子图 ADD
10 映射到边缘 TPU 连接 1
否则支持操作，但由于某些未指定的限制而未映射 CONCATENATION 1 不支持多个子图 RESHAPE 2
否则支持操作，但由于某些未指定的限制而未映射 RESHAPE 6
映射到边缘 TPU RESHAPE 4 不支持多个子图 PACK 4
张量的等级不受支持（最多映射 3 个最内层维度）

我准备的jupyter notebook可以在以下链接找到： https://github.com/jagumiel/Artificial-Intelligence/blob/main/tensorflow-scripts/Step-by-step-explaining-problems.ipynb

有没有我遗漏的步骤？ 为什么没有导致我的转换？

非常感谢您提前。

Answer 1

正如@JaesungChung 回答的那样，这个过程做得很好。

我的问题出在运行 .tflite model 的应用程序上。 我将我的 model output 量化为 uint8，因此我必须重新调整获得的值以获得正确的结果。

即我有 10 个对象，因为我要求所有检测到的对象得分高于 0.5。 我的结果没有按比例缩放，因此检测到的对象分数可能是完美的 104。我必须重新缩放该数字除以 255。

绘制我的结果时也发生了同样的情况。 所以我不得不把这个数字除以高度和宽度。

将 SSD object 检测 model 转换为 TFLite 并将其从 float 量化为 uint8 用于 EdgeTPU

问题描述

设置

此步骤是克隆存储库。如果你以前做过一次，你可以省略这一步。

进口

需要的步骤：这仅用于进行导入

下载友好的model

用于为每个框添加正确 label 的字符串列表。

使用 TFLite 导出和运行

Model转换

在这一步中，我将 pb 保存的 model 转换为.tflite

Model 量化（从浮点到 uint8）

生成校准数据集。

（不要运行这个）。这是上述步骤，但具有随机值

要求model转换

警告：

保存 model

测试

测试一：获取TensorFlow版本

测试 2：获取输入/输出张量详细信息

测试 2 结果：

将生成的 model 转换为 EdgeTPU

1 个解决方案

解决方案1
0 已采纳 2021-05-04 08:17:59

将 SSD object 检测 model 转换为 TFLite 并将其从 float 量化为 uint8 用于 EdgeTPU

问题描述

设置

此步骤是克隆存储库。 如果你以前做过一次，你可以省略这一步。

进口

需要的步骤：这仅用于进行导入

下载友好的model

用于为每个框添加正确 label 的字符串列表。

使用 TFLite 导出和运行

Model转换

在这一步中，我将 pb 保存的 model 转换为.tflite

Model 量化（从浮点到 uint8）

生成校准数据集。

（不要运行这个）。 这是上述步骤，但具有随机值

要求model转换

警告：

保存 model

测试

测试一：获取TensorFlow版本

测试 2：获取输入/输出张量详细信息

测试 2 结果：

将生成的 model 转换为 EdgeTPU

1 个解决方案

解决方案1 0 已采纳 2021-05-04 08:17:59

此步骤是克隆存储库。如果你以前做过一次，你可以省略这一步。

（不要运行这个）。这是上述步骤，但具有随机值

解决方案1
0 已采纳 2021-05-04 08:17:59