标签[quantization-aware-training]

RuntimeError：不支持的 qscheme：per_channel_affine - RuntimeError: Unsupported qscheme: per_channel_affine

我正在关注一个关于量化意识训练的教程，这里是修改后的 Resnet18 model：我正在使用与教程中类似的数据加载器对自定义数据进行训练。训练在正常阶段似乎对 go 很好，但是在应用融合模型时遵循教程，量化模型在发出后似乎失败我探索了用于量化模块的 utils.py 的源代码，可以在这里 ...

TF Yamnet 迁移学习和量化 - TF Yamnet Transfer Learning and Quantization

TLDR：短期：尝试量化 TF model（从 TFLite 模型重新创建）的特定部分。跳到下面的图片。 \ 长期：在 Yamnet 上迁移 Learn 并为 Edge TPU 编译。要遵循的源代码在这里几周以来，我一直在尝试在Yamnet上迁移学习并编译Coral Edge TPU 。 ...

ValueError：不支持在另一个 tf.keras 模型中量化 tf.keras 模型 - ValueError: Quantizing a tf.keras Model inside another tf.keras Model is not supported

我刚刚开始使用 Keras/Tensorflow，我正在尝试重新训练并量化为 int8 a MobileNetV2，但出现此错误：我按照本指南来绕过量化步骤，但我不确定我到底在做什么不同。堆栈跟踪： ...

网络量化——为什么需要“zero_point”？为什么对称量化不需要“零点”？ - network quantization——Why do we need "zero_point"? Why symmetric quantization doesn't need "zero point"?

我已经用谷歌搜索了很多天，但仍然找不到我需要的答案。脑子里肯定有什么误会。你能帮帮我吗？ 1. 为什么我们需要“zero_point”？量化：q=round(r/scale)+zero_point 我认为 zero_point（作为偏移量）将缩放数据移动到适当的 position，例如，在 ...

无法在 tensorRT 中为 QAT model 创建校准缓存 - Cannot create the calibration cache for the QAT model in tensorRT

我训练了一个量化的 model（借助 pytorch 中的量化感知训练方法）。我想创建校准缓存以通过 TensorRT 在 INT8 模式下进行推理。创建 calib 缓存时，我收到以下警告并且未创建缓存：我已经相应地训练了 model 并转换为 ONNX：有关系统的更多信息： ...

从 pytorch 转换为 ONNX 后，量化的 model 给出负精度 - Quantized model gives negative accuracy after conversion from pytorch to ONNX

我正在尝试在 pytorch 中训练量化 model 并将其转换为 ONNX。我在 pytorch_quantization package 的帮助下采用量化感知训练技术。我使用以下代码将我的 model 转换为 ONNX：转换后，我收到以下警告： warnings.warn("'enable ...

张量流动态范围量化 - tensorflow dynamic range quantization

动态范围量化的 tensorflow 文档指出：在推理时，权重从 8 位精度转换为浮点，并使用浮点内核计算。此转换完成一次并缓存以减少延迟。并且在动态范围量化中，激活始终存储在浮点数 32 中，但是，它们在处理时转换为 8 位整数，并在处理完成后返回浮点数。我很困惑，如果在推理时 ...

如何通过实验量化从 TensorFlow 的量化感知训练中获得量化权重 - How to get quantized weights from TensorFlow's quantization aware training with experimental quantization

我正在使用 TensorFlow 的量化感知训练 API 并希望部署具有任意位宽的 model。由于 tflite 部署仅支持 8 位量化，我将使用自定义推理算法进行部署，但我仍然需要以正确的大小访问 model 的权重。目前，在使用量化感知训练后，我的 model 仍处于浮点状态，据我所知，访 ...

为什么从量化感知训练的 model 派生的 TFLite model 与具有相同权重的普通 model 不同？ - Why is a TFLite model derived from a quantization aware trained model different different than from a normal model with same weights?

我正在训练一个 Keras model，我想在量化的 8 位环境（微控制器）中使用 TFLite 部署它。为了提高量化性能，我进行了量化感知训练。然后，我使用我的验证集作为代表性数据集创建量化的 TFLite model。使用验证集评估性能并在此图像中说明：不同条件下各批次 20 次运行的 ...

如何在量化感知训练后合并 ReLU - How to merge ReLU after quantization aware training

我有一个包含 Conv2D 层和 ReLU 激活的网络，声明如下：它被移植到 TFLite，具有以下表示：没有 Q-aware 训练的基本 TFLite 网络然而，在网络上执行量化感知训练并再次移植后，ReLU 层现在在图中是明确的： Q-aware 训练后的 TFLite 网络这导致它们在 ...

ValueError：未知层：AnchorBoxes 量化 tensorflow - ValueError: Unknown layer: AnchorBoxes quantization tensorflow

我正在对 SSD model 应用量化。附上要点。加载 model 时添加了一个名为“AnchorBoxes”的自定义 object。当我不进行量化时，这很好用。但是当我应用量化时，无法识别此自定义 object。我尝试了解决方法。我在上面的代码中注释了这一行quant_aware_m ...

Python中如何进行定点量化 - How to perform fixed-point quantization in Python

我希望量化现有神经网络 model 的权重和偏差。根据我的理解，定点表示确保了权重、偏差和激活的固定位宽，具有预先确定的固定数量的 integer 和分数位。本质上我想执行训练后量化。我查看了这篇文章https://www.tensorflow.org/model_optimization/g ...

TensorFlow QAT 如何获得量化权重 - TensorFlow QAT how to get the quantized weights

如何在 TensorFlow 的量化感知训练 (QAT) 之后获取量化权重的值或获取量化感知权重。我想在 NumPy 上为应用程序使用整数量化权重。到目前为止，我使用如下，它给出了 float32 值。 ...

量化模型的 QAT 输出节点具有相同的最小最大范围 - QAT output nodes for Quantized Model got the same min max range

最近，我在 tf1.x 上进行了量化感知训练，以将模型推送到 Coral Dev Board。但是，当我完成模型训练后，为什么我的 2 个输出伪量化的最小值最大值相同？当一个人的最大目标是 95 和一个是 2pi 时，它应该不同吗？ ...

量化的 TFLite 模型比 TF 模型具有更好的准确性 - Quantized TFLite model gives better accuracy than TF model

我正在开发一个端到端的训练和量化感知训练示例。使用CIFAR 10数据集，我加载了一个预训练的MobilenetV2模型，然后使用 TensorFlow 指南中的代码来量化我的模型。整个过程正确完成后，我得到以下结果：我想知道，这怎么可能？量化应该会稍微降低准确性。我注意到在 Ten ...

tensorflow 2.2.0 中的量化感知训练产生更长的推理时间 - Quantization aware training in tensorflow 2.2.0 producing higher inference time

我正在使用 Mobil.netV2 对个人数据集进行迁移学习量化。我尝试了两种方法： i.) 仅训练后量化：它工作正常并且产生 0.04 秒的平均时间来推断 60 张 224,224 维的图像。 ii.) 量化感知训练 + 训练后量化：它比仅训练后量化产生更高的准确性，但对于相同的 60 张图 ...

Tensorflow 无法量化重塑函数 - Tensorflow cannot quantize reshape function

我将训练我的模型量化意识。但是，当我使用它时，tensorflow_model_optimization 无法量化 tf.reshape 函数，并引发错误。张量流版本：'2.4.0-dev20200903' 蟒蛇版本：3.6.9 编码：和输出：如果有人知道，请帮忙？ ...

Batch Normalization Quantize Tensorflow 1.x没有MinMax信息 - Batch Normalization Quantize Tensorflow 1.x does not have MinMax information

作为生成 output 数组模型/re_lu_1/Relu 的 Conv 运算符的输入的层 (....) 缺少量化所必需的最小/最大数据。如果精度很重要，要么以非量化 output 格式为目标，要么从浮点检查点使用 model 运行量化训练，以更改输入图以包含最小/最大信息。如果您不关心准确性， ...

op 尚不支持量化：tensorflow 2.x 的“DEQUANTIZE” - Quantization not yet supported for op: 'DEQUANTIZE' for tensorflow 2.x

我正在通过 keras 在 resnet 模型上进行 QAT，在转换为 tflite 全整数模型时遇到了这个问题。我已经尝试了最新版本的 tf-nightly，但它并没有解决问题。我在 QAT 期间使用量化注释模型进行批量归一化量化这是我用来转换模型的代码：如果我通过将tf.lite ...

使用 TF-lite 将 MobileFacenet 转换为量化感知 model 时，create_training_graph() 失败 - create_training_graph() failed when converted MobileFacenet to quantize-aware model with TF-lite

我正在尝试根据建议量化MobileFacenet （来自 sirius-ai 的代码），我认为我遇到了与这个相同的问题当我将tf.contrib.quantize.create_training_graph()添加到训练图中（train_nets.py ln.187：在train_op = tr ...