[英]tensorflow object detection API training and export graph
我有以下问题:当我使用自己的数据集重新训练TF对象检测API时,训练常常被取消,我不知道原因。 没有错误日志,只是被杀死。 此外,为什么在我的MODEL_DIR
仅保存了很少的model.ckpt-XXXX
?
其次,当我尝试使用提供的脚本将上述模型导出到冻结图时,在分析中发现形状不完整:
================== Model Analysis Report ======================
Incomplete shape.
训练过程model.cpkt-XXXX
后,我使用了model.cpkt-XXXX
,这是形状不完整的原因吗?
导出的模型可以用于推理,但我想它不是最佳的...
仅供参考,我对mobileSSDv2进行了1类培训,并针对以下更改修改了管道配置文件:
config {}
部分中,我将批次大小更改为12,并将步骤数更改为200 train_input_reader
和eval_input_reader {}
部分,我在TF记录和labelmap.pbtxt
添加了我的路径 eval_config {}
部分中,我将示例数更改为85(我的eval图像存储库中的图片数),并将max eval更改为5。 我在带有python 2.7的virtualenv中将ubuntu 16.04与tensoflow-GPU 1.12.0一起使用。
先感谢您。
如果您使用的是tensorflow-gpu并且有一个GPU,那么200确实是一个很小的数字 ,您在不到几分钟的时间内就可以达到这个目标(而conv-net将什么也没学到)。 至少增加到100.000。
此外,由于训练步骤数量少,您可能希望训练在开始(步骤0)和结束训练(步骤200)时保存您的模型,因此您只能得到2个模型。
如果您不更改trainer.py中的save_interval_secs ,则Tensorflow每600秒保存一次模型
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.