Tensorflow Java API-第1次预测时间与第2次或更长时间

Question

我遇到的问题是，如果我使用Java api加载模型并进行预测，那么第一个模型所花的时间将比其他任何模型都要长。 有一些像这样的惰性评估，我的意思是直到第一个预测才加载模型权重？ 这是什么原因呢？

        try (Session s = load.session()) {
            Tensor result = null;
            startTime = System.nanoTime();
            result = s.runner().feed("input", data).fetch("prediction").run().get(0);
            endTime = System.nanoTime();
            System.out.println(String.format("First prediction performance: %.4f ms", ((double)endTime - startTime)/1000000));

            startTime = System.nanoTime();
            result = s.runner().feed("input", data).fetch("prediction").run().get(0);
            endTime = System.nanoTime();
            System.out.println(String.format("2nd prediction performance: %.4f ms", ((double)endTime - startTime)/1000000));

            System.out.println(result.toString());

        }

一次预测性能：10.6066毫秒
第2次预测性能：0.4776毫秒

Answer 1

简短答案

是的，这是正常现象，不是引起警报的原因。

更长的答案

Tensorflow使用一个图形（我确定您已经意识到）来定义操作的顺序和流程。 它没有定义在定义它们时如何最佳执行它们。 在第一次运行时就已经解决了所有问题。 所以是的，有些延迟加载或更精确的是延迟计算。

您很有可能会使用TensorFlow处理成千上万的条目，因此前1个条目比正常时间长10ms的事实应该不是问题。 如果您将TensorFlow作为服务使用，则可能需要长时间保持会话打开状态，类似于您为多个查询保持SQL连接打开状态，而不是通过tcp / ip或每个请求重新连接的方式。

Tensorflow Java API-第1次预测时间与第2次或更长时间

问题描述

1 个解决方案

解决方案1
1 已采纳 2017-06-16 23:36:17

简短答案

更长的答案

Tensorflow Java API-第1次预测时间与第2次或更长时间

问题描述

1 个解决方案

解决方案1 1 已采纳 2017-06-16 23:36:17

简短答案

更长的答案

解决方案1
1 已采纳 2017-06-16 23:36:17