繁体   English   中英

TensorFlow 2.0 中的张量和数据集有什么区别?

[英]What is the difference between a Tensor and a DataSet in TensorFlow 2.0?

我一直无法理解张量和数据集之间的区别。 从我设法在文档中找到的定义中:

张量

张量是具有统一类型的多维 arrays

数据集

表示一组可能很大的元素。

DataSet 是一种特殊类型的大张量吗? 我的理解是,张量基本上是 pandas 数据帧,它们是沿“列”具有统一类型的 n 维结构(或者张量需要完全统一?)。 如果是这种情况,那么为什么存在 DataSet? 它们是否具有张量没有的附加功能?

我有点迷失在不同张量类型的文档中,并且随着过渡到 tensorflow 2.0 我不确定我在网上找到的信息是否已被弃用。 任何帮助,将不胜感激。

您应该阅读更多文档。 链接在您的问题中,但为了清楚起见,这里是针对TensorsDataset的。

张量是 n 维的,这意味着它们可以具有任意数量的维度。 它们不是矩形的,这将被限制为二维。

数据集是用于输入数据的 API。 如果您的数据是 Dataset 形式,那么您可以使用tf.data模块提供的各种处理方法,例如并行处理、混洗、批处理等。 您还可以将您的特征与单个数据集中的标签进行匹配,而不是使用两个单独的张量对象。

遍历数据集后,您将获得张量对象。

如果您查看TensorFlow Datasets ,也许区别也会更清楚。 该项目以数据集形式分发数据。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM