繁体 English 中英

当Titan执行查询时，HDFS中存储的内容以及为什么map-reduce计算速度如此之快？

[英]What is stored in HDFS and why map-reduce compute so fast when Titan execute queries ？

原文 2016-08-22 12:44:16 3 1 database/ hadoop/ graph/ hbase/ titan

我现在正在学习泰坦。 我在远程模式下使用Titan和HBase。

现在有三个问题让我很困惑。 我在下面描述了它们：

在TinkerPop3文档中，它说“任何OLAP操作的结果都存储在可通过hdfs访问的HDFS中。” 但是现在我使用Titan进行OLTP，以及在这种情况下存储在HDFS中的内容是什么？
当我们使用Titan连接HBase成功（通过Java IDE）时，我们可以看到在HBase shell中创建的表并扫描内容。 表中内容'列'的含义是什么？它们是否表示图中的顶点id？
当我测试Titan的性能时，我观察到查询的速度比正常的map-reduce工作更快。 为什么泰坦可以实现它？ 在Titan-Documentation中，他们使用并行map-reduce模型说Titan引擎“Titan-Hadoop”。我可以得到更详细的介绍吗？

1 个解决方案

Titan 架构图有助于显示OLTP和OLAP使用之间的区别。 请参阅架构图的右侧：TinkerPop API - Gremlin。 无论您选择哪种后端存储（Cassandra，HBase，BerkeleyDB），OLTP都是Titan最常用的用法。 使用Titan-HBase进行OLTP查询时，HDFS中不存储任何内容。 实际上，对于使用Titan-HBase的OLTP，完全不需要HDFS / Hadoop。
在HBase中扫描Titan表的内容时，您将找到该图的序列化表示。 Titan在键/列/值上使用数据压缩技术，因此您会发现数据不是人类可读的。 您可以在Titan文档中阅读有关存储布局细节的更多信息。
请参阅＃1的答案，您可能已经在运行OLTP查询。 Hadoop风格的OLAP图形处理通过图形计算机完成。 它使用TitanHBaseInputFormat从后端存储中读取数据，然后使用TinkerPop图形计算机（ Spark或Giraph ）来运行OLAP作业。 请参阅上面的架构图的左侧：GremlinGraphComputer。 Titan文档中还有一些这方面的文档。

map-reduce和nosql有什么关系？

[英]What is the relationship between map-reduce and nosql?

如何快速执行多个mysql查询

[英]how to execute multiple mysql queries fast

在多个map-reduce作业之间传递数据库连接对象

[英]Passing around DB connection objects between multiple map-reduce jobs

使用简单的map-reduce列出存储桶与bucket.get_keys（）中的所有键？

[英]Using a simple map-reduce to list all keys in a bucket vs. bucket.get_keys()?

什么是快速执行且CPU占用率低的方法-从表中的db（存储为二进制文件）中读取非规范化数据或从二进制文件中读取相同数据？

[英]What is fast to execute and low on CPU - Reading Denormalized data from db (stored as binary) in table or Reading the same from binary file?

为何操作员如此快速

[英]Why is like-operator so fast

如何仅当 hdfs 中有文件时才执行命令

[英]How can i execute a command only when there are files in hdfs

数据未存储在我的数据库中 - 为什么会这样？

[英]Data is not stored in my Database - why so?

在我的情况下减少sql查询的最佳方法是什么

[英]What is the best way to reduce sql queries in my situation

合并在一起时，非常快速和简单的查询非常慢

[英]2 very fast and simple queries are terribly slow when merged together

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 map-reduce和nosql有什么关系？如何快速执行多个mysql查询在多个map-reduce作业之间传递数据库连接对象使用简单的map-reduce列出存储桶与bucket.get_keys（）中的所有键？什么是快速执行且CPU占用率低的方法-从表中的db（存储为二进制文件）中读取非规范化数据或从二进制文件中读取相同数据？为何操作员如此快速如何仅当 hdfs 中有文件时才执行命令数据未存储在我的数据库中 - 为什么会这样？在我的情况下减少sql查询的最佳方法是什么合并在一起时，非常快速和简单的查询非常慢

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM