我们想用 tez 运行 hive 来查询 hdfs 中的数据,因为多个用户将查询 hive,所以我们需要以这种方式配置 hive,以便并行执行查询由于 tez 使用 yarn 将资源分配给多个节点,我们试图限制在 yarn 中每次查询 hive 分配的容器,但无法找到合适的配置 ...
我们想用 tez 运行 hive 来查询 hdfs 中的数据,因为多个用户将查询 hive,所以我们需要以这种方式配置 hive,以便并行执行查询由于 tez 使用 yarn 将资源分配给多个节点,我们试图限制在 yarn 中每次查询 hive 分配的容器,但无法找到合适的配置 ...
我在 Hadoop 3.3.4 和 Tez 0.9.2 上使用 Hive 版本 3.1.3。 当我创建一个包含拆分的 ORC 表并尝试查询它时,我收到一个ORC split generation failed异常。 如果我连接表格,这在某些情况下可以解决问题。 然而,在其他情况下,问题仍然存在。 首 ...
我们正在使用 hive 3.1.3,我们正在 Cloudera 平台上的 Tez 引擎(Tez 上的 Hive)上运行查询。 我们仍处于开始阶段,我们有一种情况,我们想要使用字符串列将多个表连接在一起。 例如表格1 表 2 我们希望使用 table1.id = table2.id 连接表 1 和 ...
如果我启动第二个查询,第一个查询将被自动终止。 那么hue/hive/tez/yarn的任何配置都可以控制这个最大并发吗? 错误信息: ...
我已经安装了 tez 并想像这样运行示例 但它不起作用,日志是 my_env.sh 是 tez-site.xml 是 我已经尝试回答https://issues.apache.org/jira/browse/TEZ-3392但它不起作用。 请帮我解决这个问题。在此先感谢!!! ...
在 tez 上查询失败,但在 MR 上查询正常。 我们已经尝试了许多不同的排列和组合 set... 参数但无法在 tez 中成功运行此查询。 MR 中的查询运行大约 20 分钟,但 tez 引擎,我们看到查询在集群中消耗了巨大的 memory,当这个查询运行时,我看到集群上的 memory 使用率 ...
我有一个运行 Hive 的 CDP 环境,由于某种原因,一些查询运行得非常快,而另一些则需要 5 分钟以上才能运行,即使是常规的 select current_timestamp 或类似的东西。 我看到我的集群使用率很低,所以我不明白为什么会这样。 如何充分使用我的集群? 我在cloudera网站上 ...
我有一个 tez 问题,当同时运行大约 14 个查询时,其中一些会出现超过 5 分钟的延迟,但集群利用率仅为 14%。 这就是我正在谈论的信息。 INFO SessionState: [HiveServer2-Background-Pool: Thread-322319]: Get Query Co ...
我试图让 Hive LLAP 在我的服务器上运行。 到目前为止,我的设置是:Hadoop 3.31,tez 0.9.2,hive 3.1.2,zookeper 3.7.0 全部来自 tar 文件。 Tez 上的 Hive 正在工作。 选择返回预期结果。 现在我想让 LLAP 运行,所以我设置了配置 ...
几天前,在我的一个项目中,我开始使用 hive 和 tez。 在那段时间里,我遇到了这个属性tez.am.container.reuse.enabled很多网站都建议将其保留为 true。 我明白这是由于: 将新容器的请求限制为 RM 降低容器启动的成本,从而节省时间 但我想不出任何我们 ...
While running the Hive query from Hive Shell using TEZ execution engine, I am getting java.lang.OutOfMemoryError: Java heap space error in the logs, ...
我一直在使用 tez 引擎来运行 map 减少作业。 我有一个需要很长时间才能运行的 MR 作业,因为我注意到我有超过 20k 个文件,每个文件都有 1 个条带,并且 tez 并没有根据文件数量而不是条带数量均匀分布映射器。 而且我可以拥有一堆带有 1 个文件但有很多条纹的映射器,并且一些映射器处理 ...
我有一个包含 3 个分区列的表 城市分区可以有从几mb到几百mb。 我正在尝试优化存储,以便将所有小文件合并为一个等于 128mb 块大小的文件,并相应地拆分更大的文件。 源表有 200 个文件,每个文件大约 150 mb。 它没有分区。 我为此做了一个简单的插入语句。 使用以下设置并得到此错误N ...
我在 Hive 2.3.6(MapR Hadoop Distribution 6.3.0)上触发了上述查询。 默认 hive 引擎是 tez。 因此,在触发查询后,我看不到任何 TEZ 应用程序在纱线资源管理器 web ui上启动所以我将执行引擎更改为 MapReduce。 并尝试再次运行相同的查 ...
我在 HDP 3.1.4 上有 Hive + LLAP Hive 和 Tez 配置是: 以下查询正常运行: 但是在以下查询中使用 group by 表达式时: 我已经尝试了很多配置,但是抛出了这个很长的异常: ...
在调试 TEZ/SPARK/MR 作业时,我可以在 YARN UI 中看到以下作业详细信息。 有人请帮我处理 % of Queue 和 % of Cluster stats,因为它显示 1815% 的使用率? ...
如何通过 Sqoop 导入作业传递 hive conf 参数。 我每次都使用 hive cli 中的 hive conf。 ...
在具有更多 70 列的 hive 表上按日期执行分区时遇到此错误: ERROR: Status: Failed ERROR: Vertex failed, vertexName=Map 1, vertexId=vertex_1612203694878_0265_4_00, diagnostics ...
我正在尝试使用 mapreduce 运行插入查询并面临以下错误由于 AM Container for appattempt_1609169302439_0001_000002 退出,应用程序 application_1609169302439_0001 失败 2 次,退出代码:1 失败。诊断:[20 ...
在设置 Tez Shuffle 处理程序后,请遵循以下说明: https://tez.apache.org/shuffle-handler.html执行中出现以下错误: Vertex failed, vertexName=Map 2, vertexId=vertex_1608273679503_0 ...