标签[apache-tez] - 堆栈内存溢出

我如何使用 tez 执行引擎在配置单元上并行运行多个查询？ - How can i run multiple queries in parallel on hive with tez execution engine?

我们想用 tez 运行 hive 来查询 hdfs 中的数据，因为多个用户将查询 hive，所以我们需要以这种方式配置 hive，以便并行执行查询由于 tez 使用 yarn 将资源分配给多个节点，我们试图限制在 yarn 中每次查询 hive 分配的容器，但无法找到合适的配置 ...

Hive 表的 ORC 拆分生成问题 - ORC Split Generation issue with Hive Table

我在 Hadoop 3.3.4 和 Tez 0.9.2 上使用 Hive 版本 3.1.3。当我创建一个包含拆分的 ORC 表并尝试查询它时，我收到一个ORC split generation failed异常。如果我连接表格，这在某些情况下可以解决问题。然而，在其他情况下，问题仍然存在。首 ...

Hive 加盟弦乐表演 - Hive Joins on String Performance

我们正在使用 hive 3.1.3，我们正在 Cloudera 平台上的 Tez 引擎（Tez 上的 Hive）上运行查询。我们仍处于开始阶段，我们有一种情况，我们想要使用字符串列将多个表连接在一起。例如表格1 表 2 我们希望使用 table1.id = table2.id 连接表 1 和 ...

如何在hue中同时运行多个查询？ - How to run more than one query concurrently in hue?

如果我启动第二个查询，第一个查询将被自动终止。那么hue/hive/tez/yarn的任何配置都可以控制这个最大并发吗？错误信息： ...

错误：无法找到或加载主类 org.apache.tez.dag.app.DAGAppMaster - Error: Could not find or load main class org.apache.tez.dag.app.DAGAppMaster

我已经安装了 tez 并想像这样运行示例但它不起作用，日志是 my_env.sh 是 tez-site.xml 是我已经尝试回答https://issues.apache.org/jira/browse/TEZ-3392但它不起作用。请帮我解决这个问题。在此先感谢！！！ ...

hive tez mapr 分布查询与 tez 引擎有问题 - hive tez mapr distribution query have issues with tez engine

在 tez 上查询失败，但在 MR 上查询正常。我们已经尝试了许多不同的排列和组合 set... 参数但无法在 tez 中成功运行此查询。 MR 中的查询运行大约 20 分钟，但 tez 引擎，我们看到查询在集群中消耗了巨大的 memory，当这个查询运行时，我看到集群上的 memory 使用率 ...

Hive 查询需要很长时间 - Hive queries taking so long

我有一个运行 Hive 的 CDP 环境，由于某种原因，一些查询运行得非常快，而另一些则需要 5 分钟以上才能运行，即使是常规的 select current_timestamp 或类似的东西。我看到我的集群使用率很低，所以我不明白为什么会这样。如何充分使用我的集群？我在cloudera网站上 ...

Apache Tez 任务在 Application Master 处暂停 - Apache Tez tasks on hold at the Application Master

我有一个 tez 问题，当同时运行大约 14 个查询时，其中一些会出现超过 5 分钟的延迟，但集群利用率仅为 14%。这就是我正在谈论的信息。 INFO SessionState: [HiveServer2-Background-Pool: Thread-322319]: Get Query Co ...

Hive LLAP 抛出无法处理容器端口映射 - Hive LLAP throws Unable to process container ports mapping

我试图让 Hive LLAP 在我的服务器上运行。到目前为止，我的设置是：Hadoop 3.31，tez 0.9.2，hive 3.1.2，zookeper 3.7.0 全部来自 tar 文件。 Tez 上的 Hive 正在工作。选择返回预期结果。现在我想让 LLAP 运行，所以我设置了配置 ...

有没有我们不想重复使用 tez 容器的场景？ - Is there any scenario where we wouldn't want to reuse tez containers?

几天前，在我的一个项目中，我开始使用 hive 和 tez。在那段时间里，我遇到了这个属性tez.am.container.reuse.enabled很多网站都建议将其保留为 true。我明白这是由于：将新容器的请求限制为 RM 降低容器启动的成本，从而节省时间但我想不出任何我们 ...

java.lang.OutOfMemoryError: Java 执行 Hive 查询时出现堆空间错误 - java.lang.OutOfMemoryError: Java heap space error while executing Hive query

While running the Hive query from Hive Shell using TEZ execution engine, I am getting java.lang.OutOfMemoryError: Java heap space error in the logs, ...

hive alter table concatenate 命令风险 - hive alter table concatenate command risks

我一直在使用 tez 引擎来运行 map 减少作业。我有一个需要很长时间才能运行的 MR 作业，因为我注意到我有超过 20k 个文件，每个文件都有 1 个条带，并且 tez 并没有根据文件数量而不是条带数量均匀分布映射器。而且我可以拥有一堆带有 1 个文件但有很多条纹的映射器，并且一些映射器处理 ...

合并 output 文件时出现 java.lang.NullPointerException - java.lang.NullPointerException when merging output files

我有一个包含 3 个分区列的表城市分区可以有从几mb到几百mb。我正在尝试优化存储，以便将所有小文件合并为一个等于 128mb 块大小的文件，并相应地拆分更大的文件。源表有 200 个文件，每个文件大约 150 mb。它没有分区。我为此做了一个简单的插入语句。使用以下设置并得到此错误N ...

hive 如何管理基于非 Tez 和非 MapReduce 的查询 - How hive manage the Non-Tez and Non-MapReduce based queries

我在 Hive 2.3.6（MapR Hadoop Distribution 6.3.0）上触发了上述查询。默认 hive 引擎是 tez。因此，在触发查询后，我看不到任何 TEZ 应用程序在纱线资源管理器 web ui上启动所以我将执行引擎更改为 MapReduce。并尝试再次运行相同的查 ...

Hive query throw “code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask” exception when query has GROUP BY cluase - Hive query throw “code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask” exception when query has GROUP BY cluase

我在 HDP 3.1.4 上有 Hive + LLAP Hive 和 Tez 配置是：以下查询正常运行：但是在以下查询中使用 group by 表达式时：我已经尝试了很多配置，但是抛出了这个很长的异常： ...

运行 MR/TEZ/SPARK 作业的纱线 ui 中的队列百分比和集群差异百分比 - % of Queue and % of Cluster difference in yarn ui for MR/TEZ/SPARK jobs run

在调试 TEZ/SPARK/MR 作业时，我可以在 YARN UI 中看到以下作业详细信息。有人请帮我处理 % of Queue 和 % of Cluster stats，因为它显示 1815% 的使用率？ ...

如何通过 sqoop 作业通过 Hive conf - How to pass Hive conf with sqoop job

如何通过 Sqoop 导入作业传递 hive conf 参数。我每次都使用 hive cli 中的 hive conf。 ...

hive 上的 tez 错误：java.lang.OutOfMemoryError - hive on tez error:java.lang.OutOfMemoryError

在具有更多 70 列的 hive 表上按日期执行分区时遇到此错误： ERROR: Status: Failed ERROR: Vertex failed, vertexName=Map 1, vertexId=vertex_1612203694878_0265_4_00, diagnostics ...

Hive 在运行插入查询时返回错误 - Hive returning error while running insert query

我正在尝试使用 mapreduce 运行插入查询并面临以下错误由于 AM Container for appattempt_1609169302439_0001_000002 退出，应用程序 application_1609169302439_0001 失败 2 次，退出代码：1 失败。诊断：[20 ...

tez shuffle 处理程序设置后失败：Map 操作员初始化失败 - Failure after tez shuffle handler setup : Map operator initialization failed

在设置 Tez Shuffle 处理程序后，请遵循以下说明： https://tez.apache.org/shuffle-handler.html执行中出现以下错误： Vertex failed, vertexName=Map 2, vertexId=vertex_1608273679503_0 ...