
[英]Vertex did not succeed due to OWN_TASK_FAILURE, failedTasks:1 killedTasks:0, Vertex vertex_1652074645349_0075_3_01 [Map 1]
...
[英]Vertex did not succeed due to OWN_TASK_FAILURE, failedTasks:1 killedTasks:0, Vertex vertex_1652074645349_0075_3_01 [Map 1]
...
[英]Hive query to find conversion ratio
我正在 Hive 中尝试此查询,但它不起作用。 我得到的错误:无法识别表达式规范中的“选择”“计数”“(”附近的输入 我基本上是想获得查看页面并单击按钮预订出租车的客户的转化率。 ...
[英]hive convert array<map<string, string>> to string
我在 hive 表中有一个类型为array<map<string, string>>的列,我正在努力如何使用 hql 将此列转换为string ? 我在这里找到帖子Convert Map<string,string> to just string in hive ...
[英]Hive SQL: How to create flag occurrence while join with other table
我想检查我的 A 表成员是否出现在 B 表中? 这里的问题是表 A 和表 B 都有数百万条记录,而表 B 有重复记录。 所以我不能做左加入。 运行需要数小时。 表 A 表 B 输出 ...
[英]Select rows without the maximum amount or rows from grouping
我有一个名为 MyTable 的表,其中包含 A、B 列,然后是其他多个值无关紧要的列。 我想要做的是过滤掉所有的行,当我们按 A 对数据进行分组时,会给出给定 B 的最大行数。如果数据看起来像这样,用一个例子可能更容易解释 输出将是 用 (a, f) 过滤掉所有数据,因为其中有 3 个, ...
[英]extract a string before certain punctuation regex
如何提取第一个标点符号前的单词| 很快 SQL? 桌子 Output 试图REGEXP_EXTRACT(title, '(.*)([^|]*)', 1) 谢谢 ...
[英]HQL, insert two rows if a condition is met
我在Hive中有名为 table_persons 的下表: 如果类型是“bot”,我必须在表 d1_info 中添加两行,否则如果类型是“per”,我只需要添加一行,所以结果如下: 如果满足此条件,如何添加两行? 什么时候可以? ...
[英]how to include 0 results in count with group by in HIVEQL
我是HIVE的新手,我想在结果中包含0行我有一张桌子 这是我的查询 示例结果是 但我想要的结果是 我怎样才能得到 0 的结果? ...
[英]How to drop hive partitions with hivevar passed as partition variable?
我一直在尝试运行这段代码以从 hive 表中删除当天的分区,但由于某种原因它不会从 hive 表中删除分区。 不确定有什么问题。 它运行没有任何错误但不起作用但不会删除分区。 表是内部/托管的。 我尝试了堆栈上提到的不同方法,但它对我不起作用。 帮助。 ...
[英]How Create a hive external table with parquet format
我正在尝试使用 HDFS 中的以下查询在 hive 中创建一个外部表。 出现错误编译语句时出错:失败:ParseException 行 11:2 在“)”附近的“位置”缺少 EOF 使用以 parquet 格式存储的数据创建 HIVE 外部表的最佳方法是什么? ...
[英]Hive: Unsupported SubQuery Expression 'extract_date': Only SubQuery expressions that are top level conjuncts are allowed
我是 HIVE 的新手,我目前在 WSL2 上使用 HIVE 3.1.2,我正在尝试使用命令hive -f test2subquery.883687882623在 HIVE CLI 上运行这个 SQL 脚本:use mydb; SELECT date_photo as extract_da ...
[英]Generate new column based on other columns and previous row value
我有一张员工表,其中我计算了每个员工在 12 个月中每个月的总销售额。 销售运行总计的某些值缺失,如下所示: e_id 月 sales_run_total e1 简 10 e1 二月 null e1 行进 null e1 四月 40 ... ... ... e1 十二月 120 ...
[英]How to transform data in Amazon Athena
我在 S3 位置有一些数据,格式为 json。 它有 4 列val 、 time__stamp 、 name和type 。 我想通过下面给出的一些转换从这些数据创建一个外部 Athena 表: timestamp :timestamp 应该从 unix 纪元转换为 UTC,这是我使用 timest ...
[英]How can I create a table if it doesn't exist, else alter the table schema to match in HiveQL
我有一个自动化的工作流程,它基本上是从一堆其他现有表格中构建出一个表格。 我们被要求相对频繁地向该表和其他表添加新字段。 目前我必须手动输入 go 并更改现有表以添加列,但我希望能够实现自动化,因为它非常麻烦且容易出错,尤其是当我们需要针对生产表执行此操作时。 我们所有的工作流程都是幂等的,因此它们 ...
[英]How to Handle Multiline record in Hive table
建表语句: 如果我在单行中拧紧 Jsonfile 数据,对于每条记录,它工作正常,但如果它在多行中,则低于错误。 错误信息: Error: java.io.IOException: org.apache.hadoop.hive.serde2.SerDeException: Row is not ...
[英]How to write a shell script that will alter tables drop partitions in hive for more than 10 days for multiple tables(by importing a hql file)
我想写一个 shell 脚本,它将删除 hive 中分区超过 10 天的多个表的分区,有人可以帮我解决吗我只能为一张表硬编码,但我不想硬编码任何东西,因为我需要用 oozie 部署它,所以我想让一切都动态化 ...
[英]Compare data with previous day | Hive HQL
我有一个名为table_1的表,其中包含一些用户的所有历史记录,您可以在此处看到 2022 年 3 月 2 日这一天: 第二天,我遇到了同样的事情,但文档发生了变化: 如您所见,在 2022 年 3 月 3 日那天,“文档”列发生了变化。 我想要做的是在一个新表中获取这些信息,其中的行有变化,在这种 ...
[英]How can I concatenate all values in descending order that have the same primary key in HIVE?
我正在使用 HIVE 并且我有一个这样的表: 编号 ID 申请人数 f_name 我的名字首要的关键 1个 123 202201A1 阿基尔亚达夫 123~&~阿基尔~&~亚达夫 2个 123 202202A2 阿基尔亚达夫 123~&~阿基尔~&~亚达夫 3个 ...
[英]Select row each time value changes based on date order
美好的一天希望我能很好地解释我的问题。 我没有任何示例查询,因为我无法进行任何工作。 但我的问题是我有一个表格,其中包含帐户列表及其状态以及帐户发生更改的日期。 我需要提取帐号,并且每次状态更改时都会连同它更改的第一个日期一起更改。 我试过使用 rank 和 min(date) 和 max(date ...
[英]How to use Hive TABLESAMPLE with subquery
我正在使用Hive 版本 1.1.0 。 我正在尝试使用带有子查询的TABLESAMPLE语句从表中获取样本以使用WHERE子句。 但是我有一个错误: 如何在子查询中正确使用TABLESAMPLE ? ...