我想在自动化查询方面获得一些帮助。 目标是获取最新数据,数据每天都会刷新,但开始日期应保持不变。 例如:开始日期为 2023 年 1 月 1 日,但今天的结束日期应为 2023 年 1 月 13 日,第二天为 2023 年 1 月 14 日,但开始日期保持不变(2023 年 1 月 1 日)。 我已 ...
我想在自动化查询方面获得一些帮助。 目标是获取最新数据,数据每天都会刷新,但开始日期应保持不变。 例如:开始日期为 2023 年 1 月 1 日,但今天的结束日期应为 2023 年 1 月 13 日,第二天为 2023 年 1 月 14 日,但开始日期保持不变(2023 年 1 月 1 日)。 我已 ...
我有一个字符串字段,其中包含如下记录 “哈利·波特 (HP) (ab-cd)” “无名氏 (ab-cd)” “理查德·史密斯 (RS)” “威廉·约翰逊” 我想从所有记录中删除“(ab-cd)”部分,而不删除任何其他括号中的表达式。 结果应该是:“Harry Potter (HP)” “John ...
我想弄清楚如何在不计算重复实例的情况下计算学生在线的所有实例。 例如,在下面的屏幕截图中,我想看到一列仅计算学生登录的实例。因此,如果学生 A 在凌晨 5 点登录,则计数 = 1。学生 B 在 7 点登录,计数 = 2 . 在某个时候,学生 A 注销并在上午 8 点重新登录,计数应该是 2,而不是 ...
我正在尝试提取截至当前日期与去年同期相比的交易数据。 请看代码: 我希望提取 2023-01-01 到当前日期的实例数据和 2022-01-01 到类似日期的数据,即 2023-01-01 -2023-01-05 和 2022-01-01 -2022- 01-05 无需手动输入日期范围,而是自动刷新 ...
hive中的外部表无法删除。 那我们怎么覆盖呢? 当我们不能删除它们时,是否可以覆盖 hive 表? ...
我初始化了 hive 并且它起作用了,后来我给出了 SHOW DATABASES 命令,但是我得到了以下错误。 我使用 mysql 作为元数据。 ...
当我通过直线运行以下查询时,WHERE 子句中的过滤条件之一 ( array_item in (20, 30) ) 似乎无法正常工作。 Hive 版本: 2.1.1with sample as ( select 1 as col, array(10) a ...
我尝试使用 hive 命令 insert into table partitioned_table_name partition(partition_col) select * 来自非分区表; ...
我正在使用以下组件 - Hadoop 3.1.4、Hive 3.1.3 和 Tez 0.9.2 还有一个 ORC 表,我试图从中提取表中的行数。 select count(*) from ORC_TABLE并且这会引发以下异常集 还有另一篇文章描述了同样的问题, ORC Split Generat ...
我有一个 JSON 字符串,它存储在数据库中与父 ID 对应的单个单元格中 现在我想使用上面的 JSON 从中提取 id。 假设我们有这样的数据 我希望 output 看起来像这样 现在,我尝试了几次迭代来解决这个问题第一种方法: 但这返回的id列具有 NULL 个值。 我在这里缺少什么吗? 第二种 ...
我正在尝试对表单进行蜂巢查询 我收到了错误 我该如何解决? ...
得到这样的源数据。 而且所有的密钥都是不确定的。 我想concat(all_keys, ',') if value > 0.5 order by value desc 。 正确的结果是 'k2,k1' 我应该如何在蜂巢中做到这一点? ...
我有一个包含嵌套分区的表,例如 - 国家1 运行日期 1 运行日期 2 国家2 运行日期 1 运行日期 2 我需要静态添加第一层(国家/地区)(因为它们位于不同位置)但希望动态添加第二层(运行日期)。 我在下面尝试过但它不起作用- ALTER TABLE <table_name> AD ...
我下载了最新的 Nifi 版本。 我能够将 nifi 连接到 oracle 数据库并且工作正常。 但是,我需要将 nifi 连接到配置单元,我的问题是我找不到任何与配置单元相关的处理器。 没有 SelectHiveQL 处理器,也没有 PutHiveQL 处理器或任何与 hive 相关的处理器。 甚 ...
需要生成从给定日期范围 hive(含范围)中选择的随机日期(每个月的第一天)。 例如,如果范围是 25/12/2021 - 01/06/2022,那么我想从这组日期中随机抽取 select {01/01/2022, 01/02/2022, 01/03/2022, 01/ 04/2022、01/05 ...
我正在尝试通过排除 Hive 上 S3 内的某些文件夹来创建一个视图以从存储桶中获取数据。我能够在 Athena 上成功创建视图,但无法在 Hive 上执行相同操作。 雅典娜视图: 你能告诉我如何在 Hive 上实现同样的目标吗? ...
我在 HDFS 中创建了一个外部表table1 ,其中包含string类型的单个分区列column1 ,我正在使用 Hive 从中获取数据。 以下查询按预期在 1 秒内完成,因为数据存在于 Hive 元存储本身中。 SHOW PARTITIONS table1; 上述命令的结果还确保所有分区都存在于 ...
我需要有关 hql (hive sql) 的帮助例如,我有 hive 表,数据保存为 我需要在每一行中计算 Null。 例如,答案是 我尝试了 case when 和 sum(if..),但表中的行太多。 所以我想查找查询.. 谢谢你。 ...
我有 2 个表,我想获取两个表的所有记录。 所以我的计划是做 Union 并加入两个表,但是当我尝试这样做时,我收到一条错误消息,“编译语句时出错:失败:联合双方的 SemanticException 模式应该匹配”。 这是我的两个表表Aid name Start_date bud ...
我有这个问题:显示获得超过 10 枚金牌的国家的前 5 名比赛纪律。 我的代码是:select distinct t.discipline, m.team from teams t join medals m on (t.noc=m.team and m.numbergold>10) orde ...