繁体   English   中英

如果表a是表b的子集,那么在黑斑羚中查找的最佳方法是什么?

What are the best way to find out in impala if table a is a subset of table b?

提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供   中文繁体   英文版本   中英对照 版本,有任何建议请联系yoyou2525@163.com。

我在Impala中有两个基于镶木地板的外部表,想知道一个表是否是另一个表的子集,什么是最好的方式?

这两个表具有相同的架构,具有十几个甚至上百个字段

谢谢。

1 个回复

假设在两个表中都没有重复项,则如果来自以下项的计数,则A将是B的子集:

select count(*)
from B;

与以下来源的计数相同:

select count(*)
from ((select * from a) union
      (select * from b)
     ) ab;

也就是说,将A的行添加到B并消除重复项不会再添加任何行。

这不是严格的子集关系,因为“ A”可能等效于“ B”。 对于严格的子集关系,请添加以下条件:

select count(*)
from A

严格小于B的数量。

这假设AB中的类型和列是兼容的-如果您要问一个是另一个的子集,这是一个合理的假设。

1 复制黑斑羚表的最佳方式

我有一些在tables/dir1/下创建的黑斑羚表。 下划线格式是 HDFS 中的镶木地板文件。 需要在另一个文件夹tables/dir2/下重现此表。 原因是dir1用户无权访问dir2 。 两个表都需要存在并起作用。 想知道这样做的好方法是什么? 使用气流调度另一个任务使用相同的ddl在tabl ...

3 用grep查找列表子集的最佳方法是什么?

我当前的解决方案: file1的内容将类似于: file2的内容将类似于: 和所需的输出到文件将是这样的: 当根据第二个列表中的名称搜索大列表的子集时,做这样的事情的最佳方法是什么? 任何建议,将不胜感激! 谢谢, ...

2010-09-21 23:00:07 3 114   shell
4 找出一天中一个表包含的最大记录数的最佳方法是什么?

我目前正在使用使用Laravel框架的LAMP堆栈,我们在MySQL中使用一个sessions表来管理用户会话。 如果用户的会话到期,则将其记录从该表中删除(120分钟无活动/注销),并且当用户新登录应用程序时,将添加一条新记录。 已经在应用程序中执行操作的已登录用户的现有sessions记录已更新 ...

6 MySQL PHP从表B中获取与表A中给定列不匹配的条目的最佳方法是什么

标题应该是不言自明的,但我会详细说明。 我有一个表A,称为“页面”,其基本结构如下: 我有一张表B,叫做“菜单”,基本结构如下(当然有很多: 我想知道从资源角度来看,获取表A中所有尚未在表B的“链接”列中使用的所有“名称”的最佳方法是什么(也就是说:page1,page2, ...

8 查询联接表子集的有效方法是什么

我的查询有点像这样 在上述情况下,表A和表B是大型表(可能包含超过一百万行),但是表C很小,只有25行。 我已经在所有表的主键上应用了索引。 在我们的应用场景中,我只需要在TableC中搜索两个条件,即TableC.SomeColumn = 'XXX'或TableC.Some ...

9 在Postgres中将表的一部分行从一个数据库复制到另一个数据库的最佳方法是什么?

我有一个生产数据库,比如一千万行。 我想从生产过去一小时中提取10,000行左右,然后将它们复制到我的本地方框中。 我怎么做? 假设查询是: 如何获取输出,将其导出到某种转储文件,然后将该转储文件导入到我的本地数据库开发副本中 - 尽可能快速,轻松地? ...

10 查找每个外键的表的最大记录的最佳方法是什么?

在工作中,我经常必须找到每个外键的最大状态。 在大多数情况下,我总是在联接上使用相关的子查询来获取正确的记录。 假设最高主键是最新的。 这是一个小样 在我使用的大多数查询中,这都非常快,更不用说能够在类型列的子查询中添加额外的条件了。 我尝试使用NOT EXIST子句来确保没有更 ...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2021 STACKOOM.COM