cost 104 ms
德鲁伊 sql 查询 - 对跨记录的多值字段进行明确计数 - druid sql query - count distinctly for a multi value field across records

有没有办法对德鲁伊 SQL 中的多值字段的不同行进行不同的计数,以获得特定值,其中值只在数组中计算一次? 例如,假设我有以下记录: 预期结果: 我尝试了下面的查询,但它聚合了一个数组中的字段计数,然后给出了所有记录的总计数: 结果: ...

如何从 python 程序(AWS lambda 函数)杀死 Apache Druid 中的协调器领导节点? - How to KILL coordinator Leader node in Apache Druid from a python program (AWS lambda function)?

如何从 python 程序(AWS lambda 函数)杀死 Apache Druid 中的协调器领导节点? 我正在研究德鲁伊系统。 由于元数据中的问题,一些段陷入重新平衡。 为了防止这种情况发生,我正在考虑杀死协调者领导节点。 Zookeeper 将重启节点。 我有以下疑问。 如何从 Pyth ...

即使我的 SELECT COUNT(*)... 没有时间限制,德鲁伊会继续快速工作吗? - Will Druid continue to work fast even if my SELECT COUNT(*) ... has no time boundaries?

我有一个如下所示的语句来计算总计数: 假设 Druid 每天摄取大约 100 万行数据。 行相对较小(如 20 列,最长的字符串约为 100 个字符)。 每行包括一个日期和一个标识符。 数据按 5 分钟 windows 的 id 聚合。 在数据摄取几年后, SELECT语句会继续快速吗? ...

Apache Digital Ocean Kube.netes 上的 Druid,在尝试 `mkdir /var/druid` 时收到 `Access Denied` - Apache Druid on Digital Ocean Kubernetes, receiving `Access Denied` when attempting `mkdir /var/druid`

如标题所示。 我正在尝试在 Digital Ocean 上托管的 Kube.netes 上运行 Apache Druid。 在本地,我已经在 Minikube 上运行了这个精确的配置并且它工作正常,但是当我将集群切换到 Digital Ocean 时,我在尝试创建/var/druid时在每个 po ...

如何将 Druid 数据源数据从 prod 服务器复制到 QA 服务器(如 hive distcp 操作) - How to copy Druid data source data from prod server to QA server (like hive distcp action)

我想检查是否有办法将 Druid 数据源数据(段)从一台服务器复制到另一台服务器。 我们的要求是将新数据加载到 prod Druid(使用 SQL 查询),并将相同的数据复制到 qa Druid 服务器。 我们使用 hive 德鲁伊存储处理程序加载数据,HDFS 作为深度存储。 我阅读了德鲁伊文档 ...

2022-12-26 21:42:36   1   25    druid  
在选定的日期范围内寻找唯一的客户 - Finding unique customers in a selected day range

我有一个简单的表如下: 我想从第 1 天到第 2 天找到一些独特的客户。答案是 2。 但是我的表很大,查询时间很长。 所以我想将聚合数据存储在另一个表中以减少数据大小并加快查询速度。 我从上表创建了一个新表。 现在,如果我想从第 1 天到第 2 天找到一个独特的客户,我得到 2 + 1 = 3,而答 ...

如何在德鲁伊摄取规范中正确编写 regexp_extract? - How to properly write regexp_extract in druid ingestion spec?

我正在尝试使用 regexp_extract 在德鲁伊中编写转换规范。 regexp_extract 函数在查询本身中运行良好。 列数据看起来像 但是,我无法将其放入转换规范下的摄取规范中。 我有类似的东西 这就是摄取规范的样子。 谁能帮忙,我如何正确指定正则表达式? ...

2022-12-06 23:41:36   1   57    druid  
Apache 德鲁伊段粒度 - Apache Druid segment granuality

在 Apache Druid 配置中,您可以 select 段的粒度(小时/天/周/等)。 如果稍后更改粒度会发生什么? 新设置是否仅应用于新数据而旧段将保持原样,还是也会重新生成旧段? 例如,如果我们决定将粒度从天更改为周.. ...

2022-10-10 13:05:10   3   75    druid  
访问 druid 的本地存储 - Access local storage for druid

如何访问或查看 druid 的本地存储? 我想查看片段或将片段复制到文件中。 我在 kubernetes 上运行德鲁伊操作员。 我已经尝试对历史 pod 和中间管理器 pod 执行命令,但是我无法进入任何 druid pod ...

2022-09-07 22:06:36   1   14    druid  
使用查询时,Druid Native Query 和 Druid SQL 之间存在计数差异 - There's a count difference between Druid Native Query and Druid SQL when using query

我对德鲁伊查询有疑问。 我想以小时为单位获取数据计数。 所以,我像这样使用了德鲁伊 SQL。 然后我得到了这样的回应。 但是,当使用这样的本机查询时, 有不同的结果。 我想使用 Native Query 的结果。 我的德鲁伊 SQL 查询有什么问题? 如何创建查询以获取本机查询结果? 我发现有什么不 ...

Power BI 中的 Druid 查询显示错误 - Druid query in Power BI shows errors

基于在 Postman 中完美运行的查询,我在将报告与 Druid 数据库连接时遇到问题。 所以原来的德鲁伊查询是这样的: 这适用于 Postman。 但是,当我尝试将其重写为 M 时,我收到了错误(通常是“查询”之后的“无效标识符”。 我在 M 中尝试了许多组合,但是任何与此查询连接的尝试都被拒绝 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM