有没有办法对德鲁伊 SQL 中的多值字段的不同行进行不同的计数,以获得特定值,其中值只在数组中计算一次? 例如,假设我有以下记录: 预期结果: 我尝试了下面的查询,但它聚合了一个数组中的字段计数,然后给出了所有记录的总计数: 结果: ...
有没有办法对德鲁伊 SQL 中的多值字段的不同行进行不同的计数,以获得特定值,其中值只在数组中计算一次? 例如,假设我有以下记录: 预期结果: 我尝试了下面的查询,但它聚合了一个数组中的字段计数,然后给出了所有记录的总计数: 结果: ...
如何从 python 程序(AWS lambda 函数)杀死 Apache Druid 中的协调器领导节点? 我正在研究德鲁伊系统。 由于元数据中的问题,一些段陷入重新平衡。 为了防止这种情况发生,我正在考虑杀死协调者领导节点。 Zookeeper 将重启节点。 我有以下疑问。 如何从 Pyth ...
我有一个如下所示的语句来计算总计数: 假设 Druid 每天摄取大约 100 万行数据。 行相对较小(如 20 列,最长的字符串约为 100 个字符)。 每行包括一个日期和一个标识符。 数据按 5 分钟 windows 的 id 聚合。 在数据摄取几年后, SELECT语句会继续快速吗? ...
如标题所示。 我正在尝试在 Digital Ocean 上托管的 Kube.netes 上运行 Apache Druid。 在本地,我已经在 Minikube 上运行了这个精确的配置并且它工作正常,但是当我将集群切换到 Digital Ocean 时,我在尝试创建/var/druid时在每个 po ...
我想检查是否有办法将 Druid 数据源数据(段)从一台服务器复制到另一台服务器。 我们的要求是将新数据加载到 prod Druid(使用 SQL 查询),并将相同的数据复制到 qa Druid 服务器。 我们使用 hive 德鲁伊存储处理程序加载数据,HDFS 作为深度存储。 我阅读了德鲁伊文档 ...
我有一个简单的表如下: 我想从第 1 天到第 2 天找到一些独特的客户。答案是 2。 但是我的表很大,查询时间很长。 所以我想将聚合数据存储在另一个表中以减少数据大小并加快查询速度。 我从上表创建了一个新表。 现在,如果我想从第 1 天到第 2 天找到一个独特的客户,我得到 2 + 1 = 3,而答 ...
我有以下德鲁伊摄取规范,它从卡夫卡读取数据并生成一些聚合。 现在我只对伯爵感兴趣。 它有两个维度PURCHASE_STATUS和STORE_ID 。 现在我希望数据以分钟级别的粒度汇总和分桶。 现在,当我使用以下查询查询德鲁伊时 我得到以下结果 ...
我正在尝试使用 regexp_extract 在德鲁伊中编写转换规范。 regexp_extract 函数在查询本身中运行良好。 列数据看起来像 但是,我无法将其放入转换规范下的摄取规范中。 我有类似的东西 这就是摄取规范的样子。 谁能帮忙,我如何正确指定正则表达式? ...
我想向德鲁伊 API 发送带有 SQL 查询的帖子请求。我使用请求 package 发出请求: 我得到的唯一结果是代码:405。当我在 Chrome 中检查 the.network 时,当 POST 请求在德鲁伊控制台上的结果成功时, URL 和 Payload 完全相同,除了有一个名为Remote ...
我正在尝试 Druid 连接 TDengine。 url jdbc:TAOS-RS://127.0.0.1:6041/test?user=xxx&password=xxxx 然后我收到以下错误: 如果我直接用JDBC就可以了。 可能是什么问题? ...
在 Apache Druid 配置中,您可以 select 段的粒度(小时/天/周/等)。 如果稍后更改粒度会发生什么? 新设置是否仅应用于新数据而旧段将保持原样,还是也会重新生成旧段? 例如,如果我们决定将粒度从天更改为周.. ...
我想计算过去 7 天每台设备的总和(收入)。我正在使用数据库 sql 德鲁伊,工具是 apache 超集。 ...
如何访问或查看 druid 的本地存储? 我想查看片段或将片段复制到文件中。 我在 kubernetes 上运行德鲁伊操作员。 我已经尝试对历史 pod 和中间管理器 pod 执行命令,但是我无法进入任何 druid pod ...
我有一个关于德鲁伊查询的问题。 我正在尝试编写一个 SQL 代码,计算一个简单的下一个事件类型: 我尝试使用通常的 sql 查询: 但我收到一个错误: 是否可以在 Druid 中使用 Window 函数,如果不能,有哪些替代方案? 先感谢您。 ...
我有一个数据类型为字符串的列金额,其值为 0.0、3.0、1.4、5.6666 我想在 Apache 德鲁伊中将这些四舍五入到小数点后 2 位。 例如:0.0 应该是 0.00 3.0 应该是 3.00 5.6666 应该是 5.67 ...
我对德鲁伊查询有疑问。 我想以小时为单位获取数据计数。 所以,我像这样使用了德鲁伊 SQL。 然后我得到了这样的回应。 但是,当使用这样的本机查询时, 有不同的结果。 我想使用 Native Query 的结果。 我的德鲁伊 SQL 查询有什么问题? 如何创建查询以获取本机查询结果? 我发现有什么不 ...
我正在 Druid 控制台查询上测试 sql。 在我的结果中,我想将 __time 更改为格式化为YYYY/MM/DDThh (例如 2022/08/24T12),但我找不到在格式字符串中转义T的方法,并得到Error: Unknown exception 我的 sql: 我尝试了其他几个常见的转义 ...
I am trying to connect from a superset running on docker-compose to my druid cluster (running in 1 master, 1 historical, 1 mm and 1 query) I followed ...
基于在 Postman 中完美运行的查询,我在将报告与 Druid 数据库连接时遇到问题。 所以原来的德鲁伊查询是这样的: 这适用于 Postman。 但是,当我尝试将其重写为 M 时,我收到了错误(通常是“查询”之后的“无效标识符”。 我在 M 中尝试了许多组合,但是任何与此查询连接的尝试都被拒绝 ...
我将 Spring 数据 JPA 与德鲁伊一起使用。 我添加了依赖项 spring-boot-starter-data-jpa 和 avatica-core 以在项目中使用带有 spring 数据 ZF0B4A299C45171493AE3215D69D9B0 的 druid JDBC 驱动程序。 ...