一个 460MB 的 CSV 文件被导入到具有相同模式的 OLAP 数据库和 TSDB 数据库中。 OLAP 数据库的大小是 107M,而 TSDB 的大小是惊人的 1.5G。 为什么会这样? 有什么办法可以提高TSDB引擎的数据压缩率? 这是我的表创建脚本: ...
一个 460MB 的 CSV 文件被导入到具有相同模式的 OLAP 数据库和 TSDB 数据库中。 OLAP 数据库的大小是 107M,而 TSDB 的大小是惊人的 1.5G。 为什么会这样? 有什么办法可以提高TSDB引擎的数据压缩率? 这是我的表创建脚本: ...
假设一个数据库定义了 100 万个基于值的分区,但数据只导入到 10 个分区中。 在 DolphinDB 中,只有在导入数据时才会生成实际的分区。 因此,如果定义的分区比包含数据的实际分区多得多,这对查询速度有何影响? ...
我创建了一个 UDF 并在where子句中使用它,如下图所示。 但是报错如下: 为什么会这样? 在这样的子句中创建 UDF 时,有什么我应该注意的吗? ...
我在 Python 中运行以下脚本: Output(DataFrame型): 如果我按如下方式运行脚本: Output(属于 <class 'method'> 数据类型): 如何获取标量类型的记录数? ...
以下脚本定义了一个 stream 表,其中“askPrice”和“bidPrice”列是 DOUBLE 类型的数组向量。 Python中的脚本: 但是当我运行脚本时出现异常: 我尝试使用以下脚本更改列 askPrice 和 bidPrice 的数据类型,但仍然失败: 报错信息如下: 以下是相关包 ...
当使用反应式 state 引擎处理 stream 数据时,我想计算最后十行中有多少行与当前行具有相同的值。 有什么办法吗? ...
我创建了以下 3 个 mvcc 表 有没有办法在 DolphinDB 启动时自动加载所有这些表? ...
如何查看 DolphinDB 中加载的模块? 或者,哪个命令可用于访问在 GUI 或启动脚本 (startup.dos) 中执行的模块? ...
我有一张桌子 对于价格列的缺失值,如 102、104 和 105,我想用 n=0 来填充它。 ...
例如,我有一个数组data = 0 0 0 0 0 0 1 1 1 。 我想获取数组中第一个非零元素的索引。 ...
我有一个表如下: 我想查询具有多个字段值的数据。 查询条件: 字段值“Id=1”,“area”= A, F, G; 字段值“Id=2”, “area” = B, C, D; 字段值“Id=3”, “area“ = B, C, G; 我尝试了以下方法,使用 where 子句查询每条记录。 代码很简单 ...
我有一个 DolphinDB 表“t1”。 现在我想把R中的append data.frame改成“t1”,我该怎么做? (无法考虑表架构。data.frame 和 t1 的列数相同。) ...
当使用 Python API 将数据附加到 DolphinDB 时,我发现很难将 Python 日期、时间和日期时间对象转换为 DolphinDB 时间类型。 例如,我想转换以下类型: 将 9:15 保存为 MINUTE; 将 13:30:10.008 保存为时间; 将 2012.06.13 13: ...
参考: DolphinDB 用户手册。 我已经建立了一个集群。 我在文件controller.cfg中配置了logFile配置参数来指定日志文件目录。 然后我用startController.sh脚本启动服务器,日志仍然保存在与脚本相同的目录下。 我之前的配置没有生效。 为什么? ...
我有一个使用以下脚本创建的表: 在哪里 ts为时间, status表示设备状态(0:down;1:running), val表示运行时间。 假设我有以下数据: 那么如何计算最长连续运行时间呢? 例如,第 7 条和第 8 条记录的状态均为 1,我想对它们的val值求和。 或者第14-15条记录,我想总 ...
我使用2种不同的方法来查询DolphinDB Python API中的数据。第一种使用loadTableBySQL方法,第二种使用select方法: 为什么第二种方法比第一种方法表现出更好的性能 100 倍? ...
在 DolphinDB 中,似乎我无法使用 TSDB 存储引擎为createPartitonedTable的sortColumns指定非时间列。 或者有没有其他方法可以将非时间列指定为分区表中的“主键”? 我的表有 4 列: 时间列“DateTime“ 2列ID:“id_key”和“id_par ...
我有一个表格如下(只是举个例子): 第一列是日期列,rest列存放的是yield的数据。 我想获取每列(不包括日期列)及其对应日期的最大/最小值。 例如,对于“ret1”列,我的预期结果是 0.6683(最大值)/2022.01.03(日期)和 0.1531(最小值)/2022.01.02(日期) ...
以下数据是从一个 CSV 的报价数据文件中读取的。 我有一列字符串类型的“引号”,如下所示: 例如,字段“quotes”的值将是: 我提取项目并扩展到 Python 中的多个字段: 这是我希望获得的表格: 但是这样处理一个领域需要很长时间。 有什么办法可以在 DolphinDB 中有效地实现它吗 ...