cost 298 ms
mysql 表中的数据操作 - Data manipulation in a mysql table

我在表中有 2 列有不正确的条目。 该表的大小达到数十亿条记录。 我曾想在两列(c1 和 C2)之间交换数据 所采取的方法是将小块数据导出到 CSV 文件中,然后使用更正的条目将其导入回来。 例如,下面是数据集 然后我将数据导出到分号分隔的 CSV 文件(未显示完整命令),如下所示 此类命令 ...

大型数据库中的数据交换 - Data swap in a large database

我的表中有28亿条记录。 该表使用在MySQL安装上运行的INFOBRIGHT引擎。 我在表中有一些不正确的条目,希望得到纠正。 表测试具有350个奇数列。 我想将数据从列P1交换到列P3,以获得一些记录(不是全部)。 我计划用来迁移数据的方法如下 使用MySQL的INT ...

在文本字段中加载带换行符的文件 - Loading a file with newline characters in text field

所以我有数据,其中所有字段都用引号括起来,并用管道分隔。 某些字段中包含html文本,因此在字段中有新行字符。 我希望这些新行字符成为文本字段的一部分。 数据看起来像这样: “abcd”|“1”|“”|“abcdegf “|” ABCD” 此外,html数据是大量的文本( ...

信息查询 - Infobright Queries

我在Infobright中有一个事实表,其中有大约4000万行。 在该表上运行查询(如下所示)需要10分钟以上的时间。 任何想法为什么以及如何调整它? 顺便说一句,硬件规格是AWS m1.large。 因此,除了网络延迟之外,这仍然是一个重要的时间间隔。 ...

尝试根据活动阈值找出每月用户流失的SQL查询 - Trying to figure out SQL query for monthly user churn based on an activity threshold

我有一个表(我们在InfoBright列存储中,并且我使用MySQL Workbench作为我的界面),该表实质上跟踪用户和带有日期戳的活动计数。 这是每日汇总表。 模式本质上是 我要查找的是每个月都有多少用户在搅动,一个活跃的用户定义为一个每月活动计数总计> 10的用户 ...

Brighthouse内存不足错误 - Brighthouse out of memory error

一年多来,我们一直在轻松使用Infobright社区版,完全没有问题。 它甚至与占用更多资源的数据库(postgreSQL数据库)共享服务器。 突然,它开始给我们带来错误。 “光彩夺目的记忆”。 我尝试将ServerMainHeapSize参数从默认的600增加到4000,并将相应的 ...

2013-03-20 01:00:00   1   558    infobright  
如何处理大数据数据集市/事实表? (2.4亿行) - How to tackle a BIG DATA Data Mart / Fact Table? ( 240 millions of rows )

我们有一个BI客户,他们的销售数据库表每月产生大约4千万行,这些行是根据他们的销售交易生成的。 他们希望使用5年的历史数据构建销售数据集市,这意味着该事实表可能会有大约2.4亿行。 (40 x 12个月x 5年) 这是结构良好的数据。 这是我第一次面对这么多数据,这让我分析了像I ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM