标签[table-statistics] - 堆栈内存溢出

我可以将时间作为 R 中的因变量 (y) 执行 ANOVA 测试吗？ - Can I perform ANOVA test with time as the dependent variable (y) in R?

我想测试蝌蚪的起源是否影响它的变态日期，也就是说，如果蝌蚪起源于北方的水池，那么它的变态会比蝌蚪起源于南方的变态早吗？为此，我希望使用 ANOVA 测试。我的代码如下所示：它确实计算了一些东西，但我不确定 R 如何处理 DATE_OF_METAMORPHOSIS 变量中的日期。如果有人知道 ...

如何使用 CSV 文件并使用 CSV 文件从用户那里获得输入？ - How to use a CSV file and use the CSV file to have an input from a user?

我通过使用 .csv 文件获得了关于车祸统计数据的数据集。我希望用户输入 State 并显示有关该 State 的所有信息以供用户查看。怎么做到的？数据集：我在想这样的事情： ...

Vertica表分析 - Vertica Table Analysis

我想分析 Verica 上的表使用情况以检查以下内容被命中最多的表是查询获得更多写入查询的表获得更多读取查询的表。所以我正在寻求 SQL 查询的帮助，或者如果有人有任何文件请指出正确的方向。谢谢。 ...

Netezza：使用 SQL / 强制生成完整统计信息 - Netezza: Generate FULL Statistics using SQL / force

有没有办法强制 netezza 使用 SQL 在表上生成完整统计信息。我知道可以通过命令行来完成，但这需要在启动此命令的机器上安装 nzsql 客户端。根据此处提到的详细信息 - https://www.ibm.com/support/pages/understanding-generate-s ...

在 package 内多次运行收集表统计信息会导致性能问题 - Running gather table statistics multiple times inside a package causes Performance Issues

我们有一个总是遇到性能问题的大 package。我们在一个月内平均收到 6 到 10 份针对此问题的票。有时程序会成功运行几分钟，有时它会运行几天只是因为出现无法解释的错误而出错。我开始对此进行深入研究，发现性能问题的可能原因有很多，例如大量未调整的 SQL 和糟糕的编码习惯等。今天让我印象 ...

为 hive 中的某些列获取“无统计信息”意味着什么？ - What is the implication of getting “No stats” for certain columns in hive?

我在日志文件中得到以下信息，但不知道这意味着什么：询问：有人可以帮忙或指导我去哪里看吗？没有答案的相关问题： Hive No Stats for 'database'@'table', Columns ...

为什么我的 table_summary 在 r 中看起来很奇怪 - Why does my table_summary looks weird in r

总初学者和非常希望有人可以帮助我（：编写以下代码来创建按城市分组的统计汇总表，但我的表格看起来很奇怪（而不是看起来像表格，它显示了表格间隔）。我应该怎么做做？表格的样子： ...

扩展统计在 PostgreSQL 中是否有任何权衡？ - Do EXTENDED STATISTICS have any trade offs in PostgreSQL?

扩展统计帮助计划者评估查询复杂性，以便选择正确的算法来处理查询。在表中的几个依赖列上创建新的统计信息可能会在数据库中的某处创建一些复杂的结构，因为它们必须通过 ANALYZ(E) 对表进行刷新。有一个表pg_statistics_ext_data我什至无法查看，因为我的主（也是唯一的）帐户没有 ...

Oracle-即使在GATHER_TABLE_STATS之后，列直方图也不会显示 - Oracle - Column Histograms Showing NONE even after GATHER_TABLE_STATS

我正在尝试在使用窗口分区的Oracle 12c中对SQL查询进行性能调整。在表PIT的HUB_POL_KEY，PIT_EFF_START_DT上创建了一个索引。在运行带有/ * + collect_plan_statistics * /提示的解释计划时，我观察到解释计划中有一个窗口排序步 ...

Oracle 12c第1版直方图用于偏斜数据 - Oracle 12c release 1 Histograms for skewed data

我们正在12.1.0.2.0数据库上运行Oracle Applications 12.2.4。当我执行以下查询时：我得到：但是当我运行时：我只会NONE Oracle Application实例怎么可能没有没有需要直方图倾斜的表？还是我不了解设置？ ...

没有权限收集表格统计信息 - No privileges to gather table stats

我有一个带有程序包的oracle程序包，该程序可以创建表，而不是授予它特权。该代码与此类似：该过程的所有者是具有DBA角色的用户。这个角色有创建任何表特权如分析任何表权限那么，为什么在我运行此过程时，在collect tabl ...

teradata使用样本收集统计信息效果不佳 - teradata collect stats using sample doesnt quite work

尝试在VT上收集样本2 pct多列统计信息问题是，它不采样或我遗漏了一些东西易失性表VT具有数十亿行，因此收集VT上的统计信息所花的“永久”时间与常规统计信息收集所花的时间一样多。在其他地方，在过去类似的情况下，我观察到如果我使用“ new”（一个中有多个cols）统计信息收 ...

查找导致低p值的条目 - Find entry that causes low p-value

在R中有2个向量我想测试H： u和v是独立的，所以我运行卡方测试：并获得非常低的p值，这意味着我可以拒绝H，这意味着u和v不是独立的。但是当我打字我在0.23上得到p值，这意味着我可以接受H。我应该选择这两个测试中的哪一个？此外，我想在这些向量中找到 ...

SQL Server基于值分布的最佳查询 - SQL Server optimal query based on value distribution

我有一个表，以键值对格式存储动态用户数据。像这样：现在，我需要选择具有某些参数的用户，例如：性别为“男性”，国家/地区为“美国”。或更笼统：为此，我发现最快的方法是执行以下操作：在这种情况下，如果第一个WHERE过滤器用于其值更均匀且分离的过滤器，我将获得最 ...

为什么Oracle在导入后锁定了我的架构的统计信息？ - Why is Oracle is locking the statistics of my schema after import?

我的问题是我有一个架构，其中所有表的统计信息都被锁定。我在Internet上发现我可以使用DBMS_STATS.UNLOCK_TABLE_STATS (SCHEMA_NAME)过程解锁。我需要知道的是Oracle如何确定何时锁定统计信息以及何时不确定这些情况。 ...

Oracle 11g分区表上的并发统计信息收集 - concurrent statistics gathering on Oracle 11g partiitioned table

我正在Oracle 11g上开发DWH。我们有一些大表（250+百万行），按值划分。每个分区都分配给不同的馈送源，并且每个分区彼此独立，因此可以同时加载和处理它们。数据分配非常不均匀，我们的分区有几百万行，分区有不超过一百行，但是我没有选择分区方案，而且我不能更改它。考虑 ...

在没有索引的表上收集统计信息 - gathering statistics on tables without indexes

在没有Oracle数据库索引的表上定期收集统计信息是否有意义？我从优化的角度来看。我假设将始终在该表上执行全表扫描。 ...

一维上的最小值，然后另一维上的最大值 - min over one dimension followed by max over another dimension

我有一个看起来像这样的SQL表：等等。我想对j维度取平均值，然后对i维度取最小值。在这种情况下，对j维度取平均值会产生以下结果：在i维度上取最小值，然后得出值1.0，这是最终结果。是否有一种有效的方法来执行此示例中的查询，即以指定顺序执行一系列降维操作的查询？ ...

收集巨大的oracle表的统计信息-担心服务器崩溃 - Gather statistics for a huge oracle table - worry of collapsing the server

我正在尝试改善Oracle数据库视图的执行时间，该视图需要花很长时间才能加载，并且涉及一个包含15352595条记录的表。我正在考虑收集统计信息，因为我怀疑性能不佳是由于过时的统计信息所致。但是，我担心这会给服务器带来很多负担，并且我不太确定其硬盘（或任何硬件组件）能否承受繁重的工作 ...

丢弃过滤的统计信息会导致死锁 - dropping filtered statistics causes deadlocks

我们有一个大型数据仓库数据库，在该数据库中，我们不断在b树的左侧（编辑：右侧）（=表末尾）插入5个不同的表中的新行。这意味着关于新数据的普通统计信息很快就会过时。因此，我们已更改了插入过程，以使用覆盖最近两百万行的WHERE子句来执行CREATE STATISTICS FST_xxx ...