使用 PostgreSQL 数据库作为简单键值存储的最佳方式

Question

我被要求使用 postgreSQL 数据库，它将取代我目前使用的 berkeleyDB。 虽然； 我意识到这不是一个理想的情况，它超出了我的控制范围。

所以问题是......如果你被要求将 postgreSQL 变成一个键值存储，你将如何做到这一点，同时使其尽可能高效？

我的值是字节数组，我的键是字符串，我可以对这些字符串的长度施加一些限制。

我假设我应该使用 blob 作为我的值和主键列保存键，但是当我刚刚踏入这个旅程时，我很好奇堆栈溢出社区中是否有人这样做过，或者是否有任何特定的“陷阱”我应该注意一下。

Answer 1

Postgresql 中正确执行此操作的扩展名为 hstore。 它的工作方式与您期望的其他键值存储系统类似。 只需加载扩展程序。 语法是独一无二的，但如果您曾经使用过 redis 或 mongo，您将很快掌握它。 不要让它变得比现在更难。 我明白，我们经常无法选择我们的工具而不得不凑合。
这是文档页面：

http://www.postgresql.org/docs/9.1/static/hstore.html

Answer 2

如果您被迫使用关系数据库，我建议您尝试在数据中找到结构以利用这一事实，因为您放弃了使用非结构化数据和键值存储获得的速度优势。 你找到的结构越多，你就越能摆脱困境。 即使您只在键中找到结构。

还要考虑您是否只需要顺序或随机访问您的数据，以及根据此要求以何种比例和结构构建您的数据库。 例如，您是否要按类型对您的值进行查询？ 这些问题中的每一个都可能影响您构建数据库的方式。

关于 postgresql 中 blob 的一项具体考虑，它们在内部表示为 pg_largetable (loid:oid,pageno:int4,data:bytea)。 块的大小由 LOBBLKSIZE 定义，但通常为 2k。 因此，如果您可以在表中使用字节数组而不是 blob 并在块大小下限制值/键对的大小，则可以通过第二个表避免这种间接性。 如果您有权访问数据库的配置，您还可以增加块大小。

我建议在数据访问中寻找数据结构和模式，然后更详细地再次询问您的问题。

Answer 3

另一种选择是使用 JSON 或 JSONB，并在键上具有唯一的哈希索引。

CREATE EXTENSION IF NOT EXISTS "uuid-ossp";

CREATE TABLE key_values (
    key uuid DEFAULT uuid_generate_v4(),
    value jsonb
);

CREATE INDEX idx_key_values ON key_values USING hash (key);

一些查询

SELECT * FROM key_values WHERE key = '1cfc4dbf-a1b9-46b3-8c15-a03f51dde891';
Time: 0.514 ms
postgres=# SELECT * FROM key_values WHERE key = '1cfc4dbf-a1b9-46b3-8c15-a03f51dde890';
Time: 1.747 ms

postgres=# do $$
begin
for r in 1..1000 loop
INSERT INTO key_values (value)
VALUES ('{"somelarge_json": "bla"}');
end loop;
end;
$$;
DO
Time: 58.327 ms

你不能像 B-tree 那样运行高效的范围查询，但它应该有更好的读/写性能。 指数应该小 60% 左右。

Answer 4

您需要将什么存储为值？ 字符串？ 整数 ? 对象（例如序列化的 Java 对象）。 一个简单的实现可以使用 3 列表，如下所示：

NAME(VARCHAR)   TYPE(VARCHAR)   VALUE(VARCHAR)

（也许 TYPE 是一些枚举）。 上面的方法不适用于像序列化对象这样的二进制数据，但也许你需要一个 BLOB。

或者（和可能是一个更好的主意），你看到Apache的百科全书配置？ 您可以使用数据库（通过 JDBC）支持它，并且您可以存储属性以便您检索它们：

// get a property called 'number'
Double double = config.getDouble("number");
Integer integer = config.getInteger("number");

这可能会在实施方面为您省去很多麻烦。 您可能在保存二进制数据时遇到问题，因为您必须在插入和检索后对其进行序列化。 但我过去曾使用它通过 XStream 存储整数、双精度数和序列化的 Java 对象，因此我可以确认它运行良好。

Answer 5

这真的应该取决于关键是什么。 如果它始终是 255 个字符以下的字符串，则使用 Varchar 作为 yoru PK，然后使用 blob（假设一个大值）作为该值。 如果它总是一个数字，请使用 int 等。

换句话说，需要更多信息才能真正给你一个好的答案:)

使用 PostgreSQL 数据库作为简单键值存储的最佳方式

问题描述

5 个解决方案

解决方案1
25 已采纳 2012-05-29 02:19:23

解决方案2
3 2010-01-05 19:26:26

解决方案3
3 2019-11-27 14:04:30

解决方案4
0 2010-01-05 19:15:34

解决方案5
0 2010-01-05 19:17:01

使用 PostgreSQL 数据库作为简单键值存储的最佳方式

问题描述

5 个解决方案

解决方案1 25 已采纳 2012-05-29 02:19:23

解决方案2 3 2010-01-05 19:26:26

解决方案3 3 2019-11-27 14:04:30

解决方案4 0 2010-01-05 19:15:34

解决方案5 0 2010-01-05 19:17:01

解决方案1
25 已采纳 2012-05-29 02:19:23

解决方案2
3 2010-01-05 19:26:26

解决方案3
3 2019-11-27 14:04:30

解决方案4
0 2010-01-05 19:15:34

解决方案5
0 2010-01-05 19:17:01