[英]Postgresql: variable length user-defined data type storage setting
我根据docs( http://www.postgresql.org/docs/9.0/static/xtypes.html )在postgresql中定义了一个可变长度的用户定义数据类型。
C的定义:
typedef struct MyType {
char vl_len_[4];
char data[1];
} mytype;
CREATE TYPE语句
CREATE TYPE mytype;
CREATE FUNCTION mytype_in(cstring) RETURNS mytype AS 'mytype' LANGUAGE C IMMUTABLE STRICT;
CREATE FUNCTION mytype_out(mytype) RETURNS cstring AS 'mytype' LANGUAGE C IMMUTABLE STRICT;
CREATE FUNCTION mytype_recv(internal) RETURNS mytype AS 'mytype' LANGUAGE C IMMUTABLE STRICT;
CREATE FUNCTION mytype_send(mytype) RETURNS bytea AS 'mytype' LANGUAGE C IMMUTABLE STRICT;
CREATE TYPE mytype (
internallength = VARIABLE,
input = mytype_in,
output = mytype_out,
receive = mytype_recv,
send = mytype_send,
alignment = int4
,storage = plain
);
而且我还定义了C语言中的函数。所有这些都能很好地工作。 但是,由于我的数据可能很长,因此我将存储从普通更改为外部或扩展 。 然后输出错误结果。 我的C函数中需要使用一些TOAST函数吗?
例如:
我有一个运算符来合并两个值,如下所示:
PG_FUNCTION_INFO_V1(mytype_add);
Datum
mytype_add(PG_FUNCTION_ARGS)
{
mytype *anno1 = (mytype *) PG_GETARG_POINTER(0);
mytype *anno2 = (mytype *) PG_GETARG_POINTER(1);
mytype *result;
int newsize;
newsize = VARSIZE(anno1) + VARSIZE(anno2) - VARHDRSZ;
result = (mytype *) palloc(newsize);
SET_VARSIZE(result, newsize);
memcpy(result->data, anno1->data, VARSIZE(anno1) - VARHDRSZ);
memcpy((result->data + VARSIZE(anno1) - VARHDRSZ), anno2->data, VARSIZE(anno2) - VARHDRSZ);
PG_RETURN_POINTER(result);
}
anno1-> data中的值(12个字节,3个整数)为:10,-1,-1,anno2-> data中的值为:20,-1,-1
因此result-> data(24个字节)中的值为:10,-1,-1,20,-1,-1
如果将存储设置为纯存储,则可获得正确的结果。 如果将存储设置为外部存储,则输出完全错误:-256,-1,1317887 ...
非常感谢任何人都可以提供任何提示。 我花了很多时间
您无法取消TOAST输入Datum
。 因此,您是在连接压缩形式,或者可能是指向离线存储的指针,而不是原始数据。
我认为您需要使用PG_GETARG_VARLENA_P(0)
来确保在处理基准面之前已将其删除。 不过,我还没有直接使用TOAST和varlena类型。
我不清楚,为什么您要声明自己的类型,使其结构与struct varlena
相同,而不是仅对可变长度数据使用Datum
和基础struct varlena
。 从...开始:
struct varlena *anno1 = PG_GETARG_VARLENA_P(0);
再加上一点,主要的区别是保存的结构不同,带有一个预标题,用于指示数据的长度。
因此,在编写输入函数时,您需要在数据开始之前实现一个4字节的标头,并使用“ SET_VARSIZE(PTR,len)”来更改4字节标头的值。
另一方面,在检索数据时,您将需要使用“ PG_GETARG_VARLENA_P(n)”,并且检索到的结果还将包含一个指示长度的4字节标头。 您可以使用“ VARSIZE_4B(PTR)”来获得长度,它将返回数据的字节长度。
为了总结并给出示例代码,我们假设我们要存储未知数量的struct complex:
typedef struct Complex
{
double x;
double y;
} Complex;
因此,在收到输入字符串后,我们决定需要存储n个结构。 因此,分配内存:
struct varlena* result = (struct varlena*)palloc(n * sizeof(Complex) + 4);
如文档中所述,我们需要编辑前4个字节并设置长度:
SET_VARSIZE(result, n * sizeof(Complex));
接下来的字节,我们应该给它们分配值,记住地址应该与您的系统结构对齐:
Complex * a = (Complex*)((__int64)result + 4);
for (int i = 0; i < n; i++) {
a[i].x = input[i];
a[i].y = input[i];
}
最后,数据应通过以下方式存储:
PG_RETURN_POINTER(result);
要检索数据,需要使用
struct varlen *b = PG_GETARG_VARLENA_P(0);
如上所述,结果也将在前面声明长度为4个字节,输出函数可能是:
Complex *c = (Complex *)(&(b->vl_dat));
char *result;
int n = VARSIZE_ANY_EXHDR(b) / sizeof(Complex);
for (int i = 0; i < n; i++) {
result = psprintf("(%g;%g)", c[i].x, c[i].y);
}
PG_RETURN_CSTRING(result);
我没有测试过这个确切的代码,但是类似的代码,结果应该可以。 如果有人可以对此发表评论或纠正我犯的任何错误,那就太好了。 这也供我自己参考。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.