[英]PostgreSQL: how to disable for to_tsvector reducing the tokens to lexemes
我有这样一个查询,我使用to_tsvector
function。 文档说:
to_tsvector
将文本文档解析为标记,将标记简化为词素
但有时 function to_tsvector
会错误地更改某些名称。 某些词是否有可能取消对令牌的强制转换? 例如,对于值“Илья”禁用它,并在所有其他情况下启用它?
SELECT c.id,
tsvector_agg(to_tsvector('russian',
coalesce(cv.data ->> 'name', '') || ' ' ||
coalesce(cv.data ->> 'surname', '') || ' ' ||
)) as v
FROM client c
禁用某些词的词干提取的正确方法是在文本搜索配置中包含同义词词典。 您必须将名称添加到同义词文件中,然后是由同义词词典处理且未由其后的词干词典处理的任何单词。
链接的文档给出了一个名为“Paris”的示例,但它在您的情况下也同样适用。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.