我有 100.000 张图片,每张图片都有 500 个 orb 向量,每张图片都有一个唯一的标签。 我的一般问题是,当我插入一个新图像(即 500 个新矢量)时,我怎么知道图像的标签是否已经在数据库中? 我所做的是为每个向量附加一个元数据“标签”。 In 可以检索插入的标签 这在现有的 100.0 ...
我有 100.000 张图片,每张图片都有 500 个 orb 向量,每张图片都有一个唯一的标签。 我的一般问题是,当我插入一个新图像(即 500 个新矢量)时,我怎么知道图像的标签是否已经在数据库中? 我所做的是为每个向量附加一个元数据“标签”。 In 可以检索插入的标签 这在现有的 100.0 ...
我在引用过滤器中遇到问题,我在数据中嵌套了对象: 当我想获得具有 care_make“Saturn”和 car_model“Imprezza”的对象时,我在对 car 类进行引用调用时最终获得了两个对象,而我应该只获得第二个对象(名称为“Bob”) 我正在使用的查询: ...
我想知道有没有一种方法可以通过使用复杂的逻辑操作来查询倒排索引,例如: 根据文档,过滤器只接受一个操作员。 ...
我想对我的数据构建一个聚合查询。 我有专利 class 引用段落类(具有矢量化文本的段落),我想计算接近矢量的每个类别(专利属性)的专利。 在伪 SQL 中: 我尝试使用类似的东西(即使它有效,因为它计算段落也很糟糕):result = (client.query.aggregate("Paragr ...
这是一个最小的例子: 请注意,我同时指定了"vectorizePropertyName": False和"vectorizeClassName": False 上面的代码返回: 如果我查找确切的向量,我会得到'distance': 1.1920929e-07 ,我猜它实际上是 0 (对于某些浮点邪 ...
我正在考虑使用 Weaviate 作为矢量商店。 我在文档中看到您可以将矢量化器设置为无,并提供自定义矢量以及其他元数据。 在我这样做之后,我想使用 Get{} 查询以及向量来取回所有元数据。 Weaviate 是否支持返回向量以及元数据? 我在演示中看到他们将向量添加到附加属性中,它似乎返 ...
我们正在使用 Weaviate 来提供电子商务结果。 我们的 Weaviate 数据库存储了我们销售的所有产品。 根据客户和搜索词,我们创建一个向量并使用它来查询数据库。 此属性称为search_engine_query_vector 。 例如,如果客户有购买昂贵产品的习惯并搜索“电视”, ...
它适用于电子商务用例。 我们销售的产品和产品根据城市具有不同的属性,例如价格、可用性等。当我们查询产品时,我们总是希望使用城市进行过滤,并且只想返回该城市的信息。 在 Weaviate 中,我构建了 2 个类 City 和 Product。 我似乎找不到查询 Weaviate 的方法,以便它仅将参 ...
我正在考虑使用 weaviate 进行矢量搜索,但也希望有一个 age off 功能来滚动旧记录。 weaviate 是否有任何类型的批量删除操作来完成此操作? 我想通过 ids 进行单次删除会对性能产生影响。 ...
数据在 weaviate 中针对 class 建立索引,我在创建 class 时使用了 vectorizer equals none(因为应用程序提供了嵌入)。 我的问题是,有没有一种方法可以执行批量查询。 示例:我需要搜索 15 个输入,而不是循环查询 15 次,有没有一种方法可以一次性完成? ...
我根据此处的说明为 CPU 的 Scibert 构建了一个 docker 图像: https://www.semi.technology/developers/weaviate/current/modules/text2vec-transformers.html#option-3-custom-b ...
我正在使用包含多个字段的数据集。 我需要同时对多个字段进行搜索。 Weaviate 与现场搜索兼容吗? 如果是这种情况,如果您能指导我如何组合许多搜索查询,我将不胜感激。 这是一个方案: 我想同时搜索正文和摘要。 例如,它识别在正文和摘要中包含“HIV”一词的出版物。 ...
我正在尝试对我的文章数据集使用上下文分类。 问题是,其中一些属于多个“类别”,它们列在一个数组中。 我仍然想根据这些类别对我的文章进行分类,但我不确定这是否可能? 如果是这样,我是否只需将我的Category class 的数据类型设为字符串数组,并让我的Article class 中的categ ...
假设我有一个电影数据库,其中包含一些类型的标签。 我的 Weaviate 架构如下所示:"classes": [{ "class": "Movie", "properties": [{ "name": "name", "dataType": ["string"], }, ...
我正在使用 Weaviate 的 KNN 引擎来执行多类分类,但我不明白: 它使用什么样的 KNN? 是使用简单投票还是距离加权投票? 它使用余弦距离吗? 它是使用一种方法来查找可能的邻居还是使用蛮力来查找所有真正的最近邻居? 什么是赢/输组,它们如何用于预测新向量的 class? ...
我使用 docker 图像创建了 weaviate,然后创建了两个类,并使用 Java 客户端为这些类添加了大约 400 多个数据条目。 我还尝试了问答模块来查询数据,它工作正常。 一旦我在 Docker 容器中重新启动 Weaviate 实例,我的架构就丢失了。 我对 Weaviate 完全陌生 ...
在对 Weaviate 中的实际数据进行矢量化之前,我想为我的数据创建一个语义上下文( https://github.com/semi-technologies/weaviate )。 假设我们有一个分类法,其中我们有一组特定领域的概念以及指向它们相关概念的链接。 您能否告诉我最好的方法是使用上下文 ...
我的目标是向pyLodStorage 项目添加 Weaviate 支持具体来说,我想使用以下示例数据: https://github.com/WolfgangFahl/pyLoDStorage/blob/master/lodstorage/sample.py 其中有一些王室人物的记录包含几千个条目 ...
我正在尝试按照https://www.semi.technology/documentation/weaviate/current/client-libs/python.html的步骤并最终遇到与以下相同的问题: 从 \"\" 解析正文失败,因为无效字符 'G' 正在寻找 object 密钥字符串 ...
我有几个简单数据交换格式的本体描述,并希望转换或导入这些以将它们与 Weaviate 一起使用。 可以在以下位置找到一个示例: http://cr.bitplan.com/index.php/CrSchema#sidif (参见下面的源代码)。 我能够手动创建类和属性,但我不确定如何在 Weav ...