标签[huggingface-transformers]

适用于 pytorch 的变形金刚标记器注意掩码 - Transformers tokenizer attention mask for pytorch

在我的代码中我有：output = self.decoder(output, embedded, tgt_mask=attention_mask) 在哪里decoder_layer = TransformerDecoderLayer(embedding_size, num_heads, hidde ...

微调预训练的 LLM 以进行问答 - Fine-tuning a pre-trained LLM for question-answering

客观的我的目标是在有关曼联 (MU) 2021/22 赛季（他们的赛季表现不佳）的数据集上微调预训练的 LLM。我希望能够向经过微调的 model 提示诸如“MU 如何改进？”或“MU 最大的弱点是什么？”等问题。理想的回应是有洞察力/逻辑和+100字数据我将简单地使用相关维基页面中的文本作为我 ...

在 Kaggle 笔记本上使用 Huggingface 管道时无法从“加速”导入名称“PartialState”？ - cannot import name 'PartialState' from 'accelerate' when using Huggingface pipeline on Kaggle notebook?

在 Kaggle 笔记本上从 Huggingface 导入管道时，它抛出这个错误：我该如何解决这个错误？ ...

Huggingface中DataCollator和DataLoader如何处理？ - How to deal with DataCollator and DataLoaders in Huggingface?

我在组合 DataLoader 和 DataCollator 时遇到问题。以下带有 DataCollatorWithPadding 的代码会导致ValueError: Unable to create tensor, you should probably activate truncation ...

我怎样才能从 deberta model 得到 pooled output？ - How can i get pooled output from deberta model?

任何人都可以告诉我如何从 deberta model 汇集 output 吗？任何人都可以告诉我如何从 deberta model 汇集 output 吗？我想在不使用 *DebertaForSequenceClassification * 的情况下将它从DebertaModel用于我的分类 ...

如何将 2D 注意力掩码传递给 HuggingFace BertModel？ - How to pass 2D attention mask to HuggingFace BertModel?

我想将定向注意力掩码传递给BertModel.forward ，以便我可以控制每个标记在自我注意期间可以看到哪些周围标记。该矩阵必须是二维的。这是一个包含三个输入 ID 的示例，其中前两个标记无法关注最后一个。但是最后一个可以处理所有令牌。torch.tensor([ [1, 1, 1] ...

安装转换器库后无法使用 Kerberos 连接到 SQL 服务器 - Unable to connect to SQL Server with Kerberos when transformers library is installed

我正在尝试使用 Python 中的 Kerberos 身份验证连接到 mssql 数据库。当我的 anaconda 环境刚刚安装了 pyodbc 时，我可以连接并向数据库发送查询。但是当我将 huggingface 的 transformer 库添加到环境中时，出现以下错误： Error: ('H ...

SetFit Model 在自定义数据集上训练 - SetFit Model training on a custom dataset

我有一个 dataframe 有 3 列，我正在尝试使用 SetFit model 执行一些镜头文本分类 Dataframe (df) 传统的 SetFit model 接受两个输入即文本和 label 我想用额外的输入来训练 model，即 2 个输入 (A,B) 来预测 label (C)。而 ...

tokenizer.save_pretrained 类型错误：Object 类型属性不是 JSON 可序列化 - tokenizer.save_pretrained TypeError: Object of type property is not JSON serializable

我正在尝试按如下方式保存 GPT2 分词器：我收到以下错误：TypeError: Object of type property is not JSON serializable 更多细节：我该如何解决这个问题？ ...

TypeError: '<' 在 'torch.device' 和 'int' 的实例之间不支持 - TypeError: '<' not supported between instances of 'torch.device' and 'int'

这是我从项目中安装 requirement.txt 文件后收到的错误消息。我认为它与火炬有关，但也不知道如何修复。刚接触抱脸变形，不知道是不是版本问题。 ...

从 huggingface 变压器中获取嵌入式 output - Getting an embedded output from huggingface transformers

为了比较不同的段落，我尝试使用转换器 model，将每个段落拟合到 model 上，最后我打算比较输出并查看哪个段落最相似。为此，我使用的是 Roberta-base model。我首先在一个段落上使用了 roberta tokenizer。然后我在那个标记化的 output 上使用了 rob ...

如何将 huggingface 管道的结果存储为正确的 JSON？ - How to store the result of a huggingface pipeline as correct JSON?

我有一个 huggingface 管道，可以对标记进行分类，如下所示：问题是由此产生的假定 json 是非常有问题的，它有单引号和类似的东西。 “数据”，即管道的 output，是一个包含字典的列表列表。一个列表看起来像这样，为了从 for 循环中存储它们，我使用 sents 列表到 app ...

Python - 如何第一次离线运行 huggingface 流水线？ - Python - How to run a huggingface pipeline offline for the first time?

我有一个使用 Huggingface 管道的 python 代码。此代码在可以不受限制地访问 inte.net 的计算机上运行良好。在第一次运行期间，此代码下载转换器并可能缓存它。在随后的运行中，它不再下载文件。但我的问题是我需要让这个程序在没有 inte.net 连接的受限服务器环境中运 ...

txtai.database.sql.base.SQLError: no such function: json_extract - txtai.database.sql.base.SQLError: no such function: json_extract

使用 TxtAI python 模块和 sql 查询SELECT id, text, score, solution_id, column_name FROM txtai WHERE similar('{query}') AND score >= 0.5 ，我看到这个错误txtai.data ...

组 JSON 以使其更具可读性 - Group JSON in order for it to be more readable

我有这个文件（ MYFILE.txt ），它是包含字典的列表列表的 output：我想将“文字”分组以仅获取文本，而将隐喻保留原样。我尝试使用下面的代码，但它说string indices must be integers ，而且我还认为我可以将它设为 HTML 并为其着色以更好地显示结果，但我 ...

Flan T5 - 如何给出正确的提示/问题？ - Flan T5 - How to give the correct prompt/question?

为 Flan T5 语言 model 提供正确类型的提示，以便为聊天机器人/选项匹配用例获得正确/准确的响应。我正在尝试使用 Flan T5 model 来完成以下任务。给定一个向用户显示选项列表的聊天机器人，model 必须进行语义选项匹配。例如，如果选项是“烤鸡、烟熏三文鱼”，如果用户说 ...

使用 Transformers 中的 image_utils 时出现“不支持的图像尺寸数” - "Unsupported number of image dimensions" while using image_utils from Transformers

我正在尝试遵循这个 HuggingFace 教程https://huggingface.co/blog/fine-tune-vit 使用他们的“beans”数据集一切正常，但如果我将自己的数据集与我自己的图像一起使用，我会遇到“不支持的图像尺寸数”。我想知道这里是否有人会提供有关如何调试它的指示 ...

从变压器加载 model 时出现“无法从 pytorch 检查点文件加载权重” - Getting "Unable to load weights from pytorch checkpoint file" when loading model from transformers

尝试加载 model 时：from transformers import TrOCRProcessor,VisionEncoderDecoderModel model=VisionEncoderDecoderModel.from_pretrained('microsoft/trocr-base ...

使用 keras 和变压器进行图像分类时应用增量时出现错误“img” - Error 'img' when applying increment with keras and transformers for image classification

我想应用 VIT 进行图像分类。但我有一个问题，我不知道如何解决它。我的错误是这个“KeyError：'img'”。当我应用最后一个命令时显示错误，我不知道我的错误在哪里。数据集中的图像是 in.png，但我不认为这是错误的。下面是脚本： ...

BERT model 从 DeepPavlov 到 HuggingFace 格式的转换 - BERT model convertation from DeepPavlov to HuggingFace format

我有一个包含 ruBERT model 的文件夹，它使用 Deeppavlov 库的应用程序进行了微调。该文件夹包含以下 model 个文件：我如何将它转换为 Huggingface 格式以便我可以以这种方式加载它？ ...