在我的代码中我有:output = self.decoder(output, embedded, tgt_mask=attention_mask) 在哪里decoder_layer = TransformerDecoderLayer(embedding_size, num_heads, hidde ...
在我的代码中我有:output = self.decoder(output, embedded, tgt_mask=attention_mask) 在哪里decoder_layer = TransformerDecoderLayer(embedding_size, num_heads, hidde ...
客观的我的目标是在有关曼联 (MU) 2021/22 赛季(他们的赛季表现不佳)的数据集上微调预训练的 LLM。 我希望能够向经过微调的 model 提示诸如“MU 如何改进?”或“MU 最大的弱点是什么?”等问题。 理想的回应是有洞察力/逻辑和+100字数据我将简单地使用相关维基页面中的文本作为我 ...
在 Kaggle 笔记本上从 Huggingface 导入管道时, 它抛出这个错误: 我该如何解决这个错误? ...
我在组合 DataLoader 和 DataCollator 时遇到问题。 以下带有 DataCollatorWithPadding 的代码会导致ValueError: Unable to create tensor, you should probably activate truncation ...
任何人都可以告诉我如何从 deberta model 汇集 output 吗? 任何人都可以告诉我如何从 deberta model 汇集 output 吗? 我想在不使用 *DebertaForSequenceClassification * 的情况下将它从DebertaModel用于我的分类 ...
我想将定向注意力掩码传递给BertModel.forward ,以便我可以控制每个标记在自我注意期间可以看到哪些周围标记。 该矩阵必须是二维的。 这是一个包含三个输入 ID 的示例,其中前两个标记无法关注最后一个。 但是最后一个可以处理所有令牌。torch.tensor([ [1, 1, 1] ...
我正在尝试使用 Python 中的 Kerberos 身份验证连接到 mssql 数据库。当我的 anaconda 环境刚刚安装了 pyodbc 时,我可以连接并向数据库发送查询。 但是当我将 huggingface 的 transformer 库添加到环境中时,出现以下错误: Error: ('H ...
我有一个 dataframe 有 3 列,我正在尝试使用 SetFit model 执行一些镜头文本分类 Dataframe (df) 传统的 SetFit model 接受两个输入即文本和 label 我想用额外的输入来训练 model,即 2 个输入 (A,B) 来预测 label (C)。 而 ...
我正在尝试按如下方式保存 GPT2 分词器: 我收到以下错误:TypeError: Object of type property is not JSON serializable 更多细节: 我该如何解决这个问题? ...
这是我从项目中安装 requirement.txt 文件后收到的错误消息。 我认为它与火炬有关,但也不知道如何修复。 刚接触抱脸变形,不知道是不是版本问题。 ...
为了比较不同的段落,我尝试使用转换器 model,将每个段落拟合到 model 上,最后我打算比较输出并查看哪个段落最相似。 为此,我使用的是 Roberta-base model。我首先在一个段落上使用了 roberta tokenizer。 然后我在那个标记化的 output 上使用了 rob ...
我有一个 huggingface 管道,可以对标记进行分类,如下所示: 问题是由此产生的假定 json 是非常有问题的,它有单引号和类似的东西。 “数据”,即管道的 output,是一个包含字典的列表列表。 一个列表看起来像这样,为了从 for 循环中存储它们,我使用 sents 列表到 app ...
我有一个使用 Huggingface 管道的 python 代码。 此代码在可以不受限制地访问 inte.net 的计算机上运行良好。 在第一次运行期间,此代码下载转换器并可能缓存它。 在随后的运行中,它不再下载文件。 但我的问题是我需要让这个程序在没有 inte.net 连接的受限服务器环境中运 ...
使用 TxtAI python 模块和 sql 查询SELECT id, text, score, solution_id, column_name FROM txtai WHERE similar('{query}') AND score >= 0.5 ,我看到这个错误txtai.data ...
我有这个文件( MYFILE.txt ),它是包含字典的列表列表的 output: 我想将“文字”分组以仅获取文本,而将隐喻保留原样。 我尝试使用下面的代码,但它说string indices must be integers ,而且我还认为我可以将它设为 HTML 并为其着色以更好地显示结果,但我 ...
为 Flan T5 语言 model 提供正确类型的提示,以便为聊天机器人/选项匹配用例获得正确/准确的响应。 我正在尝试使用 Flan T5 model 来完成以下任务。 给定一个向用户显示选项列表的聊天机器人,model 必须进行语义选项匹配。 例如,如果选项是“烤鸡、烟熏三文鱼”,如果用户说 ...
我正在尝试遵循这个 HuggingFace 教程https://huggingface.co/blog/fine-tune-vit 使用他们的“beans”数据集一切正常,但如果我将自己的数据集与我自己的图像一起使用,我会遇到“不支持的图像尺寸数”。 我想知道这里是否有人会提供有关如何调试它的指示 ...
尝试加载 model 时:from transformers import TrOCRProcessor,VisionEncoderDecoderModel model=VisionEncoderDecoderModel.from_pretrained('microsoft/trocr-base ...
我想应用 VIT 进行图像分类。 但我有一个问题,我不知道如何解决它。 我的错误是这个“KeyError:'img'”。 当我应用最后一个命令时显示错误,我不知道我的错误在哪里。 数据集中的图像是 in.png,但我不认为这是错误的。 下面是脚本: ...
我有一个包含 ruBERT model 的文件夹,它使用 Deeppavlov 库的应用程序进行了微调。 该文件夹包含以下 model 个文件: 我如何将它转换为 Huggingface 格式以便我可以以这种方式加载它? ...