cost 70 ms
通过 Sphinx 引擎进行语音识别会产生 AttributeError: 'NoneType' object has no attribute 'close'

[英]Speech recognition via Sphinx engine produces AttributeError: 'NoneType' object has no attribute 'close'

我正在尝试使用以下代码转录视频,但收到以下错误:ERROR : transcribe_video_to_text audio.close() AttributeError: 'NoneType' object has no attribute 'close' 您能否分享您解决这个问题的 ...

无法运行此存储库的代码 -.NETL-Automatic-Topic-Labelling-

[英]Can not run the code of this repository - NETL-Automatic-Topic-Labelling-

我正在尝试运行此代码- Automatic Labeling of Topics with Neural Embeddings 问题是他们没有提到他们使用的库和工具的版本。 可悲的是,他们甚至没有使用过哪个 Python 版本。 我已经开始尝试运行预训练模型,我已经按照他们的说明进行操作,但出现以 ...

在另一个实体中注释实体

[英]Annotate Entity inside another Entity

我们必须提取一个位于另一个实体内部的实体,关于我们如何注释训练数据以为此任务训练 NER model 的任何想法。 我们使用 Flair model 进行自定义实体训练和预测。 例如:文本:“”地址:123, ABC Company, 4th floor, xyz street, state, co ...

ValueError:NLP 情感多类分类器的“logits”和“labels”必须具有相同的形状

[英]ValueError: 'logits' and 'labels' must have the same shape for NLP sentiment multi-class classifier

我正在尝试制作一个 NLP 多类情感分类器,它将句子作为输入并将它们分为三类(消极、中性和积极)。 但是,在训练 model 时,我遇到了错误,我的 logits (None, 3) 与我的标签 (None, 1) 大小不同,model 无法开始训练。 我的 model 是一个多类分类器而不是多标签 ...

Gensim:无法加载 id2word 文件

[英]Gensim: Not able to load the id2word file

我正在对给定先前派生的 lda model 的新语料库进行主题推理。我能够完美地加载 model,但我无法加载 id2word 文件来创建语料库。 corpora.Dictionary需要 map 新语料库numbers: load方法返回一个不知道为什么的dict 属性错误。 下面是复制这种情况的 ...

如何使用SentenceBERT解决自然语言推理?

[英]How to solve natural language inference using SentenceBERT?

如何使用微调的 SentenceBERT 模型(例如sentence-transformers/all-MiniLM-L6-v2 · Hugging Face )解决自然语言推理以获得更好的句子向量? 其中许多模型已经使用 SNLI 等自然语言推理数据集进行了微调,但我可以使用 SNLI 再次微调 ...

如何将预测值合并到原始 pandas 测试数据帧,其中 X_test 在拆分前使用 CountVectorizer 进行了转换

[英]How to merge predicted values to original pandas test data frame where X_test has been converted using CountVectorizer before splitting

我想将我的测试数据的预测结果合并到我的 X_test 中。 我能够将它与 y_test 合并,但由于我的 X_test 是一个语料库,我不确定如何识别要合并的索引。 我的代码如下 这给了我 y_test 和 y_pred 但我不确定如何将 X_test 添加为原始数据框(X_test 的 ID)。 ...

如何从文本中提取形容词或名词?

[英]How to pick up adjectives or nouns out of a text?

例如像: 所以我希望得到这样的 2 个列表: 我看到有人提到 NLTK,但我没有使用过 package,所以我希望得到一些说明。 ...

在 Spacy 中使用多个时间匹配器

[英]Using multiple time Matcher in Spacy

我想在跨度(发送)列表中使用 Spacy 的 Matcherclass Chunker: def __init__(self, nlp, matcher): self.nlp = nlp self.matcher = matcher self. ...

nltk.download('punkt') 给出 output 为假

[英]nltk.download('punkt') giving output as false

当我尝试安装 nltk 并使用 nltk.download('punkt') 下载文件 punket 时。 我收到以下错误。 尝试了许多替代代码和 changing.networks。 错误请帮忙解决这个错误。 申请后:- = df['num_words'] = df['text'].apply(l ...

特定字符的组合匹配和替换

[英]Combination Regmatches and Replacement for specific Character

我试过替换与特定字符匹配或后跟“BT”的字符,但我的代码失败了。 这是我的代码: 错误是: 而我的目标是: ...

wav2vec2-base model 的 WER 在整个训练过程中保持为 1

[英]WER for wav2vec2-base model remains as 1 throughout the whole training process

我正在尝试运行 https 中共享的wav2vec2语音识别model://huggingface.co/docs/transformers/tasks/asr 这是训练过程中的loss和WER ,此时validation loss明显减少,而WER依然为1。 我尝试打印出预测值和 label 值 ...

获取 python 文件中特定单词前的 10 个单词

[英]Get 10 words before a particular word in a file in python

我有一个文件,其中逐行包含句子。 我需要在特定单词(不区分大小写)之前得到 10 个单词,但它也可以在前一行中。 例如:如果我想要单词 ball 并且它是第二行的第四位,那么我需要该行中的 3 个单词和前一行甚至之前的 7 个单词。 我也想不出从前几行中准确获取 10 个单词的方法。 这是我到目前为 ...

2023-01-27 13:46:00   4   54    python / nlp  
培训/使用 OpenAI GPT-3 进行翻译

[英]Training / using OpenAI GPT-3 for translations

我正在尝试使用 OpenAI 将我的产品描述从一种语言翻译成其他一些语言(EN、DE、CZ、SK、HU、PL、SI...)。 翻译,尤其是对 SK/CZ/HU/PL 语言的翻译(主要是语法上)非常糟糕(使用text-davinci-003模型)。 我有一个想法——我已经有几千种类似的产品被专业翻译人 ...

BCELoss logits 和标签不工作

[英]BCELoss between logits and labels not working

我正在使用 GPT2 model 输出形状为(batch_size, num_input_ids, vocab_size)的logits (在 softmax 之前),我需要将它与形状为(batch_size, num_input_ids)的标签进行比较以计算 BCELoss。 我如何计算它? 但尺 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM