cost 294 ms
wav2vec2-base model 的 WER 在整个训练过程中保持为 1 - WER for wav2vec2-base model remains as 1 throughout the whole training process

我正在尝试运行 https 中共享的wav2vec2语音识别model://huggingface.co/docs/transformers/tasks/asr 这是训练过程中的loss和WER ,此时validation loss明显减少,而WER依然为1。 我尝试打印出预测值和 label 值 ...

语音识别库的权限被拒绝/ffmpeg 错误 - Permission denied/ffmpeg error with Speech Recognition library

我正在尝试使用语音识别库来设置语音助手,但我一直收到权限被拒绝的错误。 我想错误是文件没有保存在 Python 可以访问它的任何位置,但我不完全确定如何使用这个库更改文件存储的目录。 代码: 追溯: 我之前成功使用过这个库,所以不确定问题是什么。 有什么建议么? ...

自动语音识别 CTC 损失在 100 批次后突然趋于无穷大 - Automatic Speech Recognition CTC Loss Suddenly Goes to Infinity After 100 Batches

我一直在努力创建一个自动语音识别 neural.network 使用 tensorflow 在 hugging face mozilla common voice 11 数据集上训练。 在损失突然变为无穷大之前,model 似乎训练了大约 100 个批次。 下面是数据预处理的代码: 这是 model ...

Pyintaller 可执行文件打印出不需要的东西,例如 SpeechRecognition JSON - Pyintaller executable print out unwanted stuff like SpeechRecognition JSON

我使用 Pyinstaller 创建可执行文件。 在我的程序中,我在运行程序后使用 SpeechRecognition,它打印出一个 JSON 文件(来自 API 响应),通常我的程序不打印任何内容。 例如它打印出这个不想要它的result2: { 'alternative': [ {'confi ...

为什么我的 Python 语音识别码不起作用 - Why is my Python Speech Recognition code not working

我正在尝试制作一个简单的语音识别程序,这是我目前拥有的代码。 它曾经有效,但现在无效。 它所做的是打印“say something:”,但它不听我的声音。 我确实安装了 pyaudio,所以这不是问题。 我的麦克风有一个小的红色 LED,在使用时会闪烁,因此基于此我假设 python 正在使用麦克风 ...

Azure 语音转文本忽略数字 - Azure speech-to-text ignores numbers

我正在使用 azure 语音转文本来查找 wav 文件中话语的时间戳。 我遇到的问题是,如果用户记录了数字,例如“我要数到三。一、二、三,我来了”。 output 中省略了数字。英语和其他语言都会出现这种情况。 我可以理解省略“eh”和“ah”之类的话语,但是数字? 为什么这是默认值。 我正在使用 ...

我如何忽略包含我要打印的单词的句子的 rest? - How do i ignore a the rest of a sentence that contains a word i want to print?

我正在尝试构建一个助手,起初当我说“嗨”时它会返回“嗨”,效果很好。 但是如果我说“嗨,现在几点了”, if它在我的句子中找到值“嗨”,它就会转到第一个。 这是我的一段代码: 命令是包含我的演讲的变量我试图让代码忽略第一个if (在那个原因中不使用 elif,因为它不会让我运行'elif any' ...

您好,我的程序在 Python 中出现一些我不知道的错误,我已经在下面解释了所有内容 - Hello, I am getting some errors unknown to me in Python for my Program, I have explained everything below

我想在 Python 为我的 Chromebook 制作音频转录器(作为基础)。 我想稍后将它升级为聊天机器人,所以我希望它尽可能简单。 这是代码: import speech_recognition as sr r = sr.Recognizer() with ...

如何将语音识别的值传递给文本字段并在该值中编辑和查看控制台 - reactjs - How to pass value of speech recognition to text field and edit and view console in that value - reactjs

我想将浏览器支持语音识别值设置为TextField值。 我想编辑那个语音识别值。 在我的代码中,没有编辑值也没有得到输入值。 但是transcript值显示在TextField中。 ...

处理来自 s3 存储桶的音频文件以在 Python 中将语音转换为文本 - Processing audio files from s3 bucket for speech to text conversion in Python

我将文件存储在 s3 存储桶中,这些文件是从 Genysis Purecloud 上传的。 它们是保存为.opus 文件的客户调用,但在使用python 中的下载功能时可以转换为.wav 文件。 我在使用 Python 库boto3和speech_recognition处理这些文件时遇到问题。 我需 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM