标签[speech-recognition] - 堆栈内存溢出

wav2vec2-base model 的 WER 在整个训练过程中保持为 1 - WER for wav2vec2-base model remains as 1 throughout the whole training process

我正在尝试运行 https 中共享的wav2vec2语音识别model://huggingface.co/docs/transformers/tasks/asr 这是训练过程中的loss和WER ，此时validation loss明显减少，而WER依然为1。我尝试打印出预测值和 label 值 ...

语音识别库的权限被拒绝/ffmpeg 错误 - Permission denied/ffmpeg error with Speech Recognition library

我正在尝试使用语音识别库来设置语音助手，但我一直收到权限被拒绝的错误。我想错误是文件没有保存在 Python 可以访问它的任何位置，但我不完全确定如何使用这个库更改文件存储的目录。代码：追溯：我之前成功使用过这个库，所以不确定问题是什么。有什么建议么？ ...

Flutter：如何将语音中的google初始音转为文字 - Flutter : How to turn of the initial sound of google in speech to text

您好 flutter 开发人员，我正在做一个项目，我需要在调用SpeechToText.listen()时更改初始声音。请帮我解决这个问题，我搜索了很多来解决这个问题，请开发人员帮助我。 ...

自动语音识别 CTC 损失在 100 批次后突然趋于无穷大 - Automatic Speech Recognition CTC Loss Suddenly Goes to Infinity After 100 Batches

我一直在努力创建一个自动语音识别 neural.network 使用 tensorflow 在 hugging face mozilla common voice 11 数据集上训练。在损失突然变为无穷大之前，model 似乎训练了大约 100 个批次。下面是数据预处理的代码：这是 model ...

Pyintaller 可执行文件打印出不需要的东西，例如 SpeechRecognition JSON - Pyintaller executable print out unwanted stuff like SpeechRecognition JSON

我使用 Pyinstaller 创建可执行文件。在我的程序中，我在运行程序后使用 SpeechRecognition，它打印出一个 JSON 文件（来自 API 响应），通常我的程序不打印任何内容。例如它打印出这个不想要它的result2: { 'alternative': [ {'confi ...

为什么我的 Python 语音识别码不起作用 - Why is my Python Speech Recognition code not working

我正在尝试制作一个简单的语音识别程序，这是我目前拥有的代码。它曾经有效，但现在无效。它所做的是打印“say something:”，但它不听我的声音。我确实安装了 pyaudio，所以这不是问题。我的麦克风有一个小的红色 LED，在使用时会闪烁，因此基于此我假设 python 正在使用麦克风 ...

Python 在 cmd 解释器或 pycharm 中找不到导入 - Python can not find imports in either the cmd interpreter or pycharm

以下程序生成以下错误：import os #import time import speech_recognition from subprocess import call from platform import python_version home = os.path.expanduser( ...

ValueError 从 Wav2Vec2 获取发射 PyTorch 管道 Model - ValueError Getting Emission from Wav2Vec2 PyTorch Pipeline Model

打电话时这是为了从 model 中获取发射概率。但我明白了 ...

Electron中语音识别的实现方式有哪些？ - What are the ways to implement speech recognition in Electron?

所以我有一个 Electron 应用程序，它使用 web 语音 API (SpeechRecognition) 来获取用户的声音，但是，它不起作用。代码：它说We are listening... in the console，但无论你说什么，它都不会给出 output。另一方面，在 Goog ...

Azure 语音转文本忽略数字 - Azure speech-to-text ignores numbers

我正在使用 azure 语音转文本来查找 wav 文件中话语的时间戳。我遇到的问题是，如果用户记录了数字，例如“我要数到三。一、二、三，我来了”。 output 中省略了数字。英语和其他语言都会出现这种情况。我可以理解省略“eh”和“ah”之类的话语，但是数字？为什么这是默认值。我正在使用 ...

我如何忽略包含我要打印的单词的句子的 rest？ - How do i ignore a the rest of a sentence that contains a word i want to print?

我正在尝试构建一个助手，起初当我说“嗨”时它会返回“嗨”，效果很好。但是如果我说“嗨，现在几点了”， if它在我的句子中找到值“嗨”，它就会转到第一个。这是我的一段代码：命令是包含我的演讲的变量我试图让代码忽略第一个if （在那个原因中不使用 elif，因为它不会让我运行'elif any' ...

训练有素的问题 model 和负载 model - Problem with trained model and load model

我正在尝试使用facebook/wav2vec2-base-960h预训练 model 从wav2vec2创建 model，这是我的training_args 这是我的trainer 现在当训练部分结束并且 model 训练了trainer.evaluate()部分时，向我展示这样的好结果参考资料 ...

您好，我的程序在 Python 中出现一些我不知道的错误，我已经在下面解释了所有内容 - Hello, I am getting some errors unknown to me in Python for my Program, I have explained everything below

我想在 Python 为我的 Chromebook 制作音频转录器（作为基础）。我想稍后将它升级为聊天机器人，所以我希望它尽可能简单。这是代码： import speech_recognition as sr r = sr.Recognizer() with ...

语音识别模块不工作，尽管被下载 - Speech Recognition module not working, despite being downloaded

我正在按照他们使用 SpeechRecognition 模块的教程进行操作，但是当我进行第一次测试时，它返回C:\Users\USER\PycharmProjects\Fatawi\venv\Scripts\python.exe C:/Users/USER/PycharmProjects/Fataw ...

我的语音助手程序没有记录我所说的任何内容 - My voice assistant program doesn't register anything I say

我从 GitHub 下载了一个 python 代码。它没有记录我所说的任何内容。我的代码：我收到此错误：/usr/local/bin/python3.11 /Users/danieforsell22b/Desktop/GPT3VoiceBot/gpt3Bot.py listening... ...

语音识别模块提供字典和列表。任何解决方案？ - Speech Recognition module is giving a dictionary as well as a list. Any solutions?

我试图运行代码。它工作得很好，但在执行后留下了一本字典。这是代码：在程序开始时执行的 wishMe function的代码 ...

如何将语音识别的值传递给文本字段并在该值中编辑和查看控制台 - reactjs - How to pass value of speech recognition to text field and edit and view console in that value - reactjs

我想将浏览器支持语音识别值设置为TextField值。我想编辑那个语音识别值。在我的代码中，没有编辑值也没有得到输入值。但是transcript值显示在TextField中。 ...

Python 中没有名为“speech_recognition”的模块 - No module named 'speech_recognition' in Python

我在我的 Python 项目中下载了“SpeechRecognition”模块。但不知何故，我无法将其导入我的文件中。这是代码：我首先使用“pip install SpeechRecognition”安装了 SpeechRecognition 模块，我过去已经做过这样的项目并且没有遇到任何问题 ...

Android，为 SpeechRecognizer 添加降噪功能 - Android, add noise cancelling to SpeechRecognizer

我正在创建一个基于语音命令的 Android 应用程序。这里的想法是在启动语音识别器之前对麦克风应用降噪滤波器。那可能吗？谢谢。 ...

处理来自 s3 存储桶的音频文件以在 Python 中将语音转换为文本 - Processing audio files from s3 bucket for speech to text conversion in Python

我将文件存储在 s3 存储桶中，这些文件是从 Genysis Purecloud 上传的。它们是保存为.opus 文件的客户调用，但在使用python 中的下载功能时可以转换为.wav 文件。我在使用 Python 库boto3和speech_recognition处理这些文件时遇到问题。我需 ...