我正在尝试运行 https 中共享的wav2vec2语音识别model://huggingface.co/docs/transformers/tasks/asr 这是训练过程中的loss和WER ,此时validation loss明显减少,而WER依然为1。 我尝试打印出预测值和 label 值 ...
我正在尝试运行 https 中共享的wav2vec2语音识别model://huggingface.co/docs/transformers/tasks/asr 这是训练过程中的loss和WER ,此时validation loss明显减少,而WER依然为1。 我尝试打印出预测值和 label 值 ...
我正在尝试使用语音识别库来设置语音助手,但我一直收到权限被拒绝的错误。 我想错误是文件没有保存在 Python 可以访问它的任何位置,但我不完全确定如何使用这个库更改文件存储的目录。 代码: 追溯: 我之前成功使用过这个库,所以不确定问题是什么。 有什么建议么? ...
您好 flutter 开发人员,我正在做一个项目,我需要在调用SpeechToText.listen()时更改初始声音。 请帮我解决这个问题,我搜索了很多来解决这个问题,请开发人员帮助我。 ...
我一直在努力创建一个自动语音识别 neural.network 使用 tensorflow 在 hugging face mozilla common voice 11 数据集上训练。 在损失突然变为无穷大之前,model 似乎训练了大约 100 个批次。 下面是数据预处理的代码: 这是 model ...
我使用 Pyinstaller 创建可执行文件。 在我的程序中,我在运行程序后使用 SpeechRecognition,它打印出一个 JSON 文件(来自 API 响应),通常我的程序不打印任何内容。 例如它打印出这个不想要它的result2: { 'alternative': [ {'confi ...
我正在尝试制作一个简单的语音识别程序,这是我目前拥有的代码。 它曾经有效,但现在无效。 它所做的是打印“say something:”,但它不听我的声音。 我确实安装了 pyaudio,所以这不是问题。 我的麦克风有一个小的红色 LED,在使用时会闪烁,因此基于此我假设 python 正在使用麦克风 ...
以下程序生成以下错误:import os #import time import speech_recognition from subprocess import call from platform import python_version home = os.path.expanduser( ...
打电话时 这是为了从 model 中获取发射概率。 但我明白了 ...
所以我有一个 Electron 应用程序,它使用 web 语音 API (SpeechRecognition) 来获取用户的声音,但是,它不起作用。 代码: 它说We are listening... in the console,但无论你说什么,它都不会给出 output。另一方面,在 Goog ...
我正在使用 azure 语音转文本来查找 wav 文件中话语的时间戳。 我遇到的问题是,如果用户记录了数字,例如“我要数到三。一、二、三,我来了”。 output 中省略了数字。英语和其他语言都会出现这种情况。 我可以理解省略“eh”和“ah”之类的话语,但是数字? 为什么这是默认值。 我正在使用 ...
我正在尝试构建一个助手,起初当我说“嗨”时它会返回“嗨”,效果很好。 但是如果我说“嗨,现在几点了”, if它在我的句子中找到值“嗨”,它就会转到第一个。 这是我的一段代码: 命令是包含我的演讲的变量我试图让代码忽略第一个if (在那个原因中不使用 elif,因为它不会让我运行'elif any' ...
我正在尝试使用facebook/wav2vec2-base-960h预训练 model 从wav2vec2创建 model,这是我的training_args 这是我的trainer 现在当训练部分结束并且 model 训练了trainer.evaluate()部分时,向我展示这样的好结果参考资料 ...
我想在 Python 为我的 Chromebook 制作音频转录器(作为基础)。 我想稍后将它升级为聊天机器人,所以我希望它尽可能简单。 这是代码: import speech_recognition as sr r = sr.Recognizer() with ...
我正在按照他们使用 SpeechRecognition 模块的教程进行操作,但是当我进行第一次测试时,它返回C:\Users\USER\PycharmProjects\Fatawi\venv\Scripts\python.exe C:/Users/USER/PycharmProjects/Fataw ...
我从 GitHub 下载了一个 python 代码。 它没有记录我所说的任何内容。 我的代码: 我收到此错误:/usr/local/bin/python3.11 /Users/danieforsell22b/Desktop/GPT3VoiceBot/gpt3Bot.py listening... ...
我试图运行代码。 它工作得很好,但在执行后留下了一本字典。 这是代码:在程序开始时执行的 wishMe function的代码 ...
我想将浏览器支持语音识别值设置为TextField值。 我想编辑那个语音识别值。 在我的代码中,没有编辑值也没有得到输入值。 但是transcript值显示在TextField中。 ...
我在我的 Python 项目中下载了“SpeechRecognition”模块。 但不知何故,我无法将其导入我的文件中。 这是代码: 我首先使用“pip install SpeechRecognition”安装了 SpeechRecognition 模块,我过去已经做过这样的项目并且没有遇到任何问题 ...
我正在创建一个基于语音命令的 Android 应用程序。 这里的想法是在启动语音识别器之前对麦克风应用降噪滤波器。 那可能吗? 谢谢。 ...
我将文件存储在 s3 存储桶中,这些文件是从 Genysis Purecloud 上传的。 它们是保存为.opus 文件的客户调用,但在使用python 中的下载功能时可以转换为.wav 文件。 我在使用 Python 库boto3和speech_recognition处理这些文件时遇到问题。 我需 ...