标签[google-cloud-speech] - 堆栈内存溢出

如何在 c# 中为 Google Cloud Txt-To-Speech API 设置代理设置 - How can I setup proxy settings in c# for Google Cloud Txt-To-Speech API

如何在 c# 代码中为 Google Text-To-Speech API 设置代理。有人知道在 c# 中将 Google TTS API 的代理设置放在哪里。我们的项目在本地运行，但不在防火墙后面的服务器上，所以它必须通过代理 go。希望你对我有一个起点;-) 谢谢！ ...

从 mimeType "video/webm" 中提取音频到 Speech-to-Text 的 "audio/wav" - Extracting audio from mimeType "video/webm" into "audio/wav" for Speech-to-Text

我正在使用带有 mimeType“video/webm”的 MediaRecorder，但只想将类型为“audio/wav”的视频的音频上传到 Google Speech-to-Text 服务。我下面的当前代码返回一个类型为“video/x-matroska”的文件。如何解决此问题以便使用“音 ...

为什么语音 REST API 响应与 go SDK API 响应不同？ - Why is the speech REST API response different from the go SDK API response?

通过 REST 调用 Speech-To-Text API 时，响应结构与使用 Golang SDK 调用时略有不同。例如，我通过 golang SDK 提交了一个异步语音作业。然后在下面我展示了通过 2 种不同方法（REST 和 go SDK）查询 google cloud 以获取转录作业结 ...

Google Speech 是否支持向语言词典添加新词 - Does Google Speech support adding new words to a language dictionary

使用 Google Speech Api 或 Google Cloud Speech，是否可以：解析音频文件并在文件中找到说出特定单词的确切时间点。将新词（现有语言无法识别）添加到字典中，以便可以在文件中搜索这些词。如果没有，是否还有其他技术需要考虑？谢谢 ...

为什么我必须转换这个？（StringToNative） - Why do I have to convert this?(StringToNative)

这是使用 Google 语音转文本 api 的语音识别项目的一部分。而且我不知道这段代码是做什么的。你认识一些朋友吗？ ...

为谷歌云语音 api 将音频文件重新编码为 linear16 失败并显示“[Errno 30] 只读文件系统” - Re-encoding audio file to linear16 for google cloud speech api fails with '[Errno 30] Read-only file system'

我正在尝试使用 FFmpeg 模块将音频文件转换为线性 16 格式。我已将音频文件存储在一个云存储桶中，并想将转换后的文件移动到另一个存储桶中。该代码在 VS 代码中完美运行，并成功部署到云功能。但是，在云上运行时失败并显示 [Errno 30] Read-only file system。 ...

将转录添加到 Google Speech-to-text 以增强识别 - Adding transcriptions to Google Speech-to-text to enhance recognition

在我们的教堂里，我们有一些乌克兰难民访问教会。为了让他们不理解布道，我制作了一个应用程序将翻译实时发送到 Telegram。我在本教程之后实现了 Google 语音到文本 API： https ://github.com/googleapis/java-speech/blob/main/sam ...

Google Speech-To-Text 引擎返回 RESOURCE_EXHAUSTED - Google Speech-To-Text engine returns RESOURCE_EXHAUSTED

我们已将 Google Speech-To-Text 设置为服务，我们服务器的所有实例都使用相同的 Google Cloud 帐户进行 Speech-To-Text 服务。但是，其中一个实例在尝试激活 Speech-To-Text 服务时不断收到回复“ RESOURCE_EXHAUSTED：资源 ...

从JS MediaRecorder直播stream output到Python语音识别服务器通过soket.io - Live stream output from JS MediaRecorder to Python speech recognition server via soket.io

我正在尝试将 stream 麦克风从我的浏览器连接到运行 Python 服务的服务器，该服务连接到谷歌云语音到文本。对于传输，我使用的是 socket.io。一切似乎都有效，但语音识别没有返回任何结果。我怀疑发送数据的格式有问题。在我的浏览器上，我使用MediaRecorder和 mime ...

Speech-to-Text 短语超出字符数限制 - Speech-to-Text Phrase Exceeds Character Limit

我正在使用 Python 的 Google Speech-to-Text 客户端库来使用语音自适应转换语音。我希望能够提升适合特定模式的短语。我使用此文档创建了自定义类和短语集，并将它们组合到一个 SpeechAdaptation object 中。然后我在下面的 RecognitionCon ...

volumeGainDb 不适用于 Google 文字转语音 - volumeGainDb not working for Google text-to-speech

我的参考是谷歌网站的这个页面：方法：text.synthesize 这是一些简单的 python 代码：这是控制台上显示的内容： (envo) D:\py_new\ttsgcp>python tts_stack.py Traceback（最近一次调用最后）：文件“D:\py_new\en ...

将 python-sounddevice.RawInputStream 生成的音频数据发送到 Google Cloud Speech-to-Text 进行异步识别 - Sending audio data generated by python-sounddevice.RawInputStream to Google Cloud Speech-to-Text for asynchronous recognition

我正在研究将数据从麦克风发送到 Google Cloud Speech-to-Text API 的脚本。我需要访问 gRPC API 以在录制期间生成实时读数。录制完成后，我需要访问 REST API 以获得更精确的异步识别。直播部分正在工作。它基于快速入门示例，但使用 python-sou ...

将 google Cloud Speech-to-Text.proto 文件与 gRPC 一起使用 - Use the google Cloud Speech-to-Text .proto File with gRPC

我正在尝试在 NestJS 中从 google 运行（ https://github.com/googleapis/nodejs-speech/blob/main/protos/google/cloud/speech/v1p1beta1/cloud_speech.proto ）.proto 文件，我 ...

在 WAV 文件上使用 Speech-to-Text API 的空响应 - Empty response using Speech-to-Text API on WAV file

我有一个使用 WebRTC 从流生成的 WAV 文件。这里的示例演示能够用结果转录它，但我的代码没有这样做，因为我得到了一个空响应。这是我的配置：下载音频 ...

使用 Google Speech-to-Text 进行流式语音识别会导致不正确的时间戳记录 - Streaming speech recognition with Google Speech-to-Text is leading to improperly timestamped transcripts

赏金将在 2 天后到期。此问题的答案有资格获得+50声望奖励。 Rayhan Memon想引起更多人对这个问题的 ...

音频到文本转换的计费时间 - Billable time for audio to text conversion

我们正在使用“google-cloud/speech”npm 将音频文件转换为文本。对于持续时间为 4 秒的音频，API 将“totalBilledTime”返回为 15 秒。如果我们转换两个 4 秒的音频文件，这两个音频文件的“totalBilledTime”将为每个 15 秒。您是否 ...

获取正在转换为文本的音频文件的持续时间 - Getting the duration of the audio file which is converting to text

有没有办法获得我们正在转换为文本的音频文件的持续时间（以秒为单位）？我们可以在响应正文中看到“totalBilledTime”。我们可以将其视为音频的持续时间吗？用于转换为文本的音频文件的大小或时间（持续时间）是否有任何限制？ ...

为什么我的字典值中有“\”？ - Why do my dictionary values have '\' in them?

我正在将一本字典读到 python 中，该字典已保存到 csv 中。我正在阅读这段代码：并得到这个结果...... \ 字符出现是怎么回事？当我在 termianl ( cat out.csv ) 中查看原始文件时，我得到了这个：这似乎是对的。我只想能够像普通的 python dict ...

如何使用创建自定义类来格式化 Google Speech-to-Text api 中的电话号码？ - How to use create a Custom class to format phone number in Google Speech-to-Text api?

我正在使用 Google Speech-to-Text api 来转录希伯来语中的电话。大多数电话都包含告诉他们电话号码的客户，我可以制作一些自定义类以便以正确的方式格式化这些号码吗？其他示例可以格式化具有特定格式的订单 ID。我读过这篇文章https://cloud.google.co ...

如何从 SpeechRecognition 进行 Python 自动语言检测 - How to Python automatic language detection from SpeechRecognition

Python需要在用户点击转录按钮时自动识别正在加载的音频文件的语言并以特定语言打印音频文件中的文本，这是否可能以及函数应该是什么样子，请帮助。好吧，我在HTML下拉列表中创建的，但如何将其链接得到的结果transcript = recognizer.recognize_google(dat ...