cost 99 ms
通过 Sphinx 引擎进行语音识别会产生 AttributeError: 'NoneType' object has no attribute 'close'

[英]Speech recognition via Sphinx engine produces AttributeError: 'NoneType' object has no attribute 'close'

我正在尝试使用以下代码转录视频,但收到以下错误:ERROR : transcribe_video_to_text audio.close() AttributeError: 'NoneType' object has no attribute 'close' 您能否分享您解决这个问题的 ...

加密登录:从 javascript 转录到 python

[英]Encrypted login: transcription from javascript to python

我的 python 编码和解码似乎都是错误的从以下脚本开始,它是服务器 API 的一部分: 我的 python 脚本给出: 我不太确定 javascript 中 c 的返回值,但我认为它是我在 python 脚本中使用的值。 盐来自服务器的网页/F12,它返回一个完全不同的值: 不太确定 c 的值 ...

批量创建转录总是导致:录音 URI 包含无效数据

[英]Batch create transcription always results in: The recordings URI contains invalid data

我想使用 Azure 语音服务批量转录 API来创建我的音频文件的转录。 我已经成功使用了语音服务 SDK(用于 Node.js),但有兴趣尝试在 v3.1 预览版 api ( displayFormWordLevelTimestampsEnabled ) 中提供的新功能之一,所以我想我必须这样做使 ...

有没有办法使用 YouTube 的 API 按脚本批量搜索所有视频?

[英]Is there a way to use YouTube's API to batch search all videos by transcript?

我正在制作一部纪录片并寻找特定的录音片段——想知道是否有人开发出一种方法来大量搜索 YouTube 转录本。 举个例子:如果我正在寻找某人谈论电子垃圾磅数的剪辑,我可以搜索“百万磅电子垃圾”并找到该短语在成绩单中弹出的任何视频。 我很惊讶这还不存在,因为它对信用、采购和媒体制作的许多不同方面都非常 ...

Music21 - 无法显示休止符

[英]Music21 - cannot display rests

我正在将乐谱的部分切割成节拍的片段。 我正在使用 music21 和 LilyPond 将输出转换为 png。 虽然我没有显示仅包含休息的片段,但有一个非常具体的问题。 如果其余部分与注释一起显示,则它显示正常..但如果该栏包含一个休息而没有其他内容,则图像为空白。 我的猜测是,当没有上下文来判断是 ...

使用 deepspeech 转录时如何使用 GPU

[英]How to use GPU when transcribing using deepspeech

我正在使用出色的deepspeech package 转录 Python 中的音频文件。 这是我的快速实现: podcast.wav是一个约 20 分钟的音频文件。 运行text = model.stt(data16)需要 10 多分钟(我在 10 分钟后中断了该过程),考虑到 GPU 的可用性 ...

如何让成绩单出现在屏幕上

[英]How do I make the transcript appear on screen

我希望我的网站从对着麦克风说话的用户那里获得音频输入,然后是 output 他们在屏幕上所说的话。 我已经在我的 react 网站中实现了语音识别,但是当我对着麦克风说话时,我看不到文字记录。 这是我的与语音识别相关的代码这是在名为 App 的 class 内的主 App.js 文件中,这是正在呈现 ...

如何创建新的语言模型 NLP? - Python

[英]How to Create a new language model NLP? - Python

我使用 Google Api 将一些音频文件转录为带有 Recognizer 类的文本。 我发现可用的语言数量有限,最常用和国际上使用的语言是其中的一部分。 我如何从词汇表中创建一种新语言并对其进行训练,然后将该语言用作音频输入的识别器 将其用作 en-US 中的语言:` 注意:我进行了几次搜索 ...

google 转录模型“command_and_search”是这个增强模型吗?

[英]google transcription model “command_and_search” is this enhanced model?

有人知道 google 转录模型 command_and_search 是否是增强模型吗? 在文档https://cloud.google.com/speech-to-text/docs/transcription-model我只能发现 phone_call 和 video 得到了增强..没有关于 ...

如何将 SFTranscriptionSegment 数据添加到 Firebase Firestore?

[英]How to add SFTranscriptionSegment data to Firebase Firestore?

我在 Swift 中使用 SFTranscription 来转录语音笔记。 然后我想将此转录数据添加到 Firebase Firestore,但这会引发错误,因为 Firestore 只接受这些数据类型。 我的问题是:我应该如何将我的 SFTranscriptionSegments 数组打包为一种 ...

Xamarin.iOS 上的 SFSpeechRecognitionRequest requiresOnDeviceRecognition。 是可用的么?

[英]SFSpeechRecognitionRequest on Xamarin.iOS requiresOnDeviceRecognition. Is it available?

我正在使用这篇文章,其中还有一个使用 Apple 的SFSpeechRecognition在Xamarin.iOS 中进行语音识别的示例 https://docs.microsoft.com/en-us/xamarin/ios/platform/speech?tabs=macos 该示例工作正常 ...

map 人是否可以使用 AWS 转录进行转录?

[英]is it possible to map people to transcript with AWS transcribe?

我需要使用一些转录服务来转录语音。 我使用 AWS transcribe 获得了非常好的结果。 但我也需要知道哪个人说了什么。 这可以通过 AWS 转录吗? 我找不到任何关于此的信息。 前任。 我现在得到的是演讲者1:你好,你好吗? 演讲者2:我很好,你好吗? 演讲者1:好的…… 我想得到的是能够 ...

Vosk 扬声器识别

[英]Vosk Speaker Recognition

我目前正在将 Vosk 语音识别实施到应用程序中。 具体来看说话人识别,我已经从示例中实现了 test_speaker.py 并且它是功能性的。 作为新手,我如何识别和/或创建参考说话人签名? 使用提供的那个,用我的音频示例计算的距离列表并没有描述所涉及的两个扬声器: 如果没有一种有效的方法可以从正 ...

Google STT - 德语 - 完整数字日期未正确转录

[英]Google STT - German - Full numeric date not transcribed properly

我目前正在尝试使用 Google 的德语 STT 引擎。 我希望从话语中捕获完整的日期。 只要我把月份作为一个词(9 月、10 月……) “Erster Januar 1980”被正确转录,这就可以正常工作。 在德语中,通常不说出月份的名称,而只是说出月份的序数,例如“Erster Erster N ...

认知服务显示填词和隐藏个人数据

[英]Cognitive Service show Fill words and hide personal data

我们使用 Azure 批量转录服务来获取音频/语音的转录。 在这里,我们注意到,有时会包含诸如“uhm”、“hm”或类似的填充词,但很少 - 同样因为我们已经使用这项服务几个月了,我们感觉好像它“变少了” (所以成绩单中的“嗯”少了) Q1:有没有办法获取填充词? 我们希望在成绩单中收到它们。 此 ...

每次转录都需要重新加载 vosk model 吗?

[英]Need to reload vosk model for every transcription?

我使用的 vosk model 是 vosk-model-en-us-aspire-0.2 (1.4GB)。 每次加载vosk model都需要相当长的时间。是否需要每次都重新创建vosk object? 如果我们只加载一次 model,加载 model 会花费很多时间。 它至少可以节省一半的时间 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM