我會為語音識別選擇什么設備來使用我的計算機發出的音頻？

Question

我正在嘗試使用 Python 3 制作隱藏式字幕生成器。當我調用list_microphone_names() ，會列出一堆音頻源。 我會為從我的計算機發出的音頻選擇哪個來源？

我曾嘗試使用pocketsphinx進行實時識別，但結果非常不准確。 我找到了一個使用-adcdev參數來選擇源的選項，但我不知道要放入什么。

這是我從調用list_microphone_names() ：

>>> import speech_recognition as sr
>>> r = sr.Recognizer()
>>> mic = sr.Microphone()
>>> sr.Microphone.list_microphone_names()
['Microsoft Sound Mapper - Input', 
'Microphone (HD Webcam C270)', 
'Microsoft Sound Mapper - Output', 
'Speakers (Realtek High Definiti', 
'Primary Sound Capture Driver', 
'Microphone (HD Webcam C270)', 
'Primary Sound Driver', 
'Speakers (Realtek High Definition Audio)', 
'Speakers (Realtek High Definition Audio)', 
'Microphone (HD Webcam C270)', 
'Line In (Realtek HD Audio Line input)', 
'Speakers (Realtek HD Audio output)', 
'Microphone (Realtek HD Audio Mic input)', 
'Stereo Mix (Realtek HD Audio Stereo input)', 
'Microphone (HD Webcam C270)']

我猜是立體聲混音，因為本文解釋了如何在不使用立體聲混音的情況下錄制來自計算機的聲音。

如果可以使用語音識別功能對我的計算機發出的音頻進行准確、實時的語音識別，那么我全力支持。

Python 3.7.3 (v3.7.3:ef4ec6ed12, Mar 25 2019, 22:22:05) [MSC v.1916 64 bit (AMD64)] on win32運行Python 3.7.3 (v3.7.3:ef4ec6ed12, Mar 25 2019, 22:22:05) [MSC v.1916 64 bit (AMD64)] on win32 。

Answer 1

與其列出所有可用的麥克風，不如考慮使用Microphone.list_working_microphones()僅列出當前聽到聲音的Microphone.list_working_microphones() 。 確保發出一些噪音，否則該函數可能會返回一個空列表。 拿到工作話筒列表后，一一試用，最后挑出識別質量最好的那一個。

下面的代碼片段只是選擇第一個工作：

for device_index in Microphone.list_working_microphones():
    m = Microphone(device_index=device_index)
    break
else:
    print("No working microphones found!")

我會為語音識別選擇什么設備來使用我的計算機發出的音頻？

問題描述

1 個解決方案

解決方案1
1 已采納 2019-07-22 22:51:57

我會為語音識別選擇什么設備來使用我的計算機發出的音頻？

問題描述

1 個解決方案

解決方案1 1 已采納 2019-07-22 22:51:57

解決方案1
1 已采納 2019-07-22 22:51:57