簡體   English   中英

我會為語音識別選擇什么設備來使用我的計算機發出的音頻?

[英]What device I would select for Speech Recognition to use the audio coming out of my computer?

我正在嘗試使用 Python 3 制作隱藏式字幕生成器。當我調用list_microphone_names() ,會列出一堆音頻源。 我會為從我的計算機發出的音頻選擇哪個來源?

我曾嘗試使用pocketsphinx進行實時識別,但結果非常不准確。 我找到了一個使用-adcdev參數來選擇源的選項,但我不知道要放入什么。

這是我從調用list_microphone_names()

>>> import speech_recognition as sr
>>> r = sr.Recognizer()
>>> mic = sr.Microphone()
>>> sr.Microphone.list_microphone_names()
['Microsoft Sound Mapper - Input', 
'Microphone (HD Webcam C270)', 
'Microsoft Sound Mapper - Output', 
'Speakers (Realtek High Definiti', 
'Primary Sound Capture Driver', 
'Microphone (HD Webcam C270)', 
'Primary Sound Driver', 
'Speakers (Realtek High Definition Audio)', 
'Speakers (Realtek High Definition Audio)', 
'Microphone (HD Webcam C270)', 
'Line In (Realtek HD Audio Line input)', 
'Speakers (Realtek HD Audio output)', 
'Microphone (Realtek HD Audio Mic input)', 
'Stereo Mix (Realtek HD Audio Stereo input)', 
'Microphone (HD Webcam C270)']

我猜是立體聲混音,因為本文解釋了如何在使用立體聲混音的情況下錄制來自計算機的聲音。

如果可以使用語音識別功能對我的計算機發出的音頻進行准確、實時的語音識別,那么我全力支持。

Python 3.7.3 (v3.7.3:ef4ec6ed12, Mar 25 2019, 22:22:05) [MSC v.1916 64 bit (AMD64)] on win32運行Python 3.7.3 (v3.7.3:ef4ec6ed12, Mar 25 2019, 22:22:05) [MSC v.1916 64 bit (AMD64)] on win32

與其列出所有可用的麥克風,不如考慮使用Microphone.list_working_microphones()僅列出當前聽到聲音的Microphone.list_working_microphones() 確保發出一些噪音,否則該函數可能會返回一個空列表。 拿到工作話筒列表后,一一試用,最后挑出識別質量最好的那一個。

下面的代碼片段只是選擇第一個工作:

for device_index in Microphone.list_working_microphones():
    m = Microphone(device_index=device_index)
    break
else:
    print("No working microphones found!")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM