[英]Recording synthesized text-to-speech to a file in Python
您可以使用更高級的SAPI包裝器將輸出保存到wav文件。 例如,您可以嘗試
https://github.com/DeepHorizons/tts
代碼應該如下所示:
import tts.sapi
voice = tts.sapi.Sapi()
voice.set_voice("Joey")
voice.create_recording('hello.wav', "Hello")
下面是一個示例,可讓您訪問NSSpeechSynthesizer API
#!/usr/bin/env python
from AppKit import NSSpeechSynthesizer
import sys
import Foundation
if len(sys.argv) < 2:
text = raw_input('type text to speak> ')
else:
text = sys.argv[1]
nssp = NSSpeechSynthesizer
ve = nssp.alloc().init()
ve.setRate_(100)
url = Foundation.NSURL.fileURLWithPath_('yourpath/test.aiff')
ve.startSpeakingString_toURL_(text,url)
使用帶有大膽的VB輸入和輸出模擬器電纜來記錄任何engine.play()輸出。
您將需要下載VB電纜,然后通過Windows聲音設置默認設置窗口,然后將Audacity的輸入設置為Microsoft聲音映射器輸入,點擊Audacity上的記錄並播放您的腳本。 您將注意到它已經在Audacity上完成,然后導出您需要循環的內容。
這種方法可能超出了范圍並不完美,但適用於pyttsx3並且記錄質量比espeak更好。
您也可以使用Amazon Polly API:
下面提供了使用python的示例:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.