繁体   English   中英

定义脚本中每个单词的发音开始时间

[英]define pronunciation starting time for each word in script

我有一个用于创建播客的文本脚本。 因此,播客音频中的单词与我的文字完全相同。 现在我想要的是以下内容:

Word in text | Pronounciation started at
Hello          0:0:0.000
my             0:0:1.125
friends        0:0:2.750

那有可能做到吗? 提前致谢!

可以用来解决问题复杂性的关键词之一是“强制对齐”。 该站点还涵盖有关此主题的问题,例如, 此处通过相关线程引导您找到有关HTK(隐马尔可夫模型工具包)的问题和答案。

您可以在此处找到有关如何在自动音频分段中使用强制对齐的更多动手风格描述。

因此答案是:是的,这是可能的,但是它在算法上非常复杂,即使在最佳实现中也不是没有错误的。

PS .:我发现您是一个非常简单的工具

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM