关于TTSAir
Table of Contents
- 这是一个TTS软件,集成了微软,火山,阿里的语音合成接口。
- 这是一个编辑器,支持全功能SSML编辑,多音字编辑等功能。
- 这是一个创作工具,支持多人对话,批量合成,简繁字幕等功能。
#
缘起
- 平时会看影视解说:“快看,这个男人叫小帅,这个女人叫小美”
- 直到某天才发现:小帅小美都是TTS配音的
- 利用TTS技术,只要写好内容,我也可以做自媒体
- 没有找到一个好用的工具
- 或许自己可以写一个
#
功能和实践
- 基本的合成功能
- 对话节目,英语题材:多人对话模式
- 生成发音不准:多音字编辑,高频多音字高亮
- 发音精调:SSML编辑功能,短标签功能
- 重复生成造成浪费:长文件切割
- 一个系列的生成:文件夹为单位,批量生成,合并
- 繁体内容发音偏差:简繁转换,中港台三种字幕
- Azure时长,火山和阿里字数限制:智能分段,多次生成后合并
- 很多能提高效率的细节功能
#
近期计划
- 全平台支持
- 遇到好用的TTS服务商,可以接入
- 开源TTS模型整合,本地生成