Skip to main content

语音合成软件TTSAir

关于TTSAir

Table of Contents
  • 这是一个TTS软件,集成了微软,火山,阿里的语音合成接口。
  • 这是一个编辑器,支持全功能SSML编辑,多音字编辑等功能。
  • 这是一个创作工具,支持多人对话,批量合成,简繁字幕等功能。

# 缘起

  1. 平时会看影视解说:“快看,这个男人叫小帅,这个女人叫小美”
  2. 直到某天才发现:小帅小美都是TTS配音的
  3. 利用TTS技术,只要写好内容,我也可以做自媒体
  4. 没有找到一个好用的工具
  5. 或许自己可以写一个

# 功能和实践

  1. 基本的合成功能
  2. 对话节目,英语题材:多人对话模式
  3. 生成发音不准:多音字编辑,高频多音字高亮
  4. 发音精调:SSML编辑功能,短标签功能
  5. 重复生成造成浪费:长文件切割
  6. 一个系列的生成:文件夹为单位,批量生成,合并
  7. 繁体内容发音偏差:简繁转换,中港台三种字幕
  8. Azure时长,火山和阿里字数限制:智能分段,多次生成后合并
  9. 很多能提高效率的细节功能

# 近期计划

  1. 全平台支持
  2. 遇到好用的TTS服务商,可以接入
  3. 开源TTS模型整合,本地生成