语音合成研究实验室
下一代
语音合成。
我们正在构建一个更精简的 TTS 架构,以行业领导者一小部分的训练数据和成本,实现具有竞争力的自然度。
Tontaube V0 · 早期研究预览
亲耳听听
我们的 V0 模型,在 45,000 小时的数据上进行训练——不到行业标准数据集的 1%。输入任何内容,实时合成语音。
Enter Text
Tontaube V0 是一个早期研究模型。改进版本即将上线应用程序和 API。
早期实验表明,与行业标准方法相比,效率显著提高。
API · 即将推出
使用 Tontaube 进行构建
由我们架构驱动的高速、高性价比语音生成 API。通过单个音频文件克隆任何声音,并以 10 倍实时速度生成长篇语音。
- 一次性声音克隆
- 0.10 倍实时因子 — 1 分钟音频约 6 秒
- 约为 ElevenLabs 定价的 2%
Python SDK 即将推出
import tontaube
client = tontaube.Client(api_key="your_key")
# Clone any voice from a single audio file
voice_id = client.create_voice(
audio_file="sample.mp3"
)
# Generate speech — 0.10× real-time factor
audio = client.generate_speech(
text="The next generation of speech synthesis.",
voice_id=voice_id
) 现已可用
Tontaube 适用于 iOS 和 Android
我们的有声读物和声音克隆应用 — 已有数千名听众使用。将任何文档转换为音频,克隆您的声音,并从公共领域库中进行流式传输。
- PDF、EPUB 及文档转换
- 免费声音克隆
- 30,000+ 部AI有声读物
对投资感兴趣?
我们已在原型规模上验证了该架构,目前正在寻求投资以扩展计算、数据和团队。