Следующее поколение
синтеза речи.
Мы создаем более компактную архитектуру TTS, которая достигает конкурентоспособной естественности при значительно меньшем объеме обучающих данных и стоимости по сравнению с лидерами отрасли.
Услышьте сами
Наша модель V0, обученная на 45 000 часов — менее 1% от стандартных отраслевых наборов данных. Введите любой текст и синтезируйте речь в реальном времени.
Tontaube V0 — это ранняя исследовательская модель. Улучшенные версии скоро появятся в приложении и API.
Ранние эксперименты показывают значительное повышение эффективности по сравнению со стандартными отраслевыми подходами.
Создавайте с Tontaube
Высокоскоростной и экономичный API для генерации голоса, работающий на нашей архитектуре. Клонируйте любой голос из одного аудиофайла и генерируйте длинную речь со скоростью, в 10 раз превышающей реальное время.
- Клонирование голоса с одного образца
- Коэффициент реального времени 0.10× — 1 минута аудио за ~6 секунд
- ~2% от стоимости ElevenLabs
import tontaube
client = tontaube.Client(api_key="your_key")
# Clone any voice from a single audio file
voice_id = client.create_voice(
audio_file="sample.mp3"
)
# Generate speech — 0.10× real-time factor
audio = client.generate_speech(
text="The next generation of speech synthesis.",
voice_id=voice_id
) Tontaube для iOS и Android
Наше приложение для аудиокниг и клонирования голоса — уже в руках тысяч слушателей. Конвертируйте любой документ в аудио, клонируйте свой голос и транслируйте из библиотеки общественного достояния.
- Конвертация PDF, EPUB и документов
- Бесплатное клонирование голоса
- 30 000+ аудиокниг с ИИ
Заинтересованы в инвестициях?
Мы доказали архитектуру на уровне прототипа и ищем инвестиции для масштабирования вычислений, данных и команды.