Die nächste Generation
der Sprachsynthese.
Wir entwickeln eine schlankere TTS-Architektur, die eine wettbewerbsfähige Natürlichkeit bei einem Bruchteil der Trainingsdaten und Kosten von Branchenführern erreicht.
Hören Sie selbst
Unser V0-Modell, trainiert mit 45.000 Stunden – weniger als 1 % der branchenüblichen Datensätze. Geben Sie beliebigen Text ein und synthetisieren Sie Sprache in Echtzeit.
Tontaube V0 ist ein frühes Forschungsmodell. Verbesserte Versionen werden bald in der App und API verfügbar sein.
Frühe Experimente zeigen erhebliche Effizienzgewinne gegenüber branchenüblichen Ansätzen.
Mit Tontaube entwickeln
Eine schnelle, kostengünstige Sprachgenerierungs-API, die auf unserer Architektur basiert. Klonen Sie jede Stimme aus einer einzigen Audiodatei und generieren Sie Langform-Sprache mit 10-facher Echtzeitgeschwindigkeit.
- One-Shot Voice Cloning
- 0,10-facher Echtzeitfaktor — 1 Minute Audio in ~6 Sekunden
- ~2% der ElevenLabs-Preise
import tontaube
client = tontaube.Client(api_key="your_key")
# Clone any voice from a single audio file
voice_id = client.create_voice(
audio_file="sample.mp3"
)
# Generate speech — 0.10× real-time factor
audio = client.generate_speech(
text="The next generation of speech synthesis.",
voice_id=voice_id
) Tontaube für iOS & Android
Unsere Hörbuch- und Voice-Cloning-App — bereits in den Händen tausender Hörer. Konvertieren Sie jedes Dokument in Audio, klonen Sie Ihre Stimme und streamen Sie aus einer Public-Domain-Bibliothek.
- PDF-, EPUB- & Dokumentenkonvertierung
- Kostenloses Voice Cloning
- Über 30.000 KI-Hörbücher
Interesse an einer Investition?
Wir haben die Architektur im Prototypenstadium bewiesen und suchen Investitionen, um Rechenleistung, Daten und das Team zu skalieren.