Forschungslabor für Sprachsynthese

Die nächste Generation
der Sprachsynthese.

Wir entwickeln eine schlankere TTS-Architektur, die eine wettbewerbsfähige Natürlichkeit bei einem Bruchteil der Trainingsdaten und Kosten von Branchenführern erreicht.

Tontaube V0 · Frühe Forschungs-Preview

Hören Sie selbst

Unser V0-Modell, trainiert mit 45.000 Stunden – weniger als 1 % der branchenüblichen Datensätze. Geben Sie beliebigen Text ein und synthetisieren Sie Sprache in Echtzeit.

Enter Text

Tontaube V0 ist ein frühes Forschungsmodell. Verbesserte Versionen werden bald in der App und API verfügbar sein.

Frühe Experimente zeigen erhebliche Effizienzgewinne gegenüber branchenüblichen Ansätzen.

API · Demnächst verfügbar

Mit Tontaube entwickeln

Eine schnelle, kostengünstige Sprachgenerierungs-API, die auf unserer Architektur basiert. Klonen Sie jede Stimme aus einer einzigen Audiodatei und generieren Sie Langform-Sprache mit 10-facher Echtzeitgeschwindigkeit.

  • One-Shot Voice Cloning
  • 0,10-facher Echtzeitfaktor — 1 Minute Audio in ~6 Sekunden
  • ~2% der ElevenLabs-Preise
Auf die Warteliste setzen
Python SDK Demnächst verfügbar
import tontaube

client = tontaube.Client(api_key="your_key")

# Clone any voice from a single audio file
voice_id = client.create_voice(
    audio_file="sample.mp3"
)

# Generate speech — 0.10× real-time factor
audio = client.generate_speech(
    text="The next generation of speech synthesis.",
    voice_id=voice_id
)
Jetzt verfügbar

Tontaube für iOS & Android

Unsere Hörbuch- und Voice-Cloning-App — bereits in den Händen tausender Hörer. Konvertieren Sie jedes Dokument in Audio, klonen Sie Ihre Stimme und streamen Sie aus einer Public-Domain-Bibliothek.

  • PDF-, EPUB- & Dokumentenkonvertierung
  • Kostenloses Voice Cloning
  • Über 30.000 KI-Hörbücher
Vollständige Produktübersicht

Interesse an einer Investition?

Wir haben die Architektur im Prototypenstadium bewiesen und suchen Investitionen, um Rechenleistung, Daten und das Team zu skalieren.