IA Vocale Fondamentale

IA Vocale
Conçue pour les Agents IA

Premières expériences montrant des gains d'efficacité significatifs par rapport aux approches standard de l'industrie.

Tontaube V0 · Maintenant disponible

Écoutez par vous-même

Testez notre modèle V0, conçu pour une faible latence et une rentabilité optimale. Saisissez votre texte ci-dessous pour générer un échantillon audio.

Enter Text

Tontaube V0 est un modèle d'IA vocale fondamental. Des versions améliorées arriveront bientôt sur l'application et l'API.

Long-form narration samples

Experience extended passages in English and German from Tontaube, the world's most natural-sounding model for audiobooks.

English
Audiobook narration — English
0:00
Deutsch
Hörbuch-Erzählung — Deutsch
0:00

Développez avec Tontaube

Une API de génération vocale rapide et économique, propulsée par notre architecture. Clonez n'importe quelle voix à partir d'un seul fichier audio et générez de la parole longue à une vitesse 10 fois supérieure au temps réel.

  • 200 000 caractères gratuits à l'inscription
  • 5 $ par million de caractères
  • Paiement à l'utilisation avec des plans d'entreprise
  • Voix personnalisées (bientôt disponible)
  • Latence d'environ 200 ms pour les clients entreprises
Rejoindre la liste d'attente
Python
Available on PyPI
import tontaube

with tontaube.Client(api_key="ttb_live_...") as client:
    speakers = client.list_speakers()
    for speaker in speakers:
        print(f"{speaker.name} ({speaker.voice_style}), id: {speaker.id}")

    response = client.generate_speech(
        text="I am here to help you with your project. Tell me what we are building today, and I will get right to work.",
        speaker_id=speakers[0].id,
        temperature=0.8,
    )

with open("speech.opus.m4a", "wb") as f:
    f.write(response.content)

print(f"Duration: {response.audio_duration}s, Cost: ${response.cost_usd}")
print("Result saved to speech.opus.m4a")
2.33%
Seed-TTS WER
per row mean, clipped at 100%
94–97%
GMOS prosody wins
vs on-device tier (NeuTTS Air, Nano, Kani TTS 2)
150–200 ms
Server latency
time to first audio chunk on a single GPU
On-Device
Near real-time on Pixel 8
CPU inference — no GPU required
Disponible maintenant

Tontaube pour iOS et Android

Notre application de livres audio et de clonage vocal — déjà entre les mains de milliers d'auditeurs. Convertissez n'importe quel document en audio, clonez votre voix et diffusez depuis une bibliothèque du domaine public.

  • Conversion de documents PDF, EPUB et autres
  • Clonage vocal gratuit
  • Plus de 30 000 livres audio IA
Aperçu complet du produit

Intéressé par l'investissement ?

Nous avons prouvé l'architecture à l'échelle du prototype et recherchons des investissements pour faire évoluer le calcul, les données et l'équipe.