Berlin. Mit Sonic 3.0 bringt das Berliner KI-Unternehmen Cartesia AI ein neues Text-to-Speech-Modell auf den Markt, das Stimmen nahezu in Echtzeit und in bemerkenswerter Qualität generiert. Die Plattform positioniert sich damit als ernsthafte Alternative zu ElevenLabs, einem der bisherigen Marktführer im Bereich synthetischer Sprachmodelle.
Die Besonderheit: Bereits mit einem kostenlosen Nutzerkonto lassen sich Funktionen wie TTS, Sprachlokalisierung und Instant-Voice-Cloning umfangreich testen. Nutzer erhalten zum Einstieg 20.000 Gratis-Credits. Damit lassen sich nicht nur Standardstimmen testen, sondern auch eigene Klone aus Sprachaufnahmen erzeugen.
Instant-Klon in Sekunden
Der Instant-Klon ermöglicht mit nur 5 bis 10 Sekunden Audio die Nachbildung einer Stimme – ideal für schnelle Tests. Für professionellere Anwendungen bietet Cartesia einen Pro-Klon an, der mit 30 bis 120 Minuten Audio arbeitet und über ein Bezahlmodell zugänglich ist. Funktionen wie Voice Changer, eine durchsuchbare Stimmenbibliothek und die Verwaltung früherer Ausgaben runden das Angebot ab.
In der Praxis zeigt sich: Die Qualität der deutschsprachigen Standardstimmen ist derzeit noch durchwachsen, liefert aber solide Ergebnisse für einfache Anwendungen. Wer hohe Stimmtreue wünscht, erzielt mit einem eigenen Klon meist bessere Resultate – insbesondere nach Feinjustierungen bei Tempo und Emotion.
Anwendung und Risiken
Sonic 3.0 kann vielfältig genutzt werden: von der Barrierefreiheit über automatisierte Inhalte bis hin zu kreativen Projekten wie Podcasts oder Hörbüchern. Doch wie bei jeder Technologie dieser Art steht auch das Missbrauchspotenzial im Raum. Deepfakes und täuschend echte Stimmenkopien werfen ethische Fragen auf. Cartesia betont daher den verantwortungsvollen Einsatz seiner Technologie.
„Wir wollen Tools entwickeln, die echte Probleme lösen – nicht neue schaffen“, heißt es von Cartesia auf Anfrage. Eine Integration in bestehende Workflows und Anwendungen ist bereits in Planung.
Interessierte können sich auf der offiziellen Website registrieren oder eine Demonstration auf YouTube ansehen.