Sprachsynthese
Was ist Sprachsynthese?
Unter dem Begriff Sprachsynthese versteht man die maschinelle Erzeugung von künstlicher Sprache aus geschriebenem Text. Beispiele für Anwendungen der Sprachsynthese sind das Vorlesen von SMS-Nachrichten per Telefon und die Ausgabe von Bildschirminhalten für sehbehinderte Menschen. Die Fähigkeit, beliebige Äußerungen erzeugen zu können und die damit verbundene, kompliziertere Vorverarbeitung unterscheidet die Sprachsynthese von einer einfachen Sprachausgabe mit beschränktem Wortschatz, wie sie in Ansagesystemen - beispielsweise bei digitalen Anrufbeantwortern - Verwendung findet. Die Phonetikgruppe des IfK verfolgt in erster Linie den Ansatz der konkatenativen Sprachsynthese, bei der das künstliche Sprachsignal aus Segmenten vorher aufgezeichneter natürlicher Sprache erzeugt wird. Unten finden Sie Links auf die verschiedenen Synthese-Aktivitäten des IfK.
- BOSS
Das Bonn Open Speech Synthesis System ist ein kostenloses Open-Source-Sprachsynthesesystem. BOSS stellt für Entwickler und Forscher eine Plattform bereit, um eigene Text-To-Speech- oder Content-To-Speech-Systeme zu erstellen. Durch die Verwendung eines Non-Uniform Unit-Selection-Verfahrens, bei dem aus großen Sprachdatenbanken zur Laufzeit die geeignetsten Sprachbausteine ausgewählt und zusammengesetzt werden, erreicht die Ausgabe von BOSS eine gute Sprachqualität und eine hohe Naürlichkeit. In Verbindung mit den hier erhältlichen deutschen Datenpaketen wird BOSS zu einer vollständigen deutschsprachigen Sprachsynthesesoftware.
Lizenz: Die BOSS-Software wird unter einer erweiterten GNU Public License kostenlos zur Verfügung gestellt. Die deutschen Datensätze unterliegen einer modifizierten MBROLA-Lizenz.
- HADIFIX
Datengesteuerte Text-To-Speech-Synthese für das Deutsche, basierend auf Halbsilben, Diphonen und Suffixen.
Lizenz: HADIFIX wird unter einer eigenen kommerziellen Lizenz vertrieben.
- BOSS und HADIFIX im Vergleich (zur Zeit leider nicht verfügbar)
Online-Synthese mit BOSS bzw. Hadifix; da beide Systeme das gleiche Sprachkorpus verwenden, ist ein direkter Vergleich der beiden Systeme möglich.
- TXT2PHO
Automatisierte Umwandlung von Text in Lautschrift (Graphem-Phonem-Konvertierung)
- AVISS
Das Audio Visual Synthesis System verbindet Sprachsynthese mit einer lippensynchronen Videoausgabe.
- HMM
Deutsche Datensätze für das HMM-basierte Sprachsynthesessystem HTS der Nagoya-Universität, Japan.
- Automatische Transkription
Die Transkriptionsmodule des BOSS- und des HADIFIX-Systems.
- Textvorverarbeitung: LEMMA
Maschinelle Lemmatisierung: Automatische Bestimmung von Wortklasse und Grundform zu geschriebener deutscher Sprache.
- PREPROC
Ein konfigurierbarer, regelbasierter Text-Präprozessor für Sprachsynthese. Dieses Programm wurde für das Sprachsynthesesystem HADIFIX entwickelt.
- BOMP
Ein maschinenlesbares deutsches Aussprachewörterbuch (in drei verschiedenen Transkriptionsformaten). Dieses Wörterbuch wurde aus dem Lexikon des Sprachsynthesesystems Hadifix erzeugt.

