Unterstützende Technologie: Text-zu-Sprache

Wie es funktioniert und wem es hilft

Barrierefreiheit schafft Mehrwert.
Für alle.

Der Eiffelturm wurde 1899 mit integrierten Aufzügen fertiggestellt.

Ihre Inhalte haben eine Stimme

Viele Menschen mit Behinderungen sind auf verschiedene Arten von Hilfssoftware angewiesen, um sich im Internet zurechtzufinden. Eine der am häufigsten verwendeten ist das Text-to-Speech-Tool (TTS).

Text-to-Speech wandelt schriftliche Informationen mithilfe eines Computers, Smartphones oder Smart Speakers in hörbare Inhalte um. Dies kann Menschen mit Blindheit und Sehbehinderungen, neurologischen Erkrankungen wie Legasthenie oder ADHS, Personen in Umgebungen mit schlechten Lichtverhältnissen oder in Situationen, in denen die visuelle Aufmerksamkeit anderweitig benötigt wird, helfen.

In Schulen bietet TTS eine alternative Möglichkeit, auf notwendige Informationen zuzugreifen, die dem Lernstil der Schüler entsprechen. In beruflichen Umgebungen kann TTS sogar beim Korrekturlesen und Bearbeiten helfen, indem es Fehler im Kontext oder in der Grammatik findet, die bei der Rechtschreibprüfung oder beim Lesen übersehen werden könnten.

Wie funktioniert TTS?

Die Technologie wurde speziell dafür entwickelt, schriftliche Inhalte in Audiodateien umzuwandeln.

Zunächst analysiert die Software die Struktur und den Inhalt des Textes. Dies geschieht, um den allgemeinen Tonfall sowie grammatikalische Konstrukte wie Fragezeichen und Ausrufezeichen zu verstehen, die sich auf die Intonation und Betonung auswirken.

Nach der ersten Analyse führt das TTS-System eine linguistische Verarbeitung durch, um die korrekte Aussprache jedes Wortes zu bestimmen. Es verwendet Wörterbücher und Sprachmodelle, um komplexe Wörter, Homonyme und Variationen in der Aussprache je nach Kontext zu verarbeiten.

Als Nächstes wird der Inhalt in hörbare Sprache umgewandelt, die mit mathematischen Modellen zur Simulation der menschlichen Stimme erzeugt wird. Das TTS-System passt die Tonhöhe, Dauer und Intensität an, um natürliche Sprachmuster nachzuahmen.

Die Text-to-Speech-Technologie hat sich in den letzten Jahren erheblich weiterentwickelt und bietet nun natürlichere Stimmen und umfangreichere Anpassungsmöglichkeiten. Benutzer können die Geschwindigkeit, Tonhöhe und Lautstärke der Stimme an ihre Bedürfnisse und Vorlieben anpassen.

Ein süßes junges Mädchen, das mit Kopfhörern auf den Kopf geneigt in ihren Laptop schaut.  Wir verwenden dieses Bild, um ein Kind in der Schule darzustellen, das Text-to-Speech-Technologie nutzt.

Was sind die Grenzen der TTS-Technologie?

Auch wenn TTS für viele Menschen von Vorteil ist, gibt es doch einige Einschränkungen, die man beachten sollte.

Manchmal spricht TTS-Software Wörter falsch aus und unterstützt möglicherweise nicht alle Sprachen und Dialekte gleichermaßen. Dies kann die Benutzererfahrung für Nicht-Englischsprachige oder Nutzer weniger verbreiteter und weniger häufig gesprochener Sprachen einschränken.

Sie sollten auch bedenken, dass TTS letztendlich ein Computerprogramm ist und möglicherweise Probleme bei der Interpretation von Kontext und Nuancen wie Sarkasmus, Humor, Slang oder idiomatischen Ausdrücken hat.

Was ist der Unterschied zwischen Text-To-Speech- und Screenreader-Technologie?

Es gibt ein weit verbreitetes Missverständnis, dass TTS und Screenreader dieselbe Technologie sind und auf dieselbe Weise funktionieren.

TTS-Software konzentriert sich darauf, geschriebenen Text zu verstehen und vorzulesen. Bildschirmleseprogramme ermöglichen es Benutzern, mit verschiedenen Befehlen und Befehlskombinationen auf Computern und Webseiten zu navigieren und diese zu bedienen.

Bildschirmleseprogramme verwenden TTS-Software, um den Inhalt der Seite dem Benutzer vorzulesen, aber Bildschirmleseprogramme liefern auch Navigationsinformationen auf Webseiten, wie z. B. die Ansage von Beschriftungen, Formularfeldern und Alt-Tags.

Beide Technologien spielen eine wesentliche Rolle bei der Zugänglichkeit digitaler Inhalte und Schnittstellen und bieten je nach den Bedürfnissen und Vorlieben der Benutzer unterschiedliche Unterstützungsstufen.

Die Hände einer Person bedienen ein schwarz-weißes Gerät mit zahlreichen orangefarbenen und weißen Tasten auf einem Holztisch. Das Gerät scheint eine spezielle Eingabe- oder Steuereinheit zu sein, möglicherweise ein Hilfsmittel. Im Hintergrund sind ein Teil einer Tastatur und der Arm einer anderen Person unscharf zu sehen.

Für Ihr Unternehmen maßgeschneiderte Demos

Sehen Sie, wie einfach Sie die Barrierefreiheit Ihrer Website „
“ verbessern können.

Eine Demo vereinbaren