Text to Speech im Web-Browser

Liebe Leserinnen und Leser,

ich habe mich im Rahmen meiner Recherche mit dem Gedanken befasst, selbst Technologie auszuprobieren, die für Barrierefreiheit sorgt bzw. sorgen soll (siehe hier, Abschnitt „Technisches“). Das möchte ich im aktuellen Beitrag etwas vertiefen. Ich habe mich beim Lesen meiner Recherchepaper gefragt, ob es Programme zum Vorlesen von PDF-Dateien gibt. Aus Programmierersicht sehe ich zwei Hauptschwierigkeiten:

  1. Text in PDF-Dateien zuverlässig und richtig erkennen, sowohl Buchstaben, Worte und Absätze als auch beabsichtigte Formatierung
  2. Den Text auf menschenverständliche Weise vorlesen, was meines Erachtens Silbentrennung, Intonation und Punktuation betrifft

Da ich bei meiner, zugegebenermaßen etwas oberflächlichen, Suche nicht auf Programme mit dieser Funktionalität gestoßen bin, und in vielen Bereichen der Softwareentwicklung der Trend Richtung Browser geht, möchte ich zwei Wege vorstellen, PDFs im Browser vorlesen zu lassen.

Microsoft Edge

Was mich ehrlicherweise überrascht hat, ist die Integration einer Vorlesefunktion in den PDF-Viewer von Microsoft Edge. Bei Firefox (Version 95.0.4) konnte ich eine solche Funktion nicht nativ ausmachen. Ich habe mir dann das Paper „What do we mean by ‚Accessibility Research‘?“ von Kelly Mack et al. vorlesen lassen. In Edge unter Microsoft Windows klappte das für mich erstaunlich gut.

Mozilla Firefox

Es betrübte mich, dass Edge in diesem einen Punkt meinem Lieblings-Browser so weit voraus zu sein schien. Für Firefox konnte ich immerhin ein Plugin ausmachen, welches diese Funktionalität bietet: „Read Aloud: A Text to Speech Voice Reader“. Die Usability ist subjektiv zwar schlechter als bei der nativen Edge-Funktion, da man das Dokument erst hochladen muss (nebst Hinweis, dass es nicht wirklich hochgeladen, sondern nur zum Vorlesen verarbeitet wird). Beim Vorlesen scheint es mir qualitativ ähnlich zu Edge zu sein. Auf meinem Linux-Mint-System klang die Stimme sehr viel roboterhafter als auf Windows, aber ich gehe davon aus, dass das daran liegt, dass ich mich noch nicht damit befasst habe, Sprachpakete zu installieren.

Fazit

Mit diesem kurzen Beitrag erhoffe ich mir, einen Anstoß auch für mich selbst geschaffen zu haben, Assistive Technology besser kennenzulernen. Immerhin haben Text to Speech Programme nicht nur Nutzen für Personen mit Beeinträchtigung, sondern auch für diejenigen, die Inhalte besser durch Vorlesen erfassen. Analog zu Hörbüchern oder Podcasts kann man sich damit nämlich prima alles Mögliche vorlesen lassen.

Liebe Grüße und ein schönes Wochenende!
Stefan