Abstract
-
Die Leichte Sprache stellt eine auf verschiedenen sprachlichen Ebenen nach bestimmten Regeln vereinfachte Variante der deutschen Standardsprache dar, die darauf abzielt, die Verständlichkeit von Texten für Menschen mit angeborenen oder erworbenen Beeinträchtigungen bei der Sprachverarbeitung zu erhöhen. Die in der jüngeren Vergangenheit insbesondere durch Deep-Learning-Modelle erzielten Fortschritte im Bereich der maschinellen Sprachverarbeitung konnten zwar im Anwendungsfeld der Textübersetzung zu Verbesserungen in der Übersetzungsqualität führen, lassen sich bei der Übersetzung von standardsprachlichen Texten in Leichte Sprache jedoch nur bedingt nutzbar machen. Zum einen fehlen ausreichende Mengen an adäquaten Trainingsdaten, zum anderen weisen die bei der Übersetzung von standardsprachlichen Texten in Leichte Sprache angewandten Regeln einen mitunter hohen Interpretationsspielraum auf. Die vorliegende Arbeit befasst sich mit der Identifikation von Automatisierungspotenzialen im intralingualen Übersetzungsprozess sowie mit der Konzeption geeigneter Lösungsansätze, um die in der Praxis bisher überwiegend intellektuell realisierte Erstellung von Texten in Leichter Sprache (semi-)automatisiert zu unterstützen. Dabei werden die Aktivitäten des Prozesses analysiert und Assistenzpotenziale sowie Schnittstellen zwischen den Akteuren identifiziert, wobei sich der Bedarf eines Instruments zur automatisierten objektiven Texteinschätzung als prozessübergreifende Assistenz zeigt. Basierend auf den erkannten Potenzialen leitet die Arbeit Assistenzfunktionen ab und erstellt Konzepte für deren Nutzbarmachung. Überdies wird eine Systemarchitektur vorgestellt, die zum einen die Erzeugung valider Datensätze und zum anderen die Abbildung des intralingualen Übersetzungsprozesses fokussiert. Die Erstellung eines Instruments zur automatisierten objektiven Texteinschätzung adressiert die prozessübergreifende Assistenz im intralingualen Übersetzungsprozess. Hierfür lassen sich Merkmale verschiedener linguistischer Ebenen mittels Methoden der maschinellen Sprachverarbeitung aus erstellten Korpora mit Nachrichtentexten extrahieren und sowohl für Leichte Sprache als auch für Standardsprache quantifizieren. Die daraus resultierenden Merkmalsprofile beider Sprachvarianten bilden die Basis zur Erstellung eines Selektionsverfahrens, welches die Identifikation relevanter Indexmerkmale ermöglicht. Die Evaluation des entstandenen Index 'Proportion of Easy-to-Read Language in News (PERLiN)' erfolgt hinsichtlich der Einschätzungsgüte, des Determinismus, der Erklärbarkeit und Nachvollziehbarkeit sowie der Generalisierbarkeit.