TRANCE - Ein System für maschinelle Satzanalyse: Syntax Teodor Kouumdjiev (Autorenkollektiv). Universität Oldenburg (extended abstract) Allgemeines Im Rahmen des Projekts TRANCE ist ein Werkzeug für Linguisten entwickelt und implementiert worden, das die Möglichkeit bietet Sätze einer natürlichen Sprache mittels Computer zu analysieren. Der analysierte Satz wird in Form eines syntaktischen Baumes dargestellt. Diese Darstellung wird vom System visualisiert. Die Satzanalyse erfolgt aufgrund einer Syntaxbeschreibung, die aus einer Phrasenstrukturgrammatik und einem Lexikon besteht. Diese beiden Elemente beinhalten ein formalisiertes Sprachmodell. Indem der Benutzer (der Linguist) die Regeln der Grammatik bestimmt und die Lexikoneinträge eingibt, bzw. auswählt, kann er verschiedene Modelle der erforschten Sprache untersuchen. Die Visualisierungskomponente soll ihm bei der Feststellung von Mehrdeutigkeiten (Ambiguitäten) in den Sätzen und in den von ihm festgelegten Regeln Hilfe leisten. Hauptmerkmale Die Hauptmerkmale des Systems, das als Resultat dieses Projektes entstanden ist, sind: Ersetzbarkeit der Regeln (der Phrasenstrukturgrammatik), austauschbares Lexikon, Erweiterbarkeit des Modells durch Einfügen von Features und von zusätzlichen Einschränkungen in Form von Regeln, die unterschiedliche Kongruenzen gewährleisten sollen. Linguistische Ziele Die Ziele auf dem Gebiet der Angewandten Linguistik sind vorwiegend didaktischer Natur. Unsere Motivation war es einige Schwierigkeiten zu überwinden, die beim Unterricht der Satzanalyse (Generativen Grammatik) zu beobachten sind. Das System erlaubt jedoch dem geübten Benutzer unterschiedliche Satzanalysemodelle zu untersuchen und die Sprachbeschreibung zu erforschen. Mögliche Erweiterungen des Systems würden erlauben, semantische und morphologische Einschränkungen und deren Wirkung auf die Satzanalyse miteinzubeziehen. Die computerunterstützte Anwendung einer formalen Beschreibung natürlicher Sprache - (Phrasenstrukturgrammatik) wird einerseits dazu benutzt, den Prozeß der Satzanalyse zu visualisieren und andererseits dient sie als Werkzeug zum Untersuchen der vorausgesetzten Sprachregeln selbst. Um dieses Ziel zu erreichen, wurde beim Entwurf des Systems als Hauptbedingung Ersetzbarkeit der Syntaxregeln gestellt. Die vorgesehenen Erweiterungen des Systems würden eine komplexere (holistische) Abhandlung von Aussageeingaben (Sätzen) ermöglichen. Hintergrund und Endziele Bei der Ausarbeitung der Konzepte des TRANCE-Systems wurde die Sprachanalyse- Problematik aus unterschiedlichen Aspekten betrachtet. Die interdisziplinäre Vorgehensweise, die dieses Projekt auszeichnet, führte dazu, daß Begriffe und Ansätze aus den Hauptgebieten der Sprachwissenschaft in Betracht gezogen wurden: Morphologie, Syntax, Semantik, Pragmatik und Prosodie. Als Endziel unserer Forschung ist die sinngetreue Satztransformation von einer Sprache in die andere anzusehen. Das kann als Maschinelles Übersetzen aufgefaßt werden. In der vorläufigen Phase jedoch, wurde die konkrete Zielsetzung auf Syntaxanalyse mit Erweiterungsmöglichkeiten eingeschränkt. Informatische Ziele Im Gebiet der Angewandten Informatik wurden folgende Hauptziele angestrebt: ein System zu gestalten, das als Objekt für eine software-ergonomische Untersuchung der Interaktion zwischen einem unvoreingenommenen Benutzer mit Spezialwissen und dem Computer dienen kann, das System möglichst portabel zu implementieren, so daß es praktisch auf jedem Computersystem einzusetzen ist. Die Satzanalyse - frei definierbare Phrasenstrukturgrammatik Im Rahmen des Projekt TRANCE dient eine Phrasenstrukturgrammatik als Grundlage für die Satzanalyse. Sie liegt als Regelmenge für den Parsingalgorithmus (Earley) vor. Ein Merkmal, das die Anwendung dieses Parsingalgorithmus auszeichnet, ist die Austauschbarkeit der Regeln. Dies ist eine eigene Entwicklung, die ein Hauptbestandteil des gesamten Projekts darstellt. Man kann von einer frei definierbaren Phrasenstrukturgrammatik sprechen. Die generative Grammatik weist einige Einschränkungen auf, die an dieser Stelle nicht weiter erörtert werden. Benutzung Dem Benutzer - dem Sprachwissenschaftler bietet das System folgende Funktionen an: Eingabe einer Menge von Wortformen - ein Lexikon. Ergänzung, bzw. Austausch von Lexikoneinträgen. Eintragung oder Austausch von Syntaxregeln (Grammatik), nach denen die Satzanalyse durchgeführt werden soll. Eingabe des zu analysierenden Satzes. Graphische Darstellung der Satzanalyse in unterschiedlichen Formen, von denen die markanteste und vermutlich meistverwendete die Syntaxbaum-Darstellung ist. Die Ein- und Ausgabemodule stellen die Benutzungsoberfläche dar. Der Datenaustausch (Kommunikation) zwischen Benutzer und System findet über die Benutzungsoberfläche statt. Die Benutzungsoberfläche wurde nach den Kriterien der Software-Ergonomie gestaltet: Konsistenz, Robustheit, Fehlertoleranz, Transparenz. Die Oberfläche ist selbsterklärend und bietet einige Hilfe-Funktionen. Schluß Abschließend kann behauptet werden, daß es den Autoren gelungen ist, ein linguistisches Werkzeug zu gestalten, das dem Sprachwissenschaftler bei der Erforschung und Vermittlung von formalisierten Sprachbeschreibungen zur Verfügung steht. P.S. 1.) Dieser Beitrag ist das Werk eines Autorenkollektivs. In alphabetischer Ordnung: Henning Brinkman, Olaf Heißenbüttel, Thorsten Kollstede, Theodor Kujumdjieff(Teodor Kouumdjiev), Christian Lerch, Michael Schmeing, Holger Schneider, Mario Schomakers. Alle Autoren betreiben ihre Studien und Forschung an der Universität Oldenburg. Um Mißverständnissen vorzubeugen, wurde im Titel nur ein Name erwähnt. e-mail Adresse für Kontakte ist: Kujumdjieff@Informatik.Uni-Oldenburg.de 2.) Das System TRANCE wurde auf DEC-Stations implementiert. Falls im Rahmen der Tagung eine Präsentation des Systems angebracht ist und die technischen Voraussetzungen vorhanden sind, wäre es unter Umständen möglich das TRANCE Projekt den Teilnehmern zu demonstrieren. 3 TRANCE - extended abstract 29.04.1999