Die Rolle von Metadaten in einem multilingualen Multimedia-System "uber Gesundheitsfragen Dietmar R\"osner [.4cm] Otto-von-Guericke-Universit\"at Magdeburg Institut f\"ur Wissens- und Sprachverarbeitung P.O.\, Box 41\,20, D--39016 Magdeburg, Germany roesner@iws.cs.uni-magdeburg.de *extended abstract f"ur die GLDV-Jahrestagung 1999 *Einleitung Das Projekt CATCH (Langtitel: Citizen Advisory System based on Telematics for Communication and Health) wird im Rahmen des Europ"aischen Telematics Application Program seit Januar 1998 bis voraussichtlich M"arz 2000 gef"ordert. Zu den Hauptzielen der Aktivit"aten in diesem Programm geh"ort es im Bereich Gesundheit, solche Anwendungen zu entwickeln, die dazu beitragen, da"s das Europ"aische Gesundheitssystem die Erwartungen der B"urger erf"ullt. Die Arbeiten von CATCH haben das Ziel, ein Rahmensystem zu schaffen, mit dem Informationen und Dienste zu gesundheitsrelevanten Fragen f"ur europ"aische B"urger entsprechend deren Bed"urfnissen bereitgestellt werden k"onnen. Der so verbesserte Zugang zu Gesundheitsinformationen soll dazu beitragen, die Selbstverantwortung der B"urger zu st"arken. Informationen "uber gesunden Lebensstil, "uber Vermeidung von Risikofaktoren und andere M"oglichkeiten zur Pr"avention sollen Gesundheitsrisiken verringern helfen. Eine wichtige Auswirkung der besseren Information soll letztendlich auch sein, da"s sich die Ausgaben im Gesundheitsbereich verringern. Beim Ansatz von CATCH liegt der Schwerpunkt auf folgenden Aspekten: * die Endnutzer der angebotenen Informationen und Dienste sind europ"aische B"urger, * Informationsanbieter k"onnen verschiedene der im Gesundheitsbereich handelnden Organisationen sein (Krankenkassen, Fachverb"ande, Selbsthilfegruppen, Kliniken, niedergelassene "Arzte usw.) * Den Fragen der Multilingualit"at, aber auch der soziokulturellen Unterschiede in Europa wird besondere Aufmerksamkeit gewidmet. * Die M"oglichkeiten der neuen Medien zu erh"ohter Interaktivit"at und auch Adaptivit"at an denjeweiligen Nutzer sollen erprobt und entwickelt werden. *Von der Einzell"osung zum flexiblen Rahmensystem Ziel der Arbeiten von CATCH ist es, anhand einiger ausgew"ahlter Themengebiete (Hautkrebs, kardiovaskul"are Erkrankungen) exemplarisch aufzuzeigen, wie solche medizinischen Informationssysteme zu gestalten sind, mit Prototypen und realen Benutzern Erfahrungen zu sammeln, die Erfahrungen zu abstrahieren und so schlie"slich ein Rahmensystem zu erreichen, da"s es anderen Informationsanbietern erleichtern wird, ihre Inhalte dann f"ur Internet- oder auch Kioskanwendungen aufzubereiten. Ein wichtiges Teilthema ist in diesem Zusammenhang die Unterst"utzung des Autorenprozesses. Ein anderes ist die Wiederverwendbarkeit von multimedialen Ressourcen (d.h. von Texten, Bildern, Videos, ggf. Ger"auschdateien u."a.). Schlie"slich sollen Konzepte entwickelt und erprobt werden, die helfen multilinguale Informationsbest"ande konsistent zu halten und den Proze"s der "Ubertragung von einem Quelldokument (f"ur das Projekt wurde Englisch als Sprache f"ur die `Masterversionen' der in den verschiedenen Zielsprachen -- derzeit: Englisch, Deutsch, Italienisch, Portugiesisch -- anzubietenden Texte verabredet) in Dokumente verschiedener Zielsprachen zu unterst"utzen. Zentral f"ur alle diese Anliegen ist, da"s bereits bei der Erstellung von beispielsweise Texteinheiten zu diesen geeignete Meta-Information erfa"st wird. Meta-Information kann sich dabei sowohl auf den Erstellungs-/"Uberarbeitungsproze"s beziehen oder auf den Inhalt oder auf die Art der intendierten Verwendung und Aspekte der Inhaltspr"asentation. F"ur die einheitliche Kodierung von Meta-Information wird XML (extensible markup language) eingesetzt. *Arten von erfa"sten Metadaten Teilt man die in CATCH erfa"sten und weiterverarbeiteten Metadaten grob ein, so ergeben sich einerseits technische, auf den Autoren- und Publikationsprozess bezogene Daten und solche, die zum Inhalt des Textes und zu seiner Verwendung wichtige Hinweise geben. Die technischen Daten umfassen in Anlehnung an den sog. Dublin Core den Autor, die Quelle der Information, das Datum der Erstellung, aber auch, ob der medizinische Inhalt zertifiziert ist, wenn ja, von wem, u."a. Andere Metadaten dienen dazu, den Hauptgegenstand und die Intention der jeweiligen Informationseinheit zu charakterisieren. Beispiele k"onnen sein: * der Text soll Information "uber einen Gegenstandsbereich vermitteln, * er soll eine Definition geben, * er soll instruieren, eine bestimmte Aktion oder Aufgabe zu erf"ullen, * er soll ein bestimmtes Verhalten empfehlen, * er soll den Benutzer "uberzeugen, ein bestimmtes Verhalten anzunehmen, * er soll den Benutzer nach Informationen fragen, u.a. Schlie"slich kann der Autor mit Metadaten charakterisieren, ob und wie er das Zielpublikum ber"ucksichtigt und welcher Mittel er sich daf"ur bedient: * Wer soll angesprochen werden durch den Text? (z.B. allgemein interessierte B"urger, Patienten, Angeh"orige, Kinder, ... ?) * Ber"ucksichtigt die pr"asentierte Information Unterschiede zwischen * den Benutzern? * Wie ist der Sprachstil: ist er wissenschaftlich, neutral, allt"aglich, emotional, instruktiv usw.? *Nutzung von Metadaten Wenn multimediale Ressourcen (in erster Linie Texte, aber auch Bilder usw.) mit Meta-Informationen versehen sind, die auch den Inhalt charakterisieren oder typisieren, dann lassen sich bestimmte Prozesse automatisieren, die bei Dokumenten, die nur als maschinell nicht interpretierbarer Text (oder entsprechend als unanalysierte Bildern) vorliegen, nur schwierig zu bewerkstelligen sind. So kann z.B. im Datenbestand festgestellt werden, ob Texte mit einer bestimmten Charakteristik vorliegen, in welchen Sprachauspr"agungen sie vorliegen, welche Aktualit"at sie haben. Wird ein Text ver"andert, so lassen sich die ihm entsprechenden parallelen Texte in den anderen Sprachen leicht identifizieren und die Inhaltsverantwortlichen k"onnen entscheiden, ob die "Anderung des einen Textes entsprechende "Anderungen in den anderen Sprachversionen nach sich ziehen mu"s oder nicht. Im Projekt CATCH wird der Ansatz verfolgt, dass die Autoren der Texte Metadaten erfassen. Sie werden dabei von einem Autorenwerkzeug unterst"utzt. Dieses wiederum bietet unter R"uckgriff auf eine Ontologie der Dom"ane und DTDs f"ur h"aufig wiederkehrende Informationseinheiten komfortabel zu bedienende Auswahlmen"us an. Wir sind der Ansicht, da"s der Nutzen f"ur die Wiederverwendbarkeit, Wartbarkeit, Anpa"sbarkeit an Benutzerbed"urfnisse usw., der sich mit verf"ugbarer Meta-Information realisieren l"a"st, den Aufwand f"ur die Bereitstellung der Meta-Information aufzuwiegen vermag. Im Vortrag wird sowohl "uber die Erfahrungen der Autoren mit diesem Ansatz wie "uber die erreichte Funktionalit"at bei der automatisierten Nutzung der Metadaten berichtet werden. *Informationen "uber CATCH Aktuelle Demonstratorversionen des Systems finden sich im Internet unter: * http://paris.cs.uni-magdeburg.de/aok/ * http://catch.infc.ulst.ac.uk/catchii/main.htm