ZfdA 130 (2001), S. 493-495

Mittelalter-Philologie im Internet

7. Beitrag: Die Mittelhochdeutsche Begriffsdatenbank

von Horst P. Pütz und Klaus M. Schmidt

1. Allgemeines

Die 'Mittelhochdeutsche Begriffsdatenbank' (MHDBDB) als ein Bedeutungswörterbuch zur mittelhochdeutschen Literatur wurde vor nunmehr ca. 30 Jahren von KLAUS M. SCHMIDT (Bowling Green State University, Ohio) entwickelt. 1992 begann die Zusammenarbeit mit HORST P. PÜTZ, der 1995 mehr als 100 Texte der mhd. Literatur in die Datenbank integrierte. Auf der Mediävistenkonferenz in Kalamazoo, Michigan, wurde MHDBDB im Mai 1995 als menü-gesteuerte und in ihren Nutzungsmöglichkeiten noch limitierte Datenbank online geschaltet. Seit Herbst 1998 steht MHDBDB als Web-gesteuerte Datenbank mit einer modernen Benutzeroberfläche und mit allen erdenklichen Suchmöglichkeiten online zur Verfügung (http://mhdbdb.bgsu.edu). Jeder Interessierte kann sich selbständig einen Zugang schaffen und sein eigenes Password eintragen.

2. Textbearbeitung und Nutzungsmöglichkeiten
2.1 Textbearbeitung

Die mhd. Texte werden bei der Integration in die Datenbank auf Wortformen überprüft, die zuvor noch nicht lemmatisiert und nicht mit Bedeutungskategorien verbunden wurden. Der Bearbeiter des Textes erhält auf diese Weise nacheinander die der Datenbank bisher nicht bekannten Wortformen zur Bearbeitung vorgelegt, die er in einem ersten Bearbeitungsschritt einem Lemma zuweisen muß. Wenn das Lemma der Datenbank bereits bekannt ist, dann sind diesem gewöhnlich bereits eine oder mehrere grammatische Kategorien sowie eine oder mehrere Bedeutungskategorien zugeordnet, und der Bearbeiter braucht lediglich noch zu überprüfen, ob diese vorhandenen Beschreibungen ausreichen oder ergänzt werden müssen. Wenn das Lemma jedoch neu ist, muß der Bearbeiter aus einer Liste die grammatische Kategorie zuweisen und ferner auch alle - gemäß LEXER - möglichen Bedeutungskategorien; für diesen letzteren Schritt ist im Laufe der Jahre ein umfangreicher, sehr differenzierter Katalog von Begriffskategorien/Bedeutungskonzepten entwickelt worden. In einem gewöhnlich späteren zweiten Arbeitsgang muß dann aus den grundsätzlich möglichen Bedeutungen für jede explizite Textstelle die jeweils spezifisch zutreffende Bedeutung ausgewählt werden.
Mit der Beschreibung jeder einzelnen Wortform in einem Einzeltext werden zugleich alle identischen Wortformen in allen anderen Datenbank-Texten beschrieben. Im Grunde wird also nicht nur an einem Einzeltext gearbeitet, sondern an der ganzen Textbasis; nur bei der Bedeutungsanalyse des Einzeltextes - der Auswahl aus den möglichen Bedeutungen einer Wortform - wird allein der jeweils aktuelle Text bearbeitet.

2.2 Nutzungsmöglichkeiten

Als Grundlage für das Verständnis ist in Erinnerung zu behalten, daß sich die Daten der Datenbank in verschiedenen Bearbeitungszuständen befinden. Dem System sind natürlich alle Wortformen der integrierten Texte bekannt; im Rahmen des Textanalyse-Moduls der Datenbank kann daher jede beliebige Wortform - auch gekürzt mit dem Platzhalter "*" - in einem einzelnen, in einigen (z.B. nach 'Gattungen' oder einem Autor) ausgewählten oder auch in allen Texten gesucht werden (den Kontextumfang kann der Benutzer ebenfalls einstellen). Wenn die gesuchte Wortform bereits lemmatisiert ist, werden sämtliche mit dem Lemma konnotierten Wortformen der gewählten Texte aufgelistet; ist die Wortform noch nicht lemmatisiert, wird nur das Vorkommen dieser Wortform in den ausgewählten Texten angezeigt. Die Ergebnisliste aus dem Suchlauf zeigt Frequenzangaben, die farbig unterlegt sind. Durch Klicken auf einer Frequenzangabe werden die entsprechenden Belegstellen in dem vorher eingestellten Kontextumfang gezeigt. MHDBDB ist damit ein modernes Hilfsmittel, das mit großer Effizienz sowohl in der Forschung als auch in der Lehre eingesetzt werden kann.
Da es sich um eine Begriffsdatenbank handelt, kann man sich statt einer Wortform oder eines Lemmas z.B. auch den gesamten Wortschatz zeigen lassen, der zu einem bestimmten Bedeutungskonzept oder zu einer Verknüpfung von Bedeutungskonzepten gehört; es ist eine beliebige Such-Kombination von Zeichenketten, Wortformen, Lemmata, Wortarten und Bedeutungskategorien in dem vom Benutzer eingestellten Kontextrahmen möglich; die verschiedenen Suchmethoden werden in einem Hilfe-Menu ausführlich beschrieben.

Neben dem Analyse-Modul kann auch das Wörterbuch der Datenbank eingesehen werden. Das kann u.a. eine praktische Hilfe für Anfänger in der Beschäftigung mit dem Mhd. sein. Wenn z.B. im Wörterbuch-Modul die Wortform sander gesucht wird, erhält der Benutzer die Information, daß es sich hierbei um eine Verbindung von er und senden handelt, und zu senden werden auch die damit verbundenen Bedeutungskategorien aufgelistet.

3. Bisherige Nutzung und weitere Entwicklung

Es versteht sich aus dem Voraufgegangenen, daß die 'Mittelhochdeutsche Begriffsdatenbank' eine ständige Baustelle darstellt, die sich fortlaufend verändert. Als größerer Text wird z.Zt. im Rahmen eines speziellen Projekts der 'Jüngere Titurel' bearbeitet. Demnächst soll der 'Prosa-Lancelot' zur Verfügung gestellt werden, dann 'Diu Crône' und die Gedichte aus "Minnesangs Frühling" - sobald die nötige Zeit gefunden wird, diese Texte für die Bearbeitung und Benutzung aufzubereiten.
Das Wörterbuch enthält derzeit etwa 13'500 Lemmata, denen ca. 42'000 Varianten und 21'000 Bedeutungen zugeordnet sind. Bisher haben sich mehr als 1300 Benutzer eingetragen; seit Einrichtung eines automatischen Zählsystems im Januar 2000 gab es über 10'000 Zugriffe.

Wir sind interessiert daran, die Datenbank - wenn möglich - noch benutzerfreundlicher zu machen, als sie derzeit schon ist. Kommentare, Anregungen, Verbesserungsvorschläge sind daher jederzeit sehr willkommen:

Dr. Horst P. Pütz, Germanistisches Seminar der Christian-Albrechts-Universität zu Kiel, Leibnizstr. 8, D-24098 Kiel
E-Mail: puetz@germsem.uni-kiel.de

Prof. Dr. Klaus M. Schmidt, 2260 Rivenoak Court, Ann Arbor, Michigan 48103
E-Mail: schmidt@bgnet.bgsu.edu
016078