Semantische Wissensgenerierung

Da die umfangreichen und inhaltlich vielschichtigen Textbestände der Mendelssohn-Briefausgabe und ihres Apparates allein über klassische Suchsysteme in ihrer immensen Informations-, Bedeutungs- und die Beziehungsvielfalt für den Nutzer nicht zufriedenstellend erschlossen werden können, wurden hochinnovative Verfahren des Semantic Search in das Gesamtsystem integriert. Während mit klassischen Suchverfahren bekanntes Wissen abgefragt und zur Verfügung gestellt wird, können mit Semantic Search ergänzend vordem unbekannte Informationen und Bedeutungszusammenhänge und damit neue Wissensbestände in Echtzeit identifiziert und generiert werden. Dazu dienen u.a. die folgenden Tools: 

– Die Suggest Box bietet interaktive Suchvorschläge basierend auf den Inhalten der Dokumente.
– Die Link Box zeigt zu jedem Dokument verwandte, semantisch ähnliche Dokumente an.
– Die Facets erlauben das Navigieren mittels Sucheinschränkung auf erkannte Themen (Personen, Organisationen, Orte, Zeiten, wichtige Begriffe etc.) 

Eine weitere Stärke unseres intelligenten semantischen Analyseverfahrens liegt in seinem Vermögen, historische Sprachen wie die des 19. Jahrhunderts und des ausgehenden 18. Jahrhunderts mit ihren besonderen Sprachformen, Rechtschreibungen und Grammatiken zu erkennen und durch Analyse und maschinelles Lernen adäquat für die semantische Suche aufzubereiten.

Bis jetzt wurde eine Gesamtzahl von über 64.000 historischen Wortformen des 18./19. Jahrhunderts ermittelt, die nicht mehr der modernen Rechtschreibung angehören, aber potentiell für die Schreibungen in den Briefen relevant sind – eine beeindruckend hohe Gesamtzahl, wenn man sie mit einschlägigen historischen Wörterbüchern vergleicht. Konkret bedeutet dies ca. 12.000 Adjektive, 19.000 Nomen, 33.000 Verben und 100 Funktionswörter. 

Die Analyse des Briefcorpus und das Training des intelligenten semantischen Systems bilden eine kontinuierliche, niemals vollständig abgeschlossene Grundlagenarbeit, welche die Leistungsfähigkeit der semantischen Suche parallel zum wachsenden Umfang der edierten Briefe kontinuierlich verbessert.