Wie im Märchen „Aschenputtel“ geht es bei solchen automatischen Klassifikationen darum, die Guten ins Töpfchen und die Schlechten ins Kröpfchen zu sortieren. „Am Markt verfügbare Softwarelösungen bieten derzeit aber im Schnitt Erkennungsraten von oft noch unter 80 Prozent“, sagt Daniel Claeser, der an der Universität Bonn Kommunikationsforschung und Phonetik mit dem Schwerpunkt Computerlinguistik studiert hat. In seiner Magisterarbeit zur automatischen Kategorisierung von deutschsprachigen Nachrichtentexten entwickelte er mit einem Unternehmen eine Filtersoftware, die Kinder und Jugendliche vor verstörenden Inhalten schützen soll.
Steigerung der Trefferrate auf mehr als 90 Prozent
Arbeitet ein Computerprogramm nur mit Stichworten, können die Bedeutungen von Sätzen, die etwa den mehrdeutigen Begriff „Zug“ enthalten, nicht unterschieden werden. „Hier greift nun die semantische Analyse ein. Mithilfe dieser können die Phrasen ‚Nun kommt Mehdorn zum Zug‘ – ‚Weiß ist am Zug‘ – ‚Das ist ein netter Zug von ihr‘ korrekt auf ihren Inhalt untersucht werden“, berichtet Claeser. Er hat in seiner Magisterarbeit verschiedene Software getestet und weiterentwickelt. In wenigen Wochen konnte er erreichen, dass die Texte mit einer Trefferrate von deutlich mehr als 90 Prozent der richtigen Kategorie zugeordnet wurden.
Vom Internetfilter bis zum Beschwerdemanagement
Das während seiner Magisterarbeit an der Universität Bonn gesammelte Wissen nutzt Daniel Claeser nun, um mit seinem Bruder Robert Claeser ein Unternehmen zu gründen. Für ihre Kunden wollen beide maßgeschneiderte Software bereitstellen, mit der jeweils die gewünschten Klassifikationen optimal durchgeführt werden können. Mögliche Anwendungen sind etwa Internet- oder E-Mail-Spam-Filter. „Denkbar sind jedoch auch Lösungen für das Beschwerdemanagement von Firmen“, berichtet Robert Claeser, der an der RWTH Aachen Elektro- und Informationstechnik studiert. Beschwerde-Mails ließen sich dann mit der Kategorisierungssoftware vorsortieren und somit gezielter weiterbearbeiten.
56.000 Euro Förderung aus dem EXIST-Programm
Die beiden angehenden Unternehmer werden nun vom Bundeswirtschaftsministerium mit einem EXIST-Gründerstipendium gefördert. Sie erhalten insgesamt 56.000 Euro, um die Marktreife ihres Klassifikationssystems vorzubereiten. „Solche Klassifikations-Software hat gute Chancen am Markt, weil sie vielseitig einsetzbar ist“, sagt Prof. Dr. Ulrich Schade vom Fraunhofer-Institut für Kommunikation, Informationsverarbeitung und Ergonomie (FKIE), der Daniel Claesers Magisterarbeit an der Universität Bonn betreute. Rüdiger Mull, Leiter der Abteilung Erkenntnistransfer und Schutzrechte der Universität Bonn, hat die Gründer beraten und sie bei der Antragstellung unterstützt. „Das Besondere ist die kluge Kombination von Sprachwissenschaft und IT“, sagt Mull.
Kontakt:
Daniel Claeser
Absolvent der Universität Bonn
Tel. 01578/5588294
claeser@uni-bonn.de
Rüdiger Mull
Abteilung 7.2 – Erkenntnistransfer und Schutzrechte
Universität Bonn
Tel. 0228/732210
mull@verwaltung.uni-bonn.de