Künstliche Intelligenz und Küchenrezepte
Freiburg, 25.11.2020
Wer hat nicht irgendwo alte Briefe von der Oma oder handgeschriebene Tagebücher einer Großtante herumliegen? Manche hierzulande können damit allerdings nicht unbedingt etwas anfangen, weil ihre Vorfahren die Texte in Sprachen wie Russisch, Serbisch, osmanischem Türkisch oder Arabisch abgefasst haben. Hier greift das Projekt „MultiHTR“. Dahinter verbirgt sich der Begriff „Handwritten Text Recognition“ – eine Anwendung der Künstlichen Intelligenz (KI), die der Freiburger Slavistikprofessor Achim Rabus ursprünglich zur Texterkennung alter kirchenslavischer Manuskripte trainiert hat. In seinem neuen Projekt nutzt er HTR, um auch Urlaubspostkarten oder alte Küchenrezepte zu entziffern, die alle Interessierten einschicken können. Jürgen Reuß hat gefragt, was sich der Forscher davon verspricht.
Geschriebene Schätze heben: Nicht alle beherrschen die Sprache, in der ihre Großeltern Briefe verfassten. Hier will das Team um Slavist Achim Rabus Abhilfe schaffen.
Foto: Lena Lir/stock.adobe.com
Herr Rabus, eigentlich befassen Sie sich als Slavist zurzeit vor allem mit ehrwürdigen Schriften, nämlich mit in Kirchenslavisch abgefassten mittelalterlichen Manuskripten. Wie kamen Sie auf die Idee, Ihre dort erworbenen Kompetenzen auch für Alltagstexte zu nutzen?
Achim Rabus: Vermeintlich banale Alltagstexte sind für Linguistinnen und Linguisten spannende Quellen, da sie oft die tatsächlich gesprochene Sprache einer Zeit zum Vorschein bringen. Als ich eine Ausschreibung des baden-württembergischen Wissenschaftsministeriums entdeckte, die sich ausdrücklich an kleine Fächer und den Einsatz von Künstlicher Intelligenz richtete, war mir schnell klar, dass wir für die verlangten Förderkriterien hervorragend aufgestellt sind. Erstens ist die Slavistik ein vergleichsweise kleines Fach, zweitens haben wir Erfahrung mit der Anwendung von KI auf Sprache, und drittens gibt es einen noch wenig beachteten Bereich, in dem die Kombination aus unserer Fachkompetenz und KI-Kompetenz sinnvoll zum Wohl der Bevölkerung eingesetzt werden kann.
An welches Wohl denken Sie da?
Es gibt in Deutschland viele Menschen, die aus bestimmten Gründen den Kontakt zu ihrem kulturellen Erbe verloren haben. Das betrifft häufig Gruppen, bei denen es zu einem Bruch in der sprachlichen Überlieferung gekommen ist. Ein gutes Beispiel ist die Generation unserer Groß- oder Urgroßeltern. Die hat in der Schule noch Kurrent- oder Sütterlinschrift gelernt. Auf vielen Speichern liegen deshalb Briefe oder Tagebücher, die die heutige Generation nicht mehr lesen kann, obwohl sie auf Deutsch verfasst wurden. Nun lässt sich Transkribus, das von uns verwendete Programm zur Erkennung altslavischer Handschriften, auch auf andere Sprachen und Schriften wie eben die Kurrentschrift trainieren. Wer also Briefe, Rezepte oder Ähnliches zuhause liegen hat und endlich mal wissen möchte, was da steht, ist herzlich eingeladen, sich direkt über unsere Social-Media-Kanäle bei uns zu melden.
Achim Rabus fordert alle Interessierten auf, Schriftstücke einzuschicken.
Foto: Thomas Kunz
Mit Slavistik hat das aber wenig zu tun, oder?
Sehr richtig, und wir möchten uns da auch nicht mit fremden Federn schmücken. Das dahinterstehende Programm Transkribus haben nicht wir für alte deutsche Schreibschriften trainiert. Aber wir bieten diesen Service mit an, weil jedes Programm besser wird, je mehr es trainiert wird. Wir Slavistinnen und Slavisten haben vor allem die vielen Deutschen mit Wurzeln in Russland oder Ex-Jugoslawien im Blick. Die sprechen vielleicht noch ein wenig die Sprache ihrer Großeltern. Doch wenn ihre Eltern zum Beispiel aus dem serbisch-orthodoxen Teil des zerfallenen Staates Jugoslawiens stammen, können sie weder die Kochrezepte noch die Tagebücher ihrer Großeltern lesen, weil sie in Kyrillisch abgefasst sind. Auf unserer Instagram-Website finden Interessierte viele solcher Schriftbeispiele, die sie uns zum Entziffern einschicken können.
Dort sieht man auch arabische Handschriften.
Stimmt. Denn bei MultiHTR ist auch die Kollegin Prof. Dr. Johanna Pink vom Orientalischen Seminar mit an Bord. Das hat einen guten Grund, denn da, wo früher das osmanische Türkisch ganz traditionell in arabischer Schrift geschrieben wurde, hat Atatürk komplett auf das lateinische Alphabet umgestellt. Auf Schriftstücke aus der osmanischen Zeit hat jemand, der hier in der dritten Generation aufgewachsen ist, überhaupt keinen Zugriff mehr. Dafür möchten wir smarte Transkribus-Modelle entwickeln, die in der Lage sind, die Handschrift zu entziffern und gleich in das lateinische Alphabet umzuwandeln. Ein nicht triviales Zusatzproblem für das Trainieren der Erkennungs-KI ist der Umstand, dass die arabische Schrift von rechts nach links geschrieben wird.
Interessanterweise haben Sie mit Prof. Dr. Veronika Lipphardt auch eine Kollegin von den Science and Technology Studies an Bord. Warum denn das?
KI ist ja nicht diskriminierungsfrei. Vorreiter der KI sind die großen Technologiekonzerne im Silicon Valley. In diesen Unternehmen wurde aus einer bestimmten Perspektive programmiert – der von überwiegend jungen, weißen Männern mit gewissem Nerd-Potenzial. Andere Menschen sind dabei unterrepräsentiert. Meine Kollegin Veronika Lipphardt hat sich intensiv mit diskriminierenden Effekten von KI beschäftigt. Ihre Erkenntnisse sind uns bei der Texterkennung sehr wichtig. Wir wollen von vornherein Verzerrungen, Fehlentwicklungen und Diskriminierungen verhindern.
Sie setzen bei diesem Projekt auf Social Media? Warum?
Unsere HTR-KI wird besser, je mehr sie trainiert wird. Wir verstehen unser digitales Angebot deshalb auch als Crowdsourcing. Je mehr Menschen das Angebot nutzen und ihr persönliches Ergebnis korrigieren, desto besser für uns und alle folgenden Nutzerinnen und Nutzer.
Multilinguale Handschriftenerkennung (MultiHTR)