Transkribus erkennt Uromas Handschrift
Transkribus digitalisiert historische Dokumente, die sich nur noch schwer lesen lassen. Je mehr Text die Software auswertet, desto besser das Ergebnis. Jeder kann das Tool nutzen – auch Laien, die Uromas Briefe entziffern wollen.
Transkribus digitalisiert historische Dokumente, die sich nur noch schwer lesen lassen. Je mehr Text die Software auswertet, desto besser das Ergebnis. Jeder kann das Tool nutzen – auch Laien, die Uromas Briefe entziffern wollen.
Historische Dokumente sind oftmals schwer zu lesen – schon Uromas Tagebuch bereitet heutigen Lesern einige Schwierigkeiten. Hier will die Software Transkribus helfen: Die Software erkennt alte handschriftliche Aufzeichnungen und wandelt sie in digitalen Text um, der sich viel einfacher lesen lässt. Egal ob mittelalterliche Texte oder Notizen aus dem zwanzigsten Jahrhundert – Transkribus verspricht eine Handschriftenerkennung, die immer besser wird. Gedacht ist die Software für Wissenschaftler, Archivare, aber auch für Laien.
Die Software nutzt Algorithmen, die die TU Valencia und das Nationale Forschungszentrum in Athen erarbeitet haben. Es ist allerdings ausreichend Material nötig, um einen Text zu entziffern: "Der Brief vom Großvater kann noch nicht auf Knopfdruck transkribiert werden", erklärte Projektleiter Günter Mühlberger von der Universität Innsbruck gegenüber der Deutschen Presse-Agentur. Das Programm sei in der Lage, eine Handschrift nach rund 100 Seiten (rund 20.000 Wörter) gut zu lesen. Je mehr Texte die HTR-Engine zum Entziffern bekommt, desto besser ist das Ergebnis.
Transkribus entziffert eine "Magdalena".
Mit dem "Keyword Spotting" lasse sich in den Schriften gezielt nach Stichworten suchen, so Mühlberger. Als Export-Formate für den erkannten Text gibt es PDF, RTF, TEI und XML. Derzeit steht das Projekt vor zwei großen Herausforderungen: Zum einen benötigt die Software noch zu viele Daten, um Schrift in leicht lesbaren Text umzuwandweln. Zum anderen fehlt ein Netzwerk, um die vielen unterschiedlichen Schriften zusammenzuführen.
Mit dem "Keyword Spotting" lasse sich in den Schriften gezielt nach Stichworten suchen, so Mühlberger. Als Export-Formate für den erkannten Text gibt es PDF, RTF, TEI und XML. Derzeit steht das Projekt vor zwei großen Herausforderungen: Zum einen benötigt die Software noch zu viele Daten, um Schrift in leicht lesbaren Text umzuwandweln. Zum anderen fehlt ein Netzwerk, um die vielen unterschiedlichen Schriften zusammenzuführen.
EU fördert Transkribus
Transkribus startete 2016 als EU-Projekt, dessen Ziel es ist, die Software einer breiten Öffentlichkeit zugänglich zu machen. Mehr als 10.000 Nutzer aus aller Welt haben sich bislang registriert – und es dürfen gern mehr werden: "Je mehr Benutzer, je mehr Daten, desto besser können die Maschinen lernen", meint Mühlberger. An der Plattform sind 13 Partner aus Europa beteiligt; die Universität Innsbruck koordiniert. Noch bis Mitte 2019 fördert die EU das Projekt mit insgesamt 8,2 Millionen Euro. Mühlberger hofft, dass Transkribus die Öffentlichkeit und Wissenschaftler aber dauerhaft miteinander vernetzen kann.
Transkribus startete 2016 als EU-Projekt, dessen Ziel es ist, die Software einer breiten Öffentlichkeit zugänglich zu machen. Mehr als 10.000 Nutzer aus aller Welt haben sich bislang registriert – und es dürfen gern mehr werden: "Je mehr Benutzer, je mehr Daten, desto besser können die Maschinen lernen", meint Mühlberger. An der Plattform sind 13 Partner aus Europa beteiligt; die Universität Innsbruck koordiniert. Noch bis Mitte 2019 fördert die EU das Projekt mit insgesamt 8,2 Millionen Euro. Mühlberger hofft, dass Transkribus die Öffentlichkeit und Wissenschaftler aber dauerhaft miteinander vernetzen kann.
Transkribus Version 1.4 gibt es für Windows und macOS. Vor dem Download ist eine kostenlose Registrierung nötig. Eine Kurzanleitung (PDF) erklärt, wie Transkribus in zehn Schritten "oder weniger" funktioniert.
Text und Bild: heise.de