Digitalisierung

Konferenz "Offene Archive" 2022

Produkte und Ergebnisse Künstlicher Intelligenz werden von uns bewusst oder unbewusst täglich konsumiert – ob bei der Benutzung von Suchmaschinen und Navigationssystemen oder dem Wetterbericht und der allgegenwärtigen Werbung. Das …

Verborgene Datenschätze heben: Das FDMLab experimentiert mit KI im Archiv

Während der zweijährigen Projektlaufzeit erprobt das FDMLab Werkzeuge und Technologien auch aus dem Bereich der Künstlichen Intelligenz (KI) für den Einsatz im Archiv.

Clustering von Namen mit OpenRefine

In diesem Artikel betrachten wir die Clustering Verfahren von OpenRefine im Kontext der Aufarbeitung der Indices der Prokuratoren der Akten des Reichskammergerichts.

Erfahrungsbericht - Extraktion und Abgleich von Prokuratoren mit OpenRefine

In diesem Beitrag beschreiben wir unsere Erfahrungen bei der Textextraktion, der Deduplikation und dem Abgleich mit der GND von Indizes aus zehn Findbüchern.

Findbuchdaten mit OpenRefine wiederverwenden

In diesem Artikel behandeln wir die Frage, wie wir schon aufbereitete Daten mit OpenRefine wiederverwenden können.

Named Entity Recognition mit OpenRefine und spaCy

In diesem Artikel beschreiben wir unsere Versuche mit OpenRefine ein “Named Entity Recognition” mit spaCy durchzuführen, um die Entities anschließend mit der Gemeinsamen Normdatei (GND) abzugleichen.

Findbuch Index mit OpenRefine aufbereiten

In diesem Tutorial arbeiten wir mit OpenRefine und der Gemeinsamen Normdatei (GND) den Prokuratoren Index eines Findbuchs zu Akten des Reichskammergerichts auf.

Findbücher mit OpenRefine in Datenbank übernehmen

In diesem ausführlichen Tutorial wandeln wir mit OpenRefine ein Findbuch zu Akten des Reichskammergerichts in ein AFIS kompatibles Importformat um. Hierbei setzen wir gezielt einfache und verständliche Techniken ein.

Einträge analoger Findbüchern automatisiert in Datenbanken übernehmen - Reguläre Ausdrücke

Im FDMLab haben wir einige analoge Findbücher digitalisiert und die Einträge automatisiert in unsere Datenbanksysteme übernommen. Dieser Blogbeitrag konzentriert sich auf die Extraktion der Informationen mit regulären Ausdrücken.

80. Südwestdeutscher Archivtag 2021

Beim Südwestdeutschen Archivtag stellt das FDMLab sich und seine Arbeitsbereiche vor. Insbesondere wird ein Einblick in die Arbeit mit Werkzeugen zur Volltexterkennung von Handschriften (HTR) und Druckschriften (OCR) gegeben.