Digitalisierung

Clustering von Namen mit OpenRefine

In diesem Artikel betrachten wir die Clustering Verfahren von OpenRefine im Kontext der Aufarbeitung der Indices der Prokuratoren der Akten des Reichskammergerichts.

Erfahrungsbericht - Extraktion und Abgleich von Prokuratoren mit OpenRefine

In diesem Beitrag beschreiben wir unsere Erfahrungen bei der Textextraktion, der Deduplikation und dem Abgleich mit der GND von Indizes aus zehn Findbüchern.

Findbuch Daten mit OpenRefine wiederverwenden

In diesem Artikel behandeln wir die Frage, wie wir schon aufbereitete Daten mit OpenRefine wiederverwenden können.

Named Entity Recognition mit OpenRefine und spaCy

In diesem Artikel beschreiben wir unsere Versuche mit OpenRefine ein “Named Entity Recognition” mit spaCy durchzuführen, um die Entities anschließend mit der Gemeinsamen Normdatei (GND) abzugleichen.

Findbuch Index mit OpenRefine aufbereiten

In diesem Tutorial arbeiten wir mit OpenRefine und der Gemeinsamen Normdatei (GND) den Prokuratoren Index eines Findbuchs zu Akten des Reichskammergerichts auf.

Findbücher mit OpenRefine in Datenbank übernehmen

In diesem ausführlichen Tutorial wandeln wir mit OpenRefine ein Findbuch zu Akten des Reichskammergerichts in ein AFIS kompatibles Importformat um. Hierbei setzen wir gezielt einfache und verständliche Techniken ein.

Einträge analoger Findbüchern automatisiert in Datenbanken übernehmen - Reguläre Ausdrücke

Im FDMLab haben wir einige analoge Findbücher digitalisiert und die Einträge automatisiert in unsere Datenbanksysteme übernommen. Dieser Blogbeitrag konzentriert sich auf die Extraktion der Informationen mit regulären Ausdrücken.

80. Südwestdeutscher Archivtag 2021

Beim Südwestdeutschen Archivtag stellt das FDMLab sich und seine Arbeitsbereiche vor. Insbesondere wird ein Einblick in die Arbeit mit Werkzeugen zur Volltexterkennung von Handschriften (HTR) und Druckschriften (OCR) gegeben.

Wie wir gedruckte Findbücher in unsere Datenbank bekommen, ohne zu viel Zeit in manuelle Arbeiten zu investieren

Viele Archive kennen diese Situation: Es gibt ein archivisches Fachinformationssystem (AFIS), über das Archivgut erschlossen und für eine Online-Recherche bereitgestellt wird. Doch gleichzeitig existiert zu einigen Beständen auch noch eine Reihe älterer gedruckter Findbücher im Lesesaal.

2. Workshop des OCR-BW-Projektes 2021

Bei diesem Workshop stellt das FDMLab sich und seine Arbeitsbereiche vor. Insbesondere wird auf das Thema Qualitätskontrolle eingegangen und ein Einblick in die Digitalisierung von Findbüchern gegeben.