Während der zweijährigen Projektlaufzeit erprobt das FDMLab Werkzeuge und Technologien auch aus dem Bereich der Künstlichen Intelligenz (KI) für den Einsatz im Archiv.
In diesem Artikel betrachten wir die Clustering Verfahren von OpenRefine im Kontext der Aufarbeitung der Indices der Prokuratoren der Akten des Reichskammergerichts.
In diesem Beitrag beschreiben wir unsere Erfahrungen bei der Textextraktion, der Deduplikation und dem Abgleich mit der GND von Indizes aus zehn Findbüchern.
In diesem Tutorial arbeiten wir mit OpenRefine und der Gemeinsamen Normdatei (GND) den Prokuratoren Index eines Findbuchs zu Akten des Reichskammergerichts auf.
In diesem ausführlichen Tutorial wandeln wir mit OpenRefine ein Findbuch zu Akten des Reichskammergerichts in ein AFIS kompatibles Importformat um. Hierbei setzen wir gezielt einfache und verständliche Techniken ein.
Im FDMLab haben wir einige analoge Findbücher digitalisiert und die Einträge automatisiert in unsere Datenbanksysteme übernommen. Dieser Blogbeitrag konzentriert sich auf die Extraktion der Informationen mit regulären Ausdrücken.
Beim Südwestdeutschen Archivtag stellt das FDMLab sich und seine Arbeitsbereiche vor. Insbesondere wird ein Einblick in die Arbeit mit Werkzeugen zur Volltexterkennung von Handschriften (HTR) und Druckschriften (OCR) gegeben.
Das FDMLab stellt sich und seine Arbeitsbereiche vor. Insbesondere wird ein Einblick in die Arbeit mit Werkzeugen zur Volltexterkennung von Handschriften (HTR) und Druckschriften (OCR) gegeben.
Viele Archive kennen diese Situation: Es gibt ein archivisches Fachinformationssystem (AFIS), über das Archivgut erschlossen und für eine Online-Recherche bereitgestellt wird. Doch gleichzeitig existiert zu einigen Beständen auch noch eine Reihe älterer gedruckter Findbücher im Lesesaal.