Python

Warum wir Jupyter lieben

Beim Einsatz von Jupyter Notebooks gibt es einiges an Konfliktpotential zum Beispiel zwischen traditionellen Softwareentwicklern und experimentierenden Wissenschaftlern. In der binären Welt von “hate it or love it” schlagen wir uns auf die Seite von “love it”.

Findbuch Daten mit OpenRefine wiederverwenden

In diesem Artikel behandeln wir die Frage, wie wir schon aufbereitete Daten mit OpenRefine wiederverwenden können.

Weshalb wir Python nutzen

Wir nutzen eine inzwischen 30 Jahre alte Programmiersprache und werden hin und wieder mit der Frage konfrontiert: Weshalb Python? Daher gibt es hier eine Liste von Alternativen und unsere Gründe bei Python zu bleiben.

Named Entity Recognition mit OpenRefine und spaCy

In diesem Artikel beschreiben wir unsere Versuche mit OpenRefine ein “Named Entity Recognition” mit spaCy durchzuführen, um die Entities anschließend mit der Gemeinsamen Normdatei (GND) abzugleichen.

Ist NER robust gegenüber OCR Fehlern?

Wir haben schon mehrfach die Behauptung gehört, dass Named Entity Recognition (NER) robust gegenüber OCR Fehlern ist. Daher werden wir in diesem Beitrag die Named Entity Recognition anhand einiger Beispiele genauer betrachten.

Einträge analoger Findbüchern automatisiert in Datenbanken übernehmen - Reguläre Ausdrücke

Im FDMLab haben wir einige analoge Findbücher digitalisiert und die Einträge automatisiert in unsere Datenbanksysteme übernommen. Dieser Blogbeitrag konzentriert sich auf die Extraktion der Informationen mit regulären Ausdrücken.

Wie wir Docker einsetzen

Programme haben Anforderungen an ihre Umgebung. Dies kann ein bestimmtes Betriebssystem sein (Windows, Linux, macOS), eine Laufzeitumgebung für eine Programmiersprache (Python, Java, C#), oder die Verfügbarkeit bestimmter Bibliotheken (GTK, .NET, Qt). Wir wollen uns beim Testen und Evaluieren aber nicht einschränken!