OpenRefin
Wir beschäftigen uns im zweiten Teil des Themas Metadaten modellieren und Schnittstellen nutzen mit der Software OpenRefine. OpenRefine dient zur Analyse, Bereinigung, Konvertierung und Anreicherung von Daten und sieht dabei aus wie eine gewöhnliche Tabellenverarbeitungssoftware. Sie ist ebenfalls Freeware und wird in verschiedenen Branchen eingesetzt, vor allem aber in Bibliotheken. OpenRefine eignet sich am besten für einfache tabellarische Daten, kann aber auch für einfache XML-Daten verwendet werden. Für die Transformation und Analyse von MARC21 ist MarcEdit als Ergänzung nötig. Da frage ich mich, warum das Tool dennoch in Bibliotheken anscheinend so beliebt ist? Ich weiss zwar nicht, wie lange MARC21 bzw. seine Vorgänger schon in Gebrauch sind in Bibliotheken, aber es müssen doch schon einige Jahre, wenn nicht Jahrzehnte sein. Gibt es dann wirklich keine bessere Software, bei der nicht auf ein Zusatztool zurückgegriffen werden muss?

Die Installation verlief wieder problemlos. Der erste Blick in die Software war dagegen schon etwas überwältigend. Es macht den Eindruck enorm viele Funktionen zu haben und man muss wissen, was man tut, um damit klar zu kommen. Die Einführung in die Grundfunktionen war daher sehr willkommen und beim Mitmachen bekam ich auch ein Gefühl für die Software. Mit den Facetten zu arbeiten geht bald leicht von der Hand, zumal diese Funktion auch nicht ganz unbekannt ist. Ich war überrascht wie einfach es dann doch ist, einfach Angleichungen vorzunehmen mit Funktionen, die an Suchen & Ersetzen aus MS Word erinnern. Schliesslich hatte ich richtig Spass daran. Bei der Vorführung bzw. beim Nachmachen der Demonstration zu Reconciliation hatte ich dann doch Mühe. Die Geschichte mit den Links zur Website der Journals hat zwar irgendwie funktioniert, allerdings sah es nicht so aus, wie in der Demonstration. Da es die gleichen Daten waren und diese soweit bekannt auch nicht verändert wurden, hätte es auch nicht daran liegen können, dass ich mir die Aufnahme einige Tage später angesehen habe.

Auch bei der nächsten Übung CSV nach MARCXML musste ich genau auf die Aufzeichnung achten, um mitzukommen. Das Reverse Engineering war dabei noch nicht das Problem, schliesslich arbeite ich schon seit einigen Jahren mit MARC21 basierten Bibliothekssystemen und bin sehr vertraut mit den Feldern. Dadurch weiss ich, wie die Daten in den Feldern schlussendlich aussehen müssen und konnte die Bedeutung der Codes relativ einfach ableiten. Natürlich war auch das Vorwissen in den Programmiersprachen Python und JavaScript hilfreich, da beispielsweise die Funktion mit der Schleife für Autoren im Feld 700 sehr ähnlich war. Die Aufgabe 2, in der das Template ergänzt werden sollte, hätte ich ohne die Vorführung nicht hinbekommen. Ich glaube es zu verstehen, aber ich hätte es nicht selbst schreiben können. Zum Schluss haben wir nun das Ergebnis exportiert und mithilfe des Programms xmllint validiert, in dem unser Ergebnis gegen das offizielle Schema abgeglichen wurde. Erwartungsgemäss, weil ich ja strikt den Anweisungen in der Aufzeichnung gefolgt bin, hat der Abgleich das gewünschte Ergebnis hervorgebracht.

Ich fand OpenRefine eine sehr spannende Software. Sie scheint echt einiges auf dem Kasten zu haben. Ich frage mich ausserdem, ob OpenRefine auch im Projekt SLSP hätte verwendet werden können oder es vielleicht sogar wurde. Schliesslich mussten dort die Metadaten aus diversen Bibliotheken schweizweit vereinheitlicht und zusammengeführt werden. Die Metadaten waren aber alle im MARC21 formatiert. Durch die Brücke über MarcEdit war es dann vielleicht doch nicht so lohnenswert. Bei Gelegenheit werde bei meinen Arbeitskollegen, die in diese Arbeit involviert waren, mal nachfragen.