Dublettenzusammenführung in Normdateien
Was verfolgt das Projekt Dublettenzusammenführung?
Das hbz verfolgt mit diesem Projekt die Zusammenführung der regionalen Normdaten mit den überregionalen Pendants.Die Firma Geotronic unterstützt das hbz bei der Zusammenführung dubletter hbz-Normdatensätze auf überregionale Normdatensätze, indem sie die Dubletten identifiziert; die eigentliche Zusammenführung durch Umlenkungen von Normdatensätzen in der hbz-Verbunddatenbank wird durch das hbz erfolgen.
Die verbliebenen, d.h. nicht zusammenführbaren, regionalen Sätze (die sogenannte Restmenge) wurden bereits als Neuzugänge an die Deutsche Nationalbibliothek (DNB) geliefertund in die Normdateien importiert. Lediglich ein kleiner Teil im Bereich SWD wird nach Absprache mit den betroffenen Bibliotheken zum Zeitpunkt der GND-Migration gelöscht, die Ansetzungsinformation des Normdatensatzes bleibt im Titel erhalten.
Zum Abschluss des Projektes werden alle regionalen Normdatensätze aus der hbz-Verbunddatenbank entfernt.
Wie gestaltet sich der Ablauf des Projektes Dublettenzusammenführung?
Das hbz koppelt die Projekte Dublettenzusammenführung und Migration in die Gemeinsame Normdatei (GND), da diese nicht nur die Aufwände für das hbz reduzieren, sondern auch die Auswirkungen auf die Lokalsysteme minimieren: Eine Migration der regionalen Sätze von MAB2 auf MARC21 im hbz kann bei der GND-Migration entfallen, und eine Datenmigration / -manipulation in großem Umfang ist nur einmal nötig.Die ermittelten Dubletten werden in der hbz-Verbunddatenbank zunächst nur gekennzeichnet, voraussichtlich durch das jeweilige Eintragen der Identifikationsnummer in das Pendant. Die physikalische Zusammenführung der Normdaten, d.h. die Umverknüpfungen in den Titeldaten und die Löschung der Verlierersätze erfolgt erst mit der Migration zur GND.
Ab Montag, dem 25. Juli 2011 wurde der produktive Export aller Daten aus den hbz-Normdateien durchgeführt und die Daten an die Firma Geotronic gesendet. Der produktive Lauf der Ermittlung der Dubletten in den drei Normdateien durch die Firma Geotronic (außerhalb der hbz-Verbunddatenbank) erfolgte ab dem 1. August 2011.
Die nach der Ermittlung der Dubletten verbliebenen Restdaten wurden anschließend an die DNB weitergeleitet und dort als Neuzugänge geladen. Als „Anker“ enthalten sie die Identifikationsnummer ihres regionalen Pendants. Ebenso wird die Identifikationsnummer des Gewinnersatzes bzw. des Neuzugangs aus der DNB in die regionalen Sätze eingetragen.
Ein "Re-Import" der Neuzugänge in die hbz-Verbunddatenbank ist am letzten Novemberwochenende 2011 erfolgt, nachdem die DNB die Daten geliefert hat. Dabei werden sie nicht über ihr ursprüngliches regionales Pendant identifiziert, sondern dublett daneben gestellt.
Was passiert nach dem produktiven Export Ende Juli 2011 mit neuangelegten regionalen Normdatensätzen?
Die bestehenden Verbundvereinbarungen sehen vor, dass dauerhaft keine regionalen Sätze angelegt werden, sondern neue Normdatensätze immer zeitnah nach der (technisch zunächst notwendigen) Anlage als regionaler Satz über die Online-Schnittstelle Normdateien (ONS) in die jeweilige DNB-Normdatei geschickt werden.
Für die entgegen den Verbundvereinbarungen angelegten regionalen Normdatensätze, die nicht über die Online-Schnittstelle an die DNB weitergegeben werden, wird das hbz kein Migrationsszenario vorsehen (d.h. mit dem Produktionsstart der GND sind diese gelöscht). Lediglich die Ansetzungsinformationen in den Titeln bleiben erhalten (eine Bereinigung der ebenfalls noch in den Titeln vorhandenen regionalen Identifikationsnummern wird entweder im Rahmen der GND-Migration oder danach durchgeführt).
Auch nach dem Produktionsstart der GND angelegte regionale Sätze sollen nicht dauerhaft in der Verbunddatenbank verbleiben. Da das Dublettenzusammenführungsprojekt nur einmalig durchgeführt werden kann, sollen diese Sätze in regelmäßigen Abständen gelöscht werden, damit keine neuen Dubletten entstehen.
Nachbearbeitungslisten für die gelöschten stehen gebliebenen regionalen Normdatensätze (vor und nach der GND-Migration) werden nicht erstellt.
Übergangsszenario Dublettenzusammenführung
Für die Zeit zwischen der "virtuellen" Dublettenzusammenführung und der Migration in die GND hat das hbz FAQs zusammengestellt, die redaktionelle Fragen behandeln:
FAQ