„Unser psychologiespezifisches Infrastrukturangebot orientiert sich konsequent am Forschungszyklus“

Forschungsdatenzentren stellen sich vor (9): leibniz-psychology.org – Das Public-Open-Science-Institut für die Psychologie

INTERVIEW mit Roland Ramthun, dem Leiter der Archivierungs- und Veröffentlichungsdienste des Leibniz-Zentrums für Psychologische Information und Dokumentation, kurz ZPID. Das ZPID startete 1971 zunächst als klassische Dokumentations- und Informationseinrichtung, die Literaturnachweise für Wissenschaftlerinnen vermittelte. Danach dokumentierte es selbst psychologische Fachliteratur und machte diese über die Datenbank Psyndex öffentlich zugänglich. Um die Jahrtausendwende startete das ZPID mit dem Aufbau eines Forschungsdatenarchivs, dokumentierte und archivierte also Primärdaten ausgewählter psychologischer Forschungsprojekte und Daten zur Entwicklung psychologischer Testverfahren. Seit 2017 ist die überregionale Informationsinfrastruktur für Psychologie verstärkt dem Gedanken der Open Science verpflichtet und richtet die Angebote an einem idealtypischen Forschungszyklus aus.

Herr Ramthun, das ZPID hat in den letzten Jahren einen neuen Weg beschritten und sich konsequent in Richtung Open Science entwickelt. Wie kam es dazu?

Im Grunde haben wir schon 2003 mit der Berliner Open Access Erklärung über den Zugang zu wissenschaftlichem Wissen angefangen, erste Angebote entgeltfrei zur Verfügung zu stellen. Nachdem uns dann bei der Evaluation durch die Leibniz-Gemeinschaft 2011 empfohlen wurde, unsere Fachliteraturdatenbank Psyndex der Scientific Community kostenlos zur Verfügung zu stellen, haben wir diese Bemühungen verstärkt und uns durch unser Planungs- und Umsetzungskonzept ZPID2025 aus dem Jahr 2017 konsequent als Public-Open-Science-Institut ausgerichtet – weil wir überzeugt sind, dass Open Science die Zukunft des wissenschaftlichen Arbeitens ist. Man muss dazu sagen, dass das auch nichts völlig Neues ist, denn die Praktiken sind mit aus der klassischen Wissenschaftstheorie und Wissenschaftspolitik heraus motiviert.

„Wir gehen mit unserem Angebot heute von einem Forschungszyklus aus und versuchen ein psychologiespezifisches Angebot für jeden dieser Zyklus-Schritte herzustellen.“

Allerdings kann man zumindest Psyndex nach wie vor auch kostenpflichtig abonnieren, und zwar über Datenbank-Hosts wie EBSCO und Ovid, die ein eigenes Produkt mit Datenbeständen mehrerer Anbieter aus verschiedenen Ländern an Bibliotheken verkaufen. Die bekommen den Datenbestand komplett als Datei angeliefert und integrieren ihn dann in einen internationalen Gesamtkatalog. Der Vorteil für die Nutzerinnen und Nutzer liegt darin, nur noch in einem System und nicht mehr in dutzenden verschiedenen recherchieren zu müssen.

Zentrum Ihres Angebots ist das Suchportal Pubpsych, von dem aus alles andere erreichbar ist?

Fast alles, ja! (lacht) Seit ein paar Jahren sind Psyndex und auch unsere anderen Datenbanken vollumfänglich und kostenfrei über unser Suchportal Pubpsych öffentlich zugänglich. Wir arbeiten jetzt an dem Nachfolgesystem PsychPorta, einer semantischen Suchmaschine, die es stichwortunabhängig erlaubt, Bezüge zwischen Literatur, Autoren, Netzwerken und Themen gut zu recherchieren, sodass man sicher sein kann, einem bestimmten Themenbereich auf den Grund gegangen zu sein – ganz unabhängig vom verwendeten Suchbegriff.

Wie würden Sie Ihren Bestand an Forschungsdaten beschreiben?

Wir setzen keine inhaltlichen Schwerpunkte, sondern versuchen die ganze Bandbreite der Psychologie abzudecken. Das gilt auch für den Datenbestand, der komplett über die zentrale Plattform PubPsych durchsuchbar ist. Die Forschungsdaten selbst liegen in unserem nach Kollektionen systematisiertem Archivierungsprodukt PsychArchives, also eine Kollektion Forschungsdaten, eine Kollektion Zeitschriftenbeiträge, eine Kollektion psychologische Testverfahren und so weiter. In Form sogenannter „bundles“ haben wir in der Regel psychologische Primärdaten zuzüglich der Codebücher und zugehöriger Literatur und Manuskripte zusammengestellt. Da erhobene Daten auch mit Codebuch noch schwer verständlich sein können, ist es praktisch zum Beispiel in einer Auswertung der Originalautoren nachzulesen, wie sie eigentlich vorgegangen sind. Einen Einstieg bietet die Kollektion „Research Data“ in PsychArchives.

Auf einen Blick: leibniz-psychology.org

Datenbestand

160 Datensätze zur gesamten Bandbreite der Psychologie inklusive der dazu gehörenden Forschungsdaten und Codebücher

Sammelschwerpunkt

Klinische Psychologie, Entwicklungspsychologie, Pädagogische Psychologie, A&O-Psychologie, Kognitionspsychologie, Sozialpsychologie, Persönlichkeitspsychologie

Service

Sowohl bei Datenabgabe als auch bei Datennutzung setzt das ZPID auf stark standardisierte Verfahren. Vierstufiges Zugangsmodell. Kuratierung von psychologiespezifischen Handreichungen zu best-practices im Forschungsdatenmanagement.

Wer nutzt die Daten

Forschende im Bereich Psychologie und angrenzender Fachbereiche, auch Bachelor- und Masterstudierende.

Wie groß ist Ihr Datenbestand?

Wir haben im Moment insgesamt 160 unterschiedlich umfangreiche Datensätze, die über einen sehr langen Zeitraum eingegangen sind. In den letzten zehn Jahren haben wir mit einem klassischen, auf sorgfältiger Auswahl und Aufbereitung beruhenden Ansatz ungefähr 60 Datensätze gesammelt. Das war für alle Beteiligten ein beträchtlicher Aufwand, der sich in langen Bearbeitungszeiten niederschlug, weshalb wir jetzt mit dem breiten Wechsel hin zu Open Science-Praktiken einen niedrigschwelligeren standardisierten Ansatz verfolgen; innerhalb der letzten zwei Jahre sind so schon hundert neue Datensätze dazugekommen! Zurzeit gehen bei uns pro Woche in der Regel drei bis vier neue ein. Der wachsende Datenbestand wird die Attraktivität des Gesamtangebots nochmal steigern.

Wie ist der Zugang zu Ihrem Bestand geregelt? Handelt es sich bei allen Angeboten um Open Data?

Wir haben ein vierstufiges Zugangsmodell: Bei Stufe Null können Sie die Daten ohne jede Registrierung herunterladen – das greift bei rund 100 der insgesamt 160 Datensätze. Bei Stufe 1, dem Scientific Use, dürfen Sie die Daten nur für wissenschaftliche Zwecke verwenden und bei Stufe 2 wird der Scientific Use noch über eine Individualvereinbarung eingeschränkt, weil diese Datenbestände unter Umständen besonders schützenswerte Daten beinhalten. Diesen beiden Stufen unterliegen die restlichen 60 Datensätze. Perspektivisch streben wir noch – wie es beispielsweise bei GESIS schon praktiziert wird – den sogenannten „Secure Use“ für extrem sensible Daten an, die unser Haus nicht verlassen dürfen. Um mit diesen Daten arbeiten zu können, wird man dann entweder vor Ort unser Secure Data Center besuchen müssen oder uns beauftragen, die Daten zu verarbeiten

Haben Sie auch Daten mit konkretem Bezug zur Bildungsforschung?

Was Forschungsinstrumente betrifft, ist für Bildungswissenschaftlerinnen wahrscheinlich unser offenes Testarchiv mit einem Bestand von 200 kostenfreien und gut durchsuchbaren Verfahren besonders interessant. Bei den Forschungsdaten denke ich, dass die Datensätze zu epistemologischen Überzeugungen im Lehr- und Lernkontext neugierig machen könnten. Einen anderen guten Anknüpfungspunkt bieten die Forschungsdaten der „Münchner Longitudinalstudie zur Genese individueller Kompetenzen“, besser bekannt auch als „LOGIK Studie“ – eine groß angelegte Studie, deren Aufbereitung sehr aufwändig war und die für die Bildungsforschung hochrelevant ist. Dann haben wir noch Datenbestände im Bereich Arbeits- und Organisationspsychologie zu beruflich bedingten Belastungen bei Lehrkräften, die häufiger abgerufen werden, und auch die Datenbestände aus der Persönlichkeitspsychologie können – abhängig von der individuellen Fragestellung natürlich – sehr interessant sein. Für ein historisch-vergleichendes Forschungsprojekt kann ich die Berliner Längsschnittstudie zu Jugend, Entwicklung und Drogen von 1982 bis 1988 empfehlen.

„Insgesamt kommen ungefähr 20 Prozent unseres Bestands für eine Sekundärnutzung durch die Bildungswissenschaften in Frage.“

Wie reagieren die Forschenden auf die Möglichkeit, ihre Forschungsdaten beim ZPID abzugeben?

Wissenschaftler schauen meist nach Empfehlungen und Standards der jeweiligen Fachgesellschaften. Deshalb ist die Datenmanagement-Empfehlung der Deutschen Gesellschaft für Psychologie (DGPs) auch so wichtig. Erst vor wenigen Wochen wurde dem DGPs-Vorstand eine revidierte Fassung vorgelegt, die im August veröffentlicht wird. Wir als ZPID bemühen uns, als Komplement Angebote zu entwickeln und bereitzustellen, damit die Wissenschaftlerinnen die Empfehlungen auch umsetzen können; dabei empfehlen wir, Daten am besten schon forschungsbegleitend zu dokumentieren. Dafür haben wir zum Beispiel das webbasierte Werkzeug DataWiz entwickelt. Beratung können wir nur in Ausnahmefällen leisten, wenn die Erhebungen so von der Norm abweichen, dass sie sich mit digitalen Standardverfahren einfach nicht abbilden lassen. Zurzeit arbeiten wir auch an einem mehrstufigen System von Qualitätsindikatoren, das den Nutzerinnen und Nutzern dabei helfen soll, die Nachnutzungspotentiale der Datensätze besser einordnen zu können, also auf einen Blick erkennbar zu machen, ob die Daten inhaltlich und von der Qualität her für die eigenen Forschungsziele nachnutzbar sind.

Gibt es auch Vorbehalte, die erhobenen Daten zu dokumentieren und abzugeben?

Leider ja (seufzt). Ein häufig genannter Grund ist, dass der Aufwand der Datendokumentation bzw. des Datenmanagements mit keiner Reputationssteigerung verbunden sei. Forschende sehen häufig mit der Abgabe von Forschungsdaten den zusätzlichen Arbeitsaufwand, der sie in der Drittmitteleinwerbung oder in ihrer akademischen Karriere aber nicht weiterbringt.

„Bei Berufungsverfahren sollten nicht nur Publikationslisten, sondern auch Listen der veröffentlichten Forschungsdaten offizielle Bewertungskriterien sein.“

Ich würde mir wünschen, dass man bei der Berufung zu Professuren künftig nicht nur die Publikationsliste berücksichtigt, sondern auch eine Liste der veröffentlichten Forschungsdaten – als Nachweis für selbstverständlichen Umgang mit Open-Science-Praktiken. Und auch bei den Verlagen hat sich in Bezug auf Forschungsdaten einiges getan: Viele Zeitschriften erwarten gleichzeitig mit Einreichen des Aufsatzes die Veröffentlichung des Datensatzes, auf dem die Berechnungen und Untersuchungen basieren. Das ist für uns ein gutes Argument gegenüber den Wissenschaftlerinnen und Wissenschaftlern, denn wir vergeben für eingereichte Datensätze direkt eine DOI, die im Artikel als Datenpublikation referenziert werden kann.

Zum Schluss: Bemerken Sie aufgrund der akuellen Corona-Pandemie eine höhere Nachfrage nach ihren Datensätzen?

Tatsächlich haben wir im Moment einen riesigen Anstieg der Nachfrage bei den Forschungsdaten, vor allem von Master-Studierenden, die zurzeit ihre Abschlussarbeit schreiben müssen und angesichts der Corona-Krise keine eigenen Daten erheben können. Wir haben also nicht mehr nur Nutzer, die sich mit dem „Forschungsdatenökosystem“ bereits auskennen, sondern auch Leute, die aufgrund eines akuten Bedarfs an Daten das erste Mal mit Forschungsdaten und den Möglichkeiten ihrer Nachnutzung in Berührung kommen. Das finde ich sehr interessant, und ich könnte mir vorstellen, dass dieser erzwungene Rückgriff auf bestehende Datenbestände dafür sorgt, dass das Thema Datennachnutzung an Prominenz noch weiter zulegen wird.

Vielen Dank für das Gespräch, Herr Ramthun!

Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver

Auch noch interessant:

Forschungsdatenzentren stellen sich vor (8): „Mit unseren Datenbeständen kann man eine Fülle von Forschungsfragen bearbeiten“. INTERVIEW mit Dana Müller, Forschungsbereichsleiterin beim Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung (IAB).
Forschungsdatenzentren stellen sich vor (7): „Auch in den Bildungswissenschaften sollte man den Umgang mit verschiedenen Datenbeständen beherrschen“. INTERVIEW mit Dr. Susanne Kuger, Leiterin der DJI-Abteilung Zentrum für Dauerbeobachtung und Methoden und verantwortlich für das Forschungsdatenzentrum des Deutschen Jugendinstituts (DJI).
Forschungsdatenzentren stellen sich vor (6): Das Archiv „Deutsches Gedächtnis“ Soziale Herkunft und Bildungswege in den biografischen Interviews des Archivs „Deutsches Gedächtnis“. Interview mit der Leiterin Dr. Almut Leh
Forschungdatenzentren stellen sich vor (5): „Forschungsdatenzentren können Reproduzierbarkeit von Forschung unterstützen“.Interview mit Dr. Karsten Stephan, dem Leiter des Forschungsdatenzentrums für Hochschul- und Wissenschaftsforschung
Forschungdatenzentren stellen sich vor (4): Das Archiv für pädagogische Kasuistik an der Goethe-Universität Frankfurt. Eine Plattform für alle, die sich in Forschung, Lehre oder Studium für die pädagogische Praxis der Schule interessieren. Interview mit Dr. Helge Kminek, dem Administrator der Archivdatenbank.
Forschungdatenzentren stellen sich vor (3): Das FDZ des Leibniz-Instituts für Bildungsverläufe. „Die NEPS-Studie ist eine große Investition, die für viele Forschungsfragen interessante Daten bietet.“ Interview mit Dr. Daniel Fuß, Arbeitsbereichsleiter des Forschungsdatenzentrums (FDZ) am LIfBi.
Forschungdatenzentren stellen sich vor (2): Das GESIS-Datenarchiv für Sozialwissenschaften. „Heute sind viel mehr Forscher für das Thema Forschungsdaten sensibilisiert.“ Interview mit Reiner Mauer, dem stellvertretenden Leiter der GESIS-Abteilung Datenarchiv für Sozialwissenschaften.
Forschungsdatenzentren für die Bildung stellen sich vor (1): Das FDZ am Institut für Qualitätsentwicklung (IQB)
„PISA, IGLU, TIMMS und IQB-Bildungstrends sind natürlich unsere Kassenschlager“. Interview mit Dr. Malte Jansen, wissenschaftlicher Leiter des Forschungsdatenzentrums (FDZ) am IQB