„Open Research Data und Datenschutz bilden nach wie vor ein Spannungsfeld“

Forschungsdatenzentren stellen sich vor (15): FORS, das Schweizer Kompetenzzentrum für Sozialwissenschaften

Das Schweizer Kompetenzzentrum für Sozialwissenschaften FORS führt große nationale und internationale Umfragen durch, bietet Daten- und Forschungsinformationsdienste für Wissenschaftlerinnen und Wissenschaftlern und akademische Einrichtungen an und betreibt Forschung mit sowohl methodologischen als auch thematischen Schwerpunkten.

Halbporträt Marieke HHeers

Marieke Heers, Leiterin des FORS-Datenarchivs (Foto: privat)

INTERVIEW mit Marieke Heers, die das Datenarchiv bei FORS leitet. Sie stellt den für die Bildungswissenschaft interessanten Teil des FORS-Datenbestands vor, erläutert das eigens entwickelte Angebot zur Reproduzierbarkeit von Analysecodes und blickt auf zukünftige Entwicklungen im Bereich Open Research Data. Im 2008 gegründeten FORS wurden verschiedene Langzeitprojekte wie das Schweizer Haushalt-Panel (SHP), die Schweizer Wahlstudien SELECTS und SIDOS, das Schweizerische Informations- und Datenarchiv in den Sozialwissenschaften zusammengeführt. Damit hat die Schweiz eine sozialwissenschaftliche Infrastruktur geschaffen, in der das Wissen über das Sammeln, Archivieren und Verbreiten von sozialwissenschaftlichen Daten, aber auch das Wissen über das Bereitstellen von Dienstleistungen für Sozialwissenschaftler gebündelt und weiterentwickelt werden kann.

Frau Heers, was genau macht das FORS? Welche Aufgaben hat es?

Marieke Heers: Wie der Name schon sagt, befassen wir uns mit verschiedenen Aspekten der Sozialwissenschaften – insbesondere mit sozialwissenschaftlichen Forschungsdaten. FORS ist für alle Personen und Institutionen da, die in der Schweiz in den Sozialwissenschaften tätig sind. Das bedeutet: Wir erheben selbst Forschungsdaten und bereiten sie auf, archivieren aber auch Daten anderer und stellen sie anderen Interessierten zur Sekundärnutzung bereit. Das läuft alles über die Online-Plattform SWISSUbase, die Informationen und Zugang zu sozialwissenschaftlichen Forschungsprojekten und -daten in der Schweiz bietet.

„Wir produzieren selbst Daten, nehmen aber auch Daten von anderen Forschenden bei uns ins Archiv auf und verteilen sie dann.“

Logo FORS

Forschungsdaten bei FORS, dem Schweizer Kompetenzzentrum Sozialwissenschaften

Können Sie den Bestand des FORS-Datenarchivs kurz beschreiben?

Marieke Heers: Das Datenarchiv umfasst im Moment etwa 900 quantitative und qualitative Datensätze aus allen Disziplinen der Sozialwissenschaften. Der Großteil der Datensätze ist quantitativ. Davon sind ungefähr zehn Prozent der Bildungsforschung zuzurechnen. Aber natürlich haben wir auch viele Datensätze, die interdisziplinär sind – beispielweise das Schweizer Haushaltspanel, das mit dem deutschen Sozioökonomischen Panel verglichen werden kann. Auch aus den Politikwissenschaften haben wir viele Datensätze. Dazu kommen noch Datensätze aus der Soziologie, Psychologie und der Ökonomie und anderen sozialwissenschaftlichen Disziplinen sowie Schweizer Datensätze aus internationalen Erhebungen, wie zum Beispiel dem European Social Survey, eine groß angelegte wissenschaftliche Studie, die seit 2002 alle zwei Jahre in rund 30 europäischen Ländern durchgeführt wird.

„Unser Datenarchiv umfasst eigentlich alles, was in den Bereich der Sozialwissenschaften fallen kann.“

Wir wissen allerdings, dass wir in einigen Disziplinen wie der Psychologie nicht gut vertreten sind und versuchen deshalb offensiv auf deren Vertreter zuzugehen. Andererseits kommen Wissenschaftlerinnen und Wissenschaftler anderer Disziplinen direkt auf uns zu und erkundigen sich, wie die Zusammenarbeit verbessert werden könnte – so geschehen im Bereich der Sozialarbeit. Daraus entstand ein Pilotprojekt, bei dem wir eruieren, was FORS machen kann, damit auch deren Forschende Daten bei uns hinterlegen.

Auf einen Blick: FORS – Das Schweizer Kompetenzzentrum für Sozialwissenschaften

Datenbestand

900 Datensätze, darunter das Schweizer Haushaltspanel (SHP), Schweizer Wahlstudie Selects, European Social Survey, TREE I und TREE II, PICE- Parental Investment in Children’s Education, ÜGK – Überprüfung der Grundkompetenzen. Aktuelle Bestände sind über SWISSUbase zugänglich.

Sammelschwerpunkt

Alle Arten von quantitativen und qualitativen Daten sozialwissenschaftlicher Disziplinen, die sich auf die Schweiz beziehen – inklusive sensibler und experimenteller Daten.

Service

Unterstützung bei Datenerhebung; Wissen und Support für Datenmanagement und -hinterlegung; Support bei der Suche nach Sekundärdaten; Leitfäden, hilfreiche Dokumente und Videos; FORS Replication Service.

Wer nutzt die Daten

Wissenschaftlerinnen und Wissenschaftler aller sozialwissenschaftlicher Disziplinen.

Was sind denn die bekanntesten Daten bei FORS?

Marieke Heers: Tatsächlich sind es die Schweizer Haushaltspanel-Daten, die am meisten nachgefragt werden. Eine andere Studie, deren Daten stark nachgenutzt werden, stammt aus der Politikwissenschaft, die Schweizer Wahlstudie „Selects“, die seit 1995 das Wahlverhalten der Bürgerinnen und Bürger analysiert. Und sehr interessante Daten – gerade auch für die deutsche Bildungsforschung – bietet die große repräsentative Längsschnittstudie Transition von der Erstausbildung ins Erwerbsleben (TREE), die mittlerweile in der zweiten Kohorte den beruflichen Werdegang von 9.000 Befragten nach Verlassen der Schule bei ihrem Übergang ins Berufs- und Erwachsenenleben wissenschaftlich begleitet. Spannend ist diese Studie nicht nur deshalb, weil sie widerspiegelt, wie die Bildungsverläufe waren, welche Entscheidungen wozu geführt haben und welche Rolle der familiäre Hintergrund spielt, sondern auch weil man mittlerweile zwei Kohorten – TREE1 und TREE2 – miteinander vergleichen kann: Diejenigen, die die Schule im Jahr 2000 verlassen haben, mit denjenigen, die 2016 abgeschlossen haben.

Die Kombination aus standardisierten TREE-Daten und qualitativen Interviews im PICE-Projekt ermöglicht eine vollständigere und tiefere Analyse als in bisherigen Forschungsprojekten üblich.

Eine andere Studie, die ich gerne nennen möchte, ist eine Vertiefungsstudie von TREE2: „PICE“ – das steht für „Parental Investment in Children’s Education“. Die PICE-Studie beschäftigt sich mit Bildungswegen von jungen Erwachsenen und interessiert sich insbesondere dafür, wie diese von ihren Familien auf dem Weg ins Erwachsenen- und Erwerbsleben begleitet werden. Von den 9.000 bei TREE2 Befragten, wurden im PICE-Projekt mit 71 jungen Erwachsenen und 48 Eltern vertiefende qualitative Interviews geführt, im Folgejahr wurden die 39 Eltern nochmal interviewt. All diese Interviews wurden anonymisiert und dokumentiert und zum Teil auch schon von FORS-Wissenschaftlerinnen und -Wissenschaftlern analysiert; aber da gibt es noch viel mehr herauszuholen! Gerade der Mixed Methods-Ansatz aus qualitativen und quantitativen Daten bietet enormes Potenzial. Eine weitere spannende Datenquelle ist auch die ÜGK – Überprüfung der Grundkompetenzen, das ist eine große, national durchgeführte Schülerleistungserhebung mit über 20.000 Teilnehmenden, mit der gezeigt werden soll, inwieweit in den einzelnen Schweizer Kantonen die nationalen Bildungsziele erreicht werden. Auch die Schweizer PISA-Daten sind bei uns archiviert.

Anderes Thema: Wie ist es um die grundsätzliche Bereitschaft der Schweizer Wissenschaftsszene bestellt, Forschungsdaten zu teilen und nach zu nutzen?

Marieke Heers: Ähnlich wie in Deutschland würde ich sagen. Die jüngeren Wissenschaftlerinnen und Wissenschaftler sind im Grunde schon mit der Idee von Open Data aufgewachsen und teilen nicht nur Daten, sondern auch den Analysecode und machen ihre Ergebnisse über Preprints verfügbar. Und seit 2016 wird man vonseiten des Schweizer Nationalfonds, das schweizerische Pendant zur DFG, bei Antragstellung dazu aufgerufen einen Datamanagement-Plan auszufüllen. Trotzdem gehe ich davon aus, dass wir weiterhin mehr und mehr Daten bekommen werden, denn das Thema Open Research Data erfährt sehr viel Aufmerksamkeit und auch Projektförderung auf unterschiedlichen Ebenen; auch die vielen Argumente für Open Data sind mittlerweile in der wissenschaftlichen Community angekommen.

„Das Thema Open Research Data ist in aller Munde.“

Was wir aber noch deutlicher machen müssen, ist der Nutzen von Sekundäranalysen. Wir müssen noch besser zeigen, dass wirklich sehr gute Studien daraus entstehen können. Viele Wissenschaftlerinnen und Wissenschaftler meinen, dass sie aus den von ihnen erhobenen Daten bereits alles rausgeholt haben und nichts Interessantes mehr auszuwerten sei. Da halten wir dann dagegen und sagen: Unterschätzt nicht, was jemand, der aus einer ganz anderen Perspektive drauf schaut, noch mit den Daten machen kann. Gut wären in diesem Fall mehr Beispiele wie Publikationen, die aus einer Sekundäranalyse eines bereits bekannten Datenbestands resultieren, insbesondere aus kleineren Projekten.

Dokumentieren sie denn die Publikationen, die aus Sekundäranalysen entstanden sind?

Marieke Heers: Ja, aber es ist schwierig. Beim Download der Daten verpflichten sich die Forschenden dazu, die eventuell entstandenen Publikationen zu melden, aber das wird oft vergessen! Wir versuchen zwar möglichst viel nachzurecherchieren, aber alles können wir nicht rausfinden.

Logo Verbund FDB - Forschungsdaten Bildung

Informationen und Beratung zum Forschungsdatenmanagement für Bildungswissenschaftler*innen gibt es beim VerbundFDB.

Aus welchen Disziplinen und vielleicht auch Ländern kommen denn ihre Nutzerinnen und Nutzer?

Marieke Heers: Die Disziplinen mit den größten Datenbeständen haben auch die meisten Nutzerinnen und Nutzer – und die sind zum größten Teil aus der Schweiz, ein kleiner Teil aber auch aus Deutschland. Unsere Datenbestände sind natürlich auch über den CESSDA Data Catalogue zu finden, aber die meisten Anfragen kommen schon aus der Schweiz.

Wenn sie jetzt nach vorne blicken: Was sind wichtige Entwicklungen im Umgang mit Forschungsdaten?

Marieke Heers: Open Data und Datenschutz bilden nach wie vor ein Spannungsfeld. Seit der Einführung des neuen Datenschutzgesetzes im September 2023 ist die Unsicherheit im Umgang mit den Open Research Data wieder gestiegen. Alle wollen es gut machen, aber oft ist dann doch nicht ganz klar, was man darf und was nicht – da versuchen wir natürlich zu unterstützen. Gleichzeitig sind auch wir keine Juristen und so manches Mal ist eine Regelung auch Auslegungssache. Wo wir aber sehr gute Unterstützung leisten können, ist im Umgang mit personenbezogenen Daten, vor allem im Hinblick auf die Frage, wie sensible Daten den FAIR-Prinzipien entsprechend zur Verfügung gestellt werden können. Was wir auch mehr und mehr sehen, sind Fragen zur Reproduzierbarkeit von Studien – nicht nur von Daten, sondern auch von Analysecodes. Deshalb haben wir jetzt den FORS Replication Service aufgesetzt, der es Forschenden ermöglicht, das wissenschaftlichen Veröffentlichungen zugrunde liegende Material zu teilen; sie scheuen nämlich US-amerikanische Angebote wie das Open Science Framework und suchen eine Lösung in der Schweiz.

„Nicht nur die Forschungsdaten, sondern der ganze Forschungszyklus sollte offener und nachvollziehbarer gestaltet werden können.“

Und welche Entwicklungen werden in den nächsten Jahren noch wichtig werden?

Marieke Heers: Da fallen mir drei Themen ein: Erstens wollen wir am FORS mehr qualitative Daten bereithalten. Das heißt, wir müssen eine noch bessere Überzeugungsarbeit leisten, um Forschende dazu zu bringen, mehr qualitative Daten in unserem Archiv abzulegen. Dazu wäre es gut, beispielhaft zeigen zu können, wie und wo sich solche Daten für eine Sekundärnutzung eignen. Zweitens, das Thema Künstliche Intelligenz: Wir wissen, dass KI auch unsere Arbeit beeinflussen kann und wird. Aber wie genau können wir KI-Tools nutzen? Könnten sie uns bei der Erstellung von Metadaten unterstützen? Uns Arbeit abnehmen, so dass wir nicht alles kognitiv und manuell erfassen müssen, sondern Informationen aus anderen Reports „automatisch“ extrahiert werden? Darüber diskutieren wir derzeit viel. Ich denke, da wird sich in den nächsten Jahren einiges tun, was wir jetzt noch gar nicht erahnen. Das dritte Thema ist die zwar wachsende Anerkennung für das Data-Sharing, die sich aber in der Leistungserfassung im wissenschaftlichen Prozess noch nicht angemessen widerspiegelt. In diesem Zusammenhang zielt das von FORS koordinierte Projekt recORD, das steht für recognise Open Research Data, darauf ab, Beiträge im Bereich Open Research Data in Forschungsevaluationen besser anzuerkennen. Die Erhebung, Produktion und Aufbereitung von Daten sind ein wichtiger Bestandteil der Forschung, der oft wenig gesehen wird, weil es dann doch wieder um die Publikation geht! Deshalb denken wir darüber nach, wie wir Forschungsdaten sichtbarer machen können – zum Beispiel durch Identifier wie die DOI.

Vielen Dank für das Gespräch, Frau Heers!


Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver


Auch noch interessant:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert