Forschungsdatenzentren stellen sich vor (15): FORS, das Schweizer Kompetenzzentrum für Sozialwissenschaften
Das Schweizer Kompetenzzentrum für Sozialwissenschaften FORS führt große nationale und internationale Umfragen durch, bietet Daten- und Forschungsinformationsdienste für Wissenschaftlerinnen und Wissenschaftler und akademische Einrichtungen an und betreibt Forschung mit sowohl methodologischen als auch thematischen Schwerpunkten.
INTERVIEW mit Marieke Heers, die das Datenarchiv bei FORS leitet. Sie stellt den für die Bildungswissenschaft interessanten Teil des FORS-Datenbestands vor, erläutert das eigens entwickelte Angebot zur Reproduzierbarkeit von Analysecodes und blickt auf zukünftige Entwicklungen im Bereich Open Research Data. Im 2008 gegründeten FORS wurden verschiedene Langzeitprojekte wie das Schweizer Haushalt-Panel (SHP), die Schweizer Wahlstudien SELECTS und SIDOS, das Schweizerische Informations- und Datenarchiv in den Sozialwissenschaften zusammengeführt. Damit hat die Schweiz eine sozialwissenschaftliche Infrastruktur geschaffen, in der das Wissen über das Sammeln, Archivieren und Verbreiten von sozialwissenschaftlichen Daten, aber auch das Wissen über das Bereitstellen von Dienstleistungen für Sozialwissenschaftler gebündelt und weiterentwickelt werden kann.
Frau Heers, was genau macht das FORS? Welche Aufgaben hat es?
Marieke Heers: Wie der Name schon sagt, befassen wir uns mit verschiedenen Aspekten der Sozialwissenschaften – insbesondere mit sozialwissenschaftlichen Forschungsdaten. FORS ist für alle Personen und Institutionen da, die in der Schweiz in den Sozialwissenschaften tätig sind. Das bedeutet: Wir erheben selbst Forschungsdaten und bereiten sie auf, archivieren aber auch Daten anderer und stellen sie anderen Interessierten zur Sekundärnutzung bereit. Das läuft alles über die Online-Plattform SWISSUbase, die Informationen und Zugang zu sozialwissenschaftlichen Forschungsprojekten und -daten in der Schweiz bietet.
„Wir produzieren selbst Daten, nehmen aber auch Daten von anderen Forschenden bei uns ins Archiv auf und verteilen sie dann.“
Können Sie den Bestand des FORS-Datenarchivs kurz beschreiben?
Marieke Heers: Das Datenarchiv umfasst im Moment etwa 900 quantitative und qualitative Datensätze aus allen Disziplinen der Sozialwissenschaften. Der Großteil der Datensätze ist quantitativ. Davon sind ungefähr zehn Prozent der Bildungsforschung zuzurechnen. Aber natürlich haben wir auch viele Datensätze, die interdisziplinär sind – beispielweise das Schweizer Haushaltspanel, das mit dem deutschen Sozioökonomischen Panel verglichen werden kann. Auch aus den Politikwissenschaften haben wir viele Datensätze. Dazu kommen noch Datensätze aus der Soziologie, Psychologie und der Ökonomie und anderen sozialwissenschaftlichen Disziplinen sowie Schweizer Datensätze aus internationalen Erhebungen, wie zum Beispiel dem European Social Survey, eine groß angelegte wissenschaftliche Studie, die seit 2002 alle zwei Jahre in rund 30 europäischen Ländern durchgeführt wird.
„Unser Datenarchiv umfasst eigentlich alles, was in den Bereich der Sozialwissenschaften fallen kann.“
Wir wissen allerdings, dass wir in einigen Disziplinen wie der Psychologie nicht gut vertreten sind und versuchen deshalb offensiv auf deren Vertreter zuzugehen. Andererseits kommen Wissenschaftlerinnen und Wissenschaftler anderer Disziplinen direkt auf uns zu und erkundigen sich, wie die Zusammenarbeit verbessert werden könnte – so geschehen im Bereich der Sozialarbeit. Daraus entstand ein Pilotprojekt, bei dem wir eruieren, was FORS machen kann, damit auch deren Forschende Daten bei uns hinterlegen.
Auf einen Blick: FORS – Das Schweizer Kompetenzzentrum für Sozialwissenschaften
Datenbestand
900 Datensätze, darunter das Schweizer Haushaltspanel (SHP), Schweizer Wahlstudie Selects, European Social Survey, TREE I und TREE II, PICE- Parental Investment in Children’s Education, ÜGK – Überprüfung der Grundkompetenzen. Aktuelle Bestände sind über SWISSUbase zugänglich.
Sammelschwerpunkt
Alle Arten von quantitativen und qualitativen Daten sozialwissenschaftlicher Disziplinen, die sich auf die Schweiz beziehen – inklusive sensibler und experimenteller Daten.
Service
Unterstützung bei Datenerhebung; Wissen und Support für Datenmanagement und -hinterlegung; Support bei der Suche nach Sekundärdaten; Leitfäden, hilfreiche Dokumente und Videos; FORS Replication Service.
Wer nutzt die Daten
Wissenschaftlerinnen und Wissenschaftler aller sozialwissenschaftlicher Disziplinen.
Was sind denn die bekanntesten Daten bei FORS?
Marieke Heers: Tatsächlich sind es die Schweizer Haushaltspanel-Daten, die am meisten nachgefragt werden. Eine andere Studie, deren Daten stark nachgenutzt werden, stammt aus der Politikwissenschaft, die Schweizer Wahlstudie „Selects“, die seit 1995 das Wahlverhalten der Bürgerinnen und Bürger analysiert. Und sehr interessante Daten – gerade auch für die deutsche Bildungsforschung – bietet die große repräsentative Längsschnittstudie Transition von der Erstausbildung ins Erwerbsleben (TREE), die mittlerweile in der zweiten Kohorte den beruflichen Werdegang von 9.000 Befragten nach Verlassen der Schule bei ihrem Übergang ins Berufs- und Erwachsenenleben wissenschaftlich begleitet. Spannend ist diese Studie nicht nur deshalb, weil sie widerspiegelt, wie die Bildungsverläufe waren, welche Entscheidungen wozu geführt haben und welche Rolle der familiäre Hintergrund spielt, sondern auch weil man mittlerweile zwei Kohorten – TREE1 und TREE2 – miteinander vergleichen kann: Diejenigen, die die Schule im Jahr 2000 verlassen haben, mit denjenigen, die 2016 abgeschlossen haben.
Die Kombination aus standardisierten TREE-Daten und qualitativen Interviews im PICE-Projekt ermöglicht eine vollständigere und tiefere Analyse als in bisherigen Forschungsprojekten üblich.
Eine andere Studie, die ich gerne nennen möchte, ist eine Vertiefungsstudie von TREE2: „PICE“ – das steht für „Parental Investment in Children’s Education“. Die PICE-Studie beschäftigt sich mit Bildungswegen von jungen Erwachsenen und interessiert sich insbesondere dafür, wie diese von ihren Familien auf dem Weg ins Erwachsenen- und Erwerbsleben begleitet werden. Von den 9.000 bei TREE2 Befragten, wurden im PICE-Projekt mit 71 jungen Erwachsenen und 48 Eltern vertiefende qualitative Interviews geführt, im Folgejahr wurden die 39 Eltern nochmal interviewt. All diese Interviews wurden anonymisiert und dokumentiert und zum Teil auch schon von FORS-Wissenschaftlerinnen und -Wissenschaftlern analysiert; aber da gibt es noch viel mehr herauszuholen! Gerade der Mixed Methods-Ansatz aus qualitativen und quantitativen Daten bietet enormes Potenzial. Eine weitere spannende Datenquelle ist auch die ÜGK – Überprüfung der Grundkompetenzen, das ist eine große, national durchgeführte Schülerleistungserhebung mit über 20.000 Teilnehmenden, mit der gezeigt werden soll, inwieweit in den einzelnen Schweizer Kantonen die nationalen Bildungsziele erreicht werden. Auch die Schweizer PISA-Daten sind bei uns archiviert.
Anderes Thema: Wie ist es um die grundsätzliche Bereitschaft der Schweizer Wissenschaftsszene bestellt, Forschungsdaten zu teilen und nach zu nutzen?
Marieke Heers: Ähnlich wie in Deutschland würde ich sagen. Die jüngeren Wissenschaftlerinnen und Wissenschaftler sind im Grunde schon mit der Idee von Open Data aufgewachsen und teilen nicht nur Daten, sondern auch den Analysecode und machen ihre Ergebnisse über Preprints verfügbar. Und seit 2016 wird man vonseiten des Schweizer Nationalfonds, das schweizerische Pendant zur DFG, bei Antragstellung dazu aufgerufen einen Datamanagement-Plan auszufüllen. Trotzdem gehe ich davon aus, dass wir weiterhin mehr und mehr Daten bekommen werden, denn das Thema Open Research Data erfährt sehr viel Aufmerksamkeit und auch Projektförderung auf unterschiedlichen Ebenen; auch die vielen Argumente für Open Data sind mittlerweile in der wissenschaftlichen Community angekommen.
„Das Thema Open Research Data ist in aller Munde.“
Was wir aber noch deutlicher machen müssen, ist der Nutzen von Sekundäranalysen. Wir müssen noch besser zeigen, dass wirklich sehr gute Studien daraus entstehen können. Viele Wissenschaftlerinnen und Wissenschaftler meinen, dass sie aus den von ihnen erhobenen Daten bereits alles rausgeholt haben und nichts Interessantes mehr auszuwerten sei. Da halten wir dann dagegen und sagen: Unterschätzt nicht, was jemand, der aus einer ganz anderen Perspektive drauf schaut, noch mit den Daten machen kann. Gut wären in diesem Fall mehr Beispiele wie Publikationen, die aus einer Sekundäranalyse eines bereits bekannten Datenbestands resultieren, insbesondere aus kleineren Projekten.
Dokumentieren sie denn die Publikationen, die aus Sekundäranalysen entstanden sind?
Marieke Heers: Ja, aber es ist schwierig. Beim Download der Daten verpflichten sich die Forschenden dazu, die eventuell entstandenen Publikationen zu melden, aber das wird oft vergessen! Wir versuchen zwar möglichst viel nachzurecherchieren, aber alles können wir nicht rausfinden.
Aus welchen Disziplinen und vielleicht auch Ländern kommen denn ihre Nutzerinnen und Nutzer?
Marieke Heers: Die Disziplinen mit den größten Datenbeständen haben auch die meisten Nutzerinnen und Nutzer – und die sind zum größten Teil aus der Schweiz, ein kleiner Teil aber auch aus Deutschland. Unsere Datenbestände sind natürlich auch über den CESSDA Data Catalogue zu finden, aber die meisten Anfragen kommen schon aus der Schweiz.
Wenn sie jetzt nach vorne blicken: Was sind wichtige Entwicklungen im Umgang mit Forschungsdaten?
Marieke Heers: Open Data und Datenschutz bilden nach wie vor ein Spannungsfeld. Seit der Einführung des neuen Datenschutzgesetzes im September 2023 ist die Unsicherheit im Umgang mit den Open Research Data wieder gestiegen. Alle wollen es gut machen, aber oft ist dann doch nicht ganz klar, was man darf und was nicht – da versuchen wir natürlich zu unterstützen. Gleichzeitig sind auch wir keine Juristen und so manches Mal ist eine Regelung auch Auslegungssache. Wo wir aber sehr gute Unterstützung leisten können, ist im Umgang mit personenbezogenen Daten, vor allem im Hinblick auf die Frage, wie sensible Daten den FAIR-Prinzipien entsprechend zur Verfügung gestellt werden können. Was wir auch mehr und mehr sehen, sind Fragen zur Reproduzierbarkeit von Studien – nicht nur von Daten, sondern auch von Analysecodes. Deshalb haben wir jetzt den FORS Replication Service aufgesetzt, der es Forschenden ermöglicht, das wissenschaftlichen Veröffentlichungen zugrunde liegende Material zu teilen; sie scheuen nämlich US-amerikanische Angebote wie das Open Science Framework und suchen eine Lösung in der Schweiz.
„Nicht nur die Forschungsdaten, sondern der ganze Forschungszyklus sollte offener und nachvollziehbarer gestaltet werden können.“
Und welche Entwicklungen werden in den nächsten Jahren noch wichtig werden?
Marieke Heers: Da fallen mir drei Themen ein: Erstens wollen wir am FORS mehr qualitative Daten bereithalten. Das heißt, wir müssen eine noch bessere Überzeugungsarbeit leisten, um Forschende dazu zu bringen, mehr qualitative Daten in unserem Archiv abzulegen. Dazu wäre es gut, beispielhaft zeigen zu können, wie und wo sich solche Daten für eine Sekundärnutzung eignen. Zweitens, das Thema Künstliche Intelligenz: Wir wissen, dass KI auch unsere Arbeit beeinflussen kann und wird. Aber wie genau können wir KI-Tools nutzen? Könnten sie uns bei der Erstellung von Metadaten unterstützen? Uns Arbeit abnehmen, so dass wir nicht alles kognitiv und manuell erfassen müssen, sondern Informationen aus anderen Reports „automatisch“ extrahiert werden? Darüber diskutieren wir derzeit viel. Ich denke, da wird sich in den nächsten Jahren einiges tun, was wir jetzt noch gar nicht erahnen. Das dritte Thema ist die zwar wachsende Anerkennung für das Data-Sharing, die sich aber in der Leistungserfassung im wissenschaftlichen Prozess noch nicht angemessen widerspiegelt. In diesem Zusammenhang zielt das von FORS koordinierte Projekt recORD, das steht für recognise Open Research Data, darauf ab, Beiträge im Bereich Open Research Data in Forschungsevaluationen besser anzuerkennen. Die Erhebung, Produktion und Aufbereitung von Daten sind ein wichtiger Bestandteil der Forschung, der oft wenig gesehen wird, weil es dann doch wieder um die Publikation geht! Deshalb denken wir darüber nach, wie wir Forschungsdaten sichtbarer machen können – zum Beispiel durch Identifier wie die DOI.
Vielen Dank für das Gespräch, Frau Heers!
Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver
Auch noch interessant:
- Forschungsdatenzentren stellen sich vor (14): „Qualitative Forschungsdaten sind ein Schatz, der gerade erst gehoben wird!“ INTERVIEW mit Prof. Dr. Betina Hollstein
- Forschungsdatenzentren stellen sich vor (13): „Unsere umfangreiche Bibliografie zeigt, was man alles mit den PIAAC-Daten erforschen kann.“ INTERVIEW mit Débora Maehler, die bei GESIS das Forschungsdatenzentrum PIAAC leitet.
- Forschungsdatenzentren stellen sich vor (12): FD-LEX – Grundstein für eine zentrale Forschungsdatenbank zum Thema Sprachförderung und Sprachkompetenz legen. INTERVIEW mit Sandra Tietjens von der Forschungsdatenbank Lernertexte, kurz auch FD-LEX genannt.
- Forschungsdatenzentren stellen sich vor (11): „Bei Anfragen wird zunehmend von einem einfachen und schnellen Datenzugriff ausgegangen“. INTERVIEW mit Hella Huntemann und Harald Kaluza vom Deutschen Institut für Erwachsenenbildung (DIE)
- Forschungsdatenzentren stellen sich vor (10): „Fragen der Berufsausbildung lassen sich mit unseren Forschungsdaten hervorragend bearbeiten.“ INTERVIEW mit Dr. Holger Alda, Arbeitsbereichsleiter des Forschungsdatenzentrums im Bundesinstitut für Berufsbildung (BIBB).
- Forschungsdatenzentren stellen sich vor (9): „Wir bieten Wissenschaftlern Zugang zu hochqualitativen Mikrodaten“. INTERVIEW mit Dr. Jan Goebel, Leiter des Forschungsdatenzentrums des Sozio-oekonomischen Panels am DIW Berlin (FDZ SOEP).
- Forschungsdatenzentren stellen sich vor (8): „Mit unseren Datenbeständen kann man eine Fülle von Forschungsfragen bearbeiten“. INTERVIEW mit Dana Müller, Forschungsbereichsleiterin beim Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung (IAB).
- Forschungsdatenzentren stellen sich vor (7): „Auch in den Bildungswissenschaften sollte man den Umgang mit verschiedenen Datenbeständen beherrschen“. INTERVIEW mit Dr. Susanne Kuger, Leiterin der DJI-Abteilung Zentrum für Dauerbeobachtung und Methoden und verantwortlich für das Forschungsdatenzentrum des Deutschen Jugendinstituts (DJI).
- Forschungsdatenzentren stellen sich vor (6): Das Archiv „Deutsches Gedächtnis“ Soziale Herkunft und Bildungswege in den biografischen Interviews des Archivs „Deutsches Gedächtnis“. Interview mit der Leiterin Dr. Almut Leh
- Forschungdatenzentren stellen sich vor (5): „Forschungsdatenzentren können Reproduzierbarkeit von Forschung unterstützen“.Interview mit Dr. Karsten Stephan, dem Leiter des Forschungsdatenzentrums für Hochschul- und Wissenschaftsforschung
- Forschungdatenzentren stellen sich vor (4): Das Archiv für pädagogische Kasuistik an der Goethe-Universität Frankfurt. Eine Plattform für alle, die sich in Forschung, Lehre oder Studium für die pädagogische Praxis der Schule interessieren. Interview mit Dr. Helge Kminek, dem Administrator der Archivdatenbank.
- Forschungdatenzentren stellen sich vor (3): Das FDZ des Leibniz-Instituts für Bildungsverläufe. „Die NEPS-Studie ist eine große Investition, die für viele Forschungsfragen interessante Daten bietet.“ Interview mit Dr. Daniel Fuß, Arbeitsbereichsleiter des Forschungsdatenzentrums (FDZ) am LIfBi.
- Forschungdatenzentren stellen sich vor (2): Das GESIS-Datenarchiv für Sozialwissenschaften. „Heute sind viel mehr Forscher für das Thema Forschungsdaten sensibilisiert.“ Interview mit Reiner Mauer, dem stellvertretenden Leiter der GESIS-Abteilung Datenarchiv für Sozialwissenschaften.
- Forschungsdatenzentren für die Bildung stellen sich vor (1): Das FDZ am Institut für Qualitätsentwicklung (IQB)
„PISA, IGLU, TIMMS und IQB-Bildungstrends sind natürlich unsere Kassenschlager“. Interview mit Dr. Malte Jansen, wissenschaftlicher Leiter des Forschungsdatenzentrums (FDZ) am IQB
Der Umgang mit Forschungsdaten und Datenschutz ist wirklich ein heikles Thema, besonders in der heutigen Zeit, wo Daten ein immer höheres Gut sind. Gerade das Spannungsfeld zwischen Open Data und Datenschutz bringt viele Herausforderungen mit sich.
Es wäre spannend zu sehen, wie sich dies in Zukunft weiterentwickelt, vor allem in Bezug auf internationale Standards. Vielleicht könnten mehr Best-Practice-Beispiele helfen, Unsicherheiten abzubauen und den Austausch zu fördern.