Forschungsdatenzentren stellen sich vor (9): Das Forschungsdatenzentrum des Sozio-oekonomischen Panels am DIW Berlin (FDZ SOEP)
INTERVIEW mit Dr. Jan Goebel, Leiter des Forschungsdatenzentrums des Sozio-oekonomischen Panels. Das am DIW Berlin angesiedelte FDZ SOEP stellt Forschenden aus der ganzen Welt Scientific Use Files mit Daten aus den SOEP Panelbefragungen mitsamt den Zusatzstudien zur Verfügung. Die SOEP-Hauptbefragung erfasst unter anderem die Haushaltszusammensetzung sowie Berufsbiographie, Beschäftigung, Einkommen, Gesundheits- und Zufriedenheitsindikatoren der befragten Personen über die Zeit. Mit den seit 1984 erhobenen Daten wird der Wandel unserer Gesellschaft untersucht. Dabei geht es zum Beispiel um die Verteilung von Einkommen und Vermögen, aber auch um den Zugang zu Bildung oder Arbeit und die damit verbundenen Chancen und Risiken. Mit Jan Goebel sprechen wir unter anderem über die beiden Hauptstudien des SOEP und welche Möglichkeiten sie den Forschenden bieten.
Herr Göbel, welche Datensätze bietet das Sozio-oekonomische Panel in seinem FDZ an?
Im Prinzip stellen wir unseren Nutzern zwei Hauptstudien bereit: die multidisziplinär und breit angelegte Panelstudie SOEP-Core mit ungefähr 25.000 Befragten und das SOEP-Innovationssample, kurz SOEP-IS, mit 7.000 Befragten, in die Wissenschaftlerinnen und Wissenschaftler eigene, innovative Module miteinbringen können.
„Wenn Sie mit unserer Hauptstudie arbeiten wollen, haben Sie über 500 Datensätze auf Ihrer Festplatte.“
Was ist aus Ihrer Sicht das Besondere am SOEP?
Natürlich, dass es die größte Wiederholungsbefragung von Haushalten in Deutschland ist! Es ist schon beeindruckend, dass wir in unserem Panel dieselben Personen teilweise schon seit fast vierzig Jahren befragen. Wir haben wirklich Menschen, die schon seit 1984 dabei sind, zum Teil sogar schon deren Kinder und Enkel! So eine umfangreiche Längsschnittstudie eignet sich also sehr gut, um Aspekte der intergenerationellen Mobilität zu analysieren.
Eine Haushaltsbefragung in dieser Größe ist eine echte Herausforderung, oder?
Ja, der Aufwand, ein solches Panel mit einer Stichprobe von 25.000 Personen über vier Jahrzehnte aussagekräftig zu halten, ist nicht zu unterschätzen. Man braucht regelmäßige Auffrischungsstichproben – zum einen verliert man Personen, weil sie nicht mehr mitmachen wollen, ins Ausland verzogen oder auch einfach gestorben sind. Zum anderen verändert sich die Zusammensetzung in der Gesellschaft, die Sie mit der ersten Stichprobenziehung nicht abbilden konnten.
„Man kann nicht einmal eine Stichprobe ziehen und das Panel dann 50 Jahre laufen lassen.“
Das klassische Beispiel dafür sind Migrationsströme: Wenn ich 1984 eine Stichprobe in Westdeutschland gezogen habe, dann kann ich keine Personen in Ostdeutschland beobachten. Wenn ich 2000 eine Stichprobe gezogen habe, dann kann ich die 2016 nach Deutschland geflüchteten Personen nicht erfassen.
Welche Erhebungsmöglichkeiten können im SOEP-Innovationssample ausprobiert werden?
Wenn eine Wissenschaftlerin eine neue Frage oder innovative Methode in die Erhebung einbringen möchte, kann das nicht einfach so im SOEP-Hauptpanel umgesetzt werden. Das SOEP-Innovationssample ist eine Art Testlabor, in dem wir prüfen, ob das neue Modul relevant genug ist, um in die Hauptbefragung aufgenommen zu werden, und wie das genau funktionieren könnte. Solange die Vorhaben ethisch vertretbar sind und erfolgreich das Begutachtungsverfahren durchlaufen, ist sehr viel möglich.
Jeder Wissenschaftler, jede Wissenschaftlerin kann also neue Module einbringen?
Im Prinzip ja. Letztes Jahr hatten wir fast 60 Anträge, konnten davon aber nur 10 umsetzen. Das liegt nicht an der Qualität der Eingaben – im Gegenteil: Die Belastung für die Befragten würde einfach zu groß werden!
„Die Innovationsstichprobe ist eine institutionalisierte Möglichkeit für Forscher, neue Module auszuprobieren.“
Wir haben auch Kapazitätsgrenzen finanzieller Art. Ressourcen, die über die normale Befragung in einem Haushalt hinausgehen, sprengen unseren Standard.
Wie sehen denn die Nutzungszahlen des SOEP-Panels aus?
2019 haben knapp 400 Projekte neue Anträge auf Datennutzung gestellt. Zum Vergleich: 2012 waren es etwas über 200. In den vergangenen zehn Jahren hat sich die Anzahl der neuen Projekte fast verdoppelt. Das ist schon eine deutliche Zunahme. Und in den meisten Projektanträgen stehen mehrere Forschende als Datennutzer.
Für welche Gruppen oder Disziplinen sind die Datensätze denn interessant?
Wir haben eine sehr heterogene und breit aufgestellte Nutzerschaft – mit einer gewissen Häufung im Bereich Soziologie und Volkswirtschaftslehre. Aber es sind auch Leute aus dem Public Health-Bereich, der Psychologie und den Bildungswissenschaften dabei – auch aus der Demographie. Das Befragungsprogramm des SOEP ist seit seinem Beginn multidisziplinär ausgerichtet. 2019 hatten wir weltweit über 9.000 registrierte Nutzer aus 54 Ländern, davon 60 Prozent aus Deutschland. International sind wir also sehr präsent, wir versuchen auch unsere SOEP-Daten in international vergleichbare Datenbasen einzubringen, zum Beispiel in Initiativen wie das Cross-National Equivalent File; dort werden verschiedene Panel-Studien so aufbereitet, dass sie international vergleichbar bzw. analysierbar sind. Wir haben auch einen EU-SILC Clone gebaut, damit die EU-SILC-Daten auch für Deutschland im Längsschnitt genutzt werden können.
Beim Forschungsdatenzentrum Bildung ist eine Studie dokumentiert, in der SOEP-Daten der Jahre 1984-2012 genutzt wurden: Geschlechterunterschiede bei Bildungsverhalten und Bildungserfolg. Zur Relevanz von Familienstrukturen und regionalen Bedingungen im innerdeutschen Vergleich: Teilprojekt A
Welche Forschungsfragen könnten Erziehungswissenschaftler oder Bildungsforscherinnen mit dem Datenbestand beantworten?
Die SOEP-Daten sind für eine ganze Reihe von möglichen Fragen aus diesem Bereich geeignet. Eine Titelsuche nach dem Suchwort „Bildung“ in unserer Publikationsdatenbank ergibt fast 300 Treffer, also 300 Veröffentlichungen auf Basis der SOEP-Daten, die allein den Begriff Bildung im Titel haben. So eine umfangreiche Längsschnittstudie eignet sich natürlich sehr gut, um Aspekte der intergenerationellen Mobilität zu analysieren, beispielsweise wie sich Bildung von Elternschaft auf die Kinder vererbt. Seit dem Jahr 2000 haben wir auch altersspezifische Fragebögen implementiert, in der die Eltern über ihre Kinder ab der Geburt alle zwei Jahre Fragen beantworten. Dort werden zum Beispiel auch beide Elternteile – wenn Sie beide im Haushalt leben – nach ihren Auffassung von Erziehung gefragt. Und alle diese Kinder beantworten in dem Jahr, in dem sie 16 werden, auch einen eigenen Jugendfragebogen, bevor sie dann reguläre Befragungspersonen im SOEP werden.
Auf einen Blick: Das Forschungsdatenzentrum des SOEP
Datenbestand
SOEP-Core, eine repräsentative Wiederholungsbefragung. Über 25.000 Personen aus rd. 16.000 Haushalten in Deutschland geben seit 1984 Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. SOEP-Innovationssample (SOEP-IS), ein Infrastrukturangebot für externe Forscher um neue, innovative Forschungsfragen zu bearbeiten. Zusatzstudien (Beispiel Bildung): PIAAC-L (Programme for the International Assessment of Adult Competencies untersucht die grundlegenden Kompetenzen, die zur erfolgreichen Teilnahme an der Gesellschaft und am Berufsleben notwendig sind; Familien in Deutschland (FiD) fokussiert für die Familienpolitik bedeutsame Teilgruppen wie alleinerziehenden Eltern, Mehrkindfamilien, Familien im niedrigen Einkommensbereich sowie Familien mit sehr jungen Kindern.
Sammelschwerpunkt
Vorgehalten werden Daten der SOEP-Panelstudie, zum Teil verknüpft mit Datenbeständen anderer Institutionen und Initiativen.
Service
- SOEP in Residence: Auswertung und Austausch mit Expert*innen vor Ort
- SOEPcampus: Lehrveranstaltung an verschiedenen Orten
- SOEPcompanion: Begleiter für die Arbeit mit den SOEP-Daten
- SOEPhelp: Support in den Datensätzen
- SOEPtutorials: Videoschulung mit kurzen Beiträgen
- SOEPhotline: individuelle Beratung
- Paneldata.org: Datenbank mit Fragen und Variablen
Hier geht’s zu den ausführlichen Informationen.
Wer nutzt die Daten
Wissenschaftlerinnen und Wissenschaftler aus Soziologie, Volkswirtschaftslehre, Public-Health-Bereich, Psychologie und Bildungswissenschaften – weltweit; auch Demographen.
Wie sieht es mit der Literatur aus, die auf Basis der SOEP-Daten entstanden ist?
Wir versuchen alle Veröffentlichungen, die mit den SOEP-Daten zu tun haben, in einer eigenen Literaturdatenbank nachzuweisen. Inzwischen sind dort fast 9.000 Einträge aufgelistet, die auch in Paneldata.org, unserer Datenbank mit Fragen und Variablen, integriert sind und damit von jedem Nutzer recherchierbar sind. Laut Nutzungsvertrag sind zwar alle Nutzenden dazu verpflichtet, ihre auf den SOEP-Daten basierenden Publikationen bei uns zu melden, aber das klappt nicht immer. Zu sehen, was andere Wissenschaftler mit den Daten gemacht haben, ist ein sehr guter und manchmal auch einfacherer Zugang zur eigenen Forschung als die technische Dokumentation einer Studie.
Wie erleben Sie die Corona-Pandemie im Hinblick auf Ihre Arbeit?
Die Corona-Pandemie hat großen Einfluss auf unsere Arbeit gehabt! Wir haben es sehr kurzfristig geschafft, fast alle Haushalte zur derzeitigen Situation und Auswirkung der Pandemie telefonisch zu befragen. In Kooperation mit dem Robert-Koch-Institut haben wir auch alle Teilnehmer über 18 Jahren eingeladen, sich mit einem Selbsttest auf eine Covid-19 Infektion zu testen. Diese Dry-Blood-Spots werden dann im RKI nach den entsprechenden Antikörpern getestet. Wir haben den Vorteil, die Teilnehmenden auch weiterhin befragen zu können, um nicht nur die gesundheitlichen, sondern auch die sozialen die Auswirkungen zum Beispiel für die Organisation der Kinderbetreuung mit Schulen und Kitas zu erfassen. Und auch welche Langzeitfolgen möglicherweise aus der diesjährigen Belastungssituation entstehen.
Wird die Pandemie langfristig Ihre Arbeit verändern?
Es wird sich wohl noch zeigen, welche Auswirkungen das auch langfristig für unsere Befragungen haben wird. Aber wir stehen vor noch einer anderen großen Herausforderung: Die Bereitschaft in der Bevölkerung an solchen großen sozialwissenschaftlichen Surveys mitzumachen, sinkt – leider! Es wird immer schwieriger, Befragte für eine längerfristige Teilnahme zu motivieren und das wird nicht einfacher, wenn der Interviewer möglichst keinen direkten Kontakt zu den Befragten haben sollte.
„Die Bedeutung von langlaufenden Panels für die Erforschung von Langzeitfolgen und Veränderungen der Gesellschaft wird zunehmen.“
Dennoch versuchen wir immer wieder auch gegenüber den Befragten herauszustellen, welchen Wert die Befragungen für die Gesellschaft, für die Forschung und für die Politikberatung haben; die Daten werden zum Beispiel auch für den Armuts- und Reichtumsbericht des Bundesministeriums für Arbeit und Soziales genutzt!
Vielen Dank für das Gespräch, Herr Goebel!
Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver
Auch noch interessant:
- Forschungsdatenzentren stellen sich vor (8): „Mit unseren Datenbeständen kann man eine Fülle von Forschungsfragen bearbeiten“. INTERVIEW mit Dana Müller, Forschungsbereichsleiterin beim Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung (IAB).
- Forschungsdatenzentren stellen sich vor (7): „Auch in den Bildungswissenschaften sollte man den Umgang mit verschiedenen Datenbeständen beherrschen“. INTERVIEW mit Dr. Susanne Kuger, Leiterin der DJI-Abteilung Zentrum für Dauerbeobachtung und Methoden und verantwortlich für das Forschungsdatenzentrum des Deutschen Jugendinstituts (DJI).
- Forschungsdatenzentren stellen sich vor (6): Das Archiv „Deutsches Gedächtnis“ Soziale Herkunft und Bildungswege in den biografischen Interviews des Archivs „Deutsches Gedächtnis“. Interview mit der Leiterin Dr. Almut Leh
- Forschungdatenzentren stellen sich vor (5): „Forschungsdatenzentren können Reproduzierbarkeit von Forschung unterstützen“.Interview mit Dr. Karsten Stephan, dem Leiter des Forschungsdatenzentrums für Hochschul- und Wissenschaftsforschung
- Forschungdatenzentren stellen sich vor (4): Das Archiv für pädagogische Kasuistik an der Goethe-Universität Frankfurt. Eine Plattform für alle, die sich in Forschung, Lehre oder Studium für die pädagogische Praxis der Schule interessieren. Interview mit Dr. Helge Kminek, dem Administrator der Archivdatenbank.
- Forschungdatenzentren stellen sich vor (3): Das FDZ des Leibniz-Instituts für Bildungsverläufe. „Die NEPS-Studie ist eine große Investition, die für viele Forschungsfragen interessante Daten bietet.“ Interview mit Dr. Daniel Fuß, Arbeitsbereichsleiter des Forschungsdatenzentrums (FDZ) am LIfBi.
- Forschungdatenzentren stellen sich vor (2): Das GESIS-Datenarchiv für Sozialwissenschaften. „Heute sind viel mehr Forscher für das Thema Forschungsdaten sensibilisiert.“ Interview mit Reiner Mauer, dem stellvertretenden Leiter der GESIS-Abteilung Datenarchiv für Sozialwissenschaften.
- Forschungsdatenzentren für die Bildung stellen sich vor (1): Das FDZ am Institut für Qualitätsentwicklung (IQB)
„PISA, IGLU, TIMMS und IQB-Bildungstrends sind natürlich unsere Kassenschlager“. Interview mit Dr. Malte Jansen, wissenschaftlicher Leiter des Forschungsdatenzentrums (FDZ) am IQB