„Auch in den Bildungswissenschaften sollte man den Umgang mit verschiedenen Datenbeständen beherrschen“

Forschungsdatenzentren stellen sich vor (7): Das Forschungsdatenzentrum des Deutschen Jugendinstituts

INTERVIEW mit Dr. Susanne Kuger, Leiterin der DJI-Abteilung Zentrum für Dauerbeobachtung und Methoden und verantwortlich für das Forschungsdatenzentrum des Deutschen Jugendinstituts (DJI). Das Deutsche Jugendinstitut führt als außeruniversitäres Forschungsinstitut seit 1988 regelmäßig empirische Studien zum Aufwachsen von Kindern und Jugendlichen sowie zu Lebenslagen von Erwachsenen und Familien durch. Das zurzeit mit 1,5 Stellen ausgestattete FDZ soll perspektivisch so weiterentwickelt werden, dass unter anderem Daten aus der amtlichen Statistik an die Datensätze der großen DJI-Studien gekoppelt werden können. Mit Susanne Kuger sprachen wir über die Ausbaupläne des FDZ und darüber, wie wichtig und fruchtbar Interdisziplinarität in den Bildungswissenschaften ist.

Dr. Susanne Kuger, Leiterin der DJI-Abteilung „Zentrum für Dauerbeobachtung und Methoden“ und verantwortlich für das Forschungsdatenzentrum des DJI

Frau Kuger, seit wann gibt es das Forschungsdatenzentrum beim DJI?

Eine erste Version wurde bereits 1988 mit dem ersten Familiensurvey aufgebaut. Wir hatten damals einen extrem sozialforschungsaffinen IT-Leiter, der für die gesamte Dokumentation der Erhebung unsere erste Datenbank, DAISY, programmierte. Über einen Terminalrechner konnten die Kolleginnen und Kollegen dann bequem in den Datenbeständen recherchieren; für die externe Nutzung wurden die Codebücher und die Datenbeschreibung damals noch ausgedruckt. Ab 2001 wurde das ganze Datenbanksystem grundlegend überarbeitet und konnte zunächst hausintern über das Intranet abgerufen werden. Nach und nach haben wir dann die Datenbestände auch für interessierte Wissenschaftler im Internet freigegeben. Seit 2013 sind wir als FDZ beim Rat für Sozial- und Wirtschaftsdaten (RatSWD) akkreditiert und folgen dessen verbindlichen Standards und Qualitätskriterien.

Welche Forschungsdaten bietet das DJI an – und wie viele?

Im Moment haben wir einen Datenpool mit Datensätzen aus etwa 100 Studien, davon bieten wir 83 Datensätze aus 43 Studien für die Sekundäranalyse an. Zurzeit konzentrieren wir uns auf die Veröffentlichung der Datenbestände der Abteilung Dauerbeobachtung und Methoden und planen nach und nach die Bestände aus Studien der anderen vier DJI-Abteilungen einzuarbeiten. Manche Kolleginnen und Kollegen am DJI arbeiten auch in Verbundprojekten, deren Daten bei anderen Forschungsdatenzentren abgelegt werden – die Datenbestände des StEG-Projekts liegen beispielsweise beim IQB in Berlin und sind auch über den Verbund Forschungsdaten Bildung recherchierbar. Wir folgen also dem Gebot des RatSWD dieselben Daten nicht an verschiedenen Stellen zu lagern und freuen uns über unseren ansonsten sehr dichten Datenbestand: Surveydaten zu den Themen Kinder, Kindheit, Jugend, Familie, zum Teil von Wissenschaftlerinnen und Wissenschaftlern, die schon seit 30 Jahren zu den Themen arbeiten!

Was sind ihre bekanntesten Daten?

Auf einen Blick: Das Forschungsdatenzentrum des DJI

Datenbestand

Aus dem Gesamtbestand von insgesamt etwa 100 Studien werden 43 Studien mit insgesamt 83 Datensätzen zur Sekundäranalyse angeboten. Darunter folgende Studien: Aufwachsen in Deutschland (AID:A), Kinderbetreuungsstudie, Übergangspanel, Kinderpanel, Politische Partizipation, Jugendsurveys, Familiensurveys. Dazu noch regionale Erhebungen etwa in städtischen Grundschulen oder Kindertagesstätten und von besonderen Berufsgruppen wie Erzieherinnen oder Tagesmüttern.

Sammelschwerpunkt

Überwiegend Daten aus Befragungen, die im DJI selbst durchgeführt wurden – meist querschnittlich angelegte repräsentative sozialwissenschaftliche Surveys von größeren Bevölkerungsgruppen in ganz Deutschland zu den Themen Kinder, Jugend und Familie.

Service

Registrierung ist mit E-Mail-Adresse über die Website und einem Nachweis, dass die Daten nur zur wissenschaftlichen Zwecken genutzt werden, möglich. Gastwissenschaftlern und Stipendiaten wird nach Bedarf Zugang zu (noch) nicht öffentlichen Datenbeständen gewährt.

Wer nutzt die Daten

Quantitativ empirisch Forschende aus verschiedenen Fachgebieten der Psychologie, Pädagogik, Soziologie sowie allen geistes- und sozialwissenschaftlichen Disziplinen; auch soziale Arbeit.

Der Klassiker sind bei uns die drei großen Surveys zu den Themen Kinder, Jugend und Familie, die bis 2003 am DJI durchgeführt wurden. Diese Studien wurden ab 2009 unter dem Label „Aufwachsen in Deutschland: Alltagswelten“ (AID:A) in einer Studie integriert und fortgesetzt. Es wundert nicht, dass der Hauptdatensatz dieser Erhebung bisher mit 486 Downloads am häufigsten abgerufen wurde. Die AID:A-Studie ist wie die zentrale „Fregatte“ in einem Schiffsverband: Es gibt Ergänzungsstudien, Add ons, Ausklinkungen und auch telefonische Nachbefragungen. Wichtig und bekannt sind aber auch die Daten der letzten Wellen des Jugendsurveys und des Kinderpanels.

Verfolgt das DJI eine konkrete Strategie, um seine Daten in der Scientific Community bekannt zu machen?

Nicht direkt (lacht), aber das Bewusstsein, offensiver mit dem eigenen Datenbestand umzugehen ist gewachsen und im letzten Jahr hat sich einiges verändert. Weil unsere Datenbestände zuerst von DJI-Wissenschaftlern – Projektmitarbeiterinnen und Doktoranden – ausgewertet werden, unterlagen sie im Durchschnitt einem Moratorium von dreieinhalb Jahren. Diese eher langen Fristen haben wir jetzt deutlich gestrafft und wollen zukünftig auf wissenschaftlichen Kongressen verstärkt auf unsere Datenbestände und die Möglichkeit der Sekundäranalyse hinweisen. Die Anzahl unserer Nutzer steigt stetig an, etwa jeden zweiten Tag geht eine neue Registrierung ein. Wir haben aktuell einen Bestand von insgesamt 1.462 Personen, die unsere Daten nutzen. In den letzten drei Jahren haben wir monatlich zwischen 15 und 20 neue Datennutzungsverträge abgeschlossen.

Wer genau fragt die Datenbestände nach?

Ich weiß von Kollegen, die die Daten für die Lehre nutzen, sie also in ihren Seminaren verteilen oder die Studierenden dazu anregen, einen eigenen Account einzurichten – das sehen wir dann an den Peaks in unseren Statistiken. Gerade in der Soziologie sind unsere Daten sehr beliebt, weil sie thematisch breit aufgestellt sind, weil es große Samples sind und weil die Erhebungen deutschlandweit repräsentativ sind. Zum Beispiel haben wir im AID:A-Survey II von 2014 mehr Spell-Daten, also Episodendaten zur Untersuchung von Erwerbsverläufen, als beispielsweise das SOEP, das Sozio-ökonomische Panel. Unser Spitzenreiter ist aber nach wie vor der Datensatz aus der ersten AID:A-Erhebungswelle von 2009, der insgesamt 750 Mal heruntergeladen wurde. Noch größer ist das Interesse an unseren Fragebögen, die zur Entwicklung neuer Studien genutzt werden – sie werden insgesamt doppelt so oft nachgefragt wie die Daten.

Welche Datensätze stoßen noch auf großes Interesse?

Die aktuellste DJI-Studie , die zweite AID:A-Welle, ist seit Herbst 2018 verfügbar und arbeitet sich langsam auf den Downloadcharts nach oben. Etwas überrascht sind wir, dass unsere Kinderbetreuungsstudie KiBS noch nicht so häufig nachgefragt wurde, obwohl das Thema in den Medien sehr präsent ist. Aber wahrscheinlich liegt es auch daran, dass wir ihn noch nicht gut genug bekannt gemacht haben (lacht).

Bitte, Sie können gerne Werbung machen!

Die Daten der ersten fünf Erhebungswellen (2012-2016) der Kinderbetreuungsstudie (KIBS) stehen zur Sekundäranalyse bereit.

Sehr gern! In dem Paneldatensatz fragen wir seit 2011 jährlich bei mittlerweile knapp 33.000 Eltern in Deutschland nach, welchen Betreuungsbedarf sie für ihre Kinder von der Geburt bis zur Grundschule, also für Krippe, Kindergarten, Hort und Nachmittagsbetreuung haben. Im letzten Jahr haben wir die Daten der ersten fünf Erhebungswellen online gestellt, es fehlen also nur noch die aus den Jahren 2017 und 2018. Dieses Jahr wird schon die achte Welle erhoben.

Welche konkreten Fragen kann man mit DJI-Datensätzen beantworten? Können Sie uns Beispiele geben?

Ja, klar! Wir haben eine Kollegin aus dem Jugendpanel, die schon in den 90er Jahren beobachtet hat, wie Jugendliche sich ehrenamtlich betätigen und politisch interessieren. Genau diese Fragen hat sie in AID:A I eingebracht und wir können nun bis in die dritte Erhebungswelle 2018 verfolgen, wie sich die politische Einstellung vom Jugend- bis ins Erwachsenenalter entwickelt – sowohl im Kohortenvergleich als auch für einen Teil der Personen im individuellen Längsschnitt. Diese Kollegin ist seit vier Monaten im Zusammenhang der „Fridays for Future“-Bewegung häufig in Interviews zu hören und zu sehen (lacht). Da haben wir es wirklich mal geschafft, ein gesellschaftlich hochaktuelles Thema mit unseren Daten anzureichern. So einen Impact bekommt man in der Wissenschaft wirklich nicht sehr oft!

„Das Besondere am DJI ist ja, dass es direkt an der Schnittstelle von Wissenschaft, Praxisberatung und Politikberatung agiert.“

Und neulich sollten wir eine Expertise verfassen als Reaktion auf eine kleine parlamentarische Anfrage zur Auswirkung der Dauer der Kindergartennutzung pro Tag. Da haben wir nicht nur eine Literaturrecherche gemacht, sondern auch in unsere Datenbestände geschaut und dem BMFSFJ vier Wochen später ein entsprechendes Papier vorgelegt, das unmittelbar in die Beantwortung eingeflossen ist.

Ersterhebung versus Sekundäranalyse. Würden Sie sagen, dass die Nachnutzung von Forschungsdaten die Freiheit der wissenschaftlichen Arbeit einschränkt?

Die Sekundäranalyse führt häufig ein gewisses Schattendasein, oft werden die Daten eher als Anschauungs- und Lehrmaterial gesehen. Dabei bieten gerade die großen Datensätze, wie wir sie am DJI haben, viel Potenzial, um Analysen zu modifizieren und neue Entdeckungen zu machen. Natürlich muss ich als Wissenschaftlerin sehr genau schauen, ob die eingesetzten Instrumente zu meiner Forschungsfrage passen, und prüfen, ob zum Beispiel die ausgewählte Stichprobe den neuen Anforderungen gerecht wird. An der Stelle beeindrucken mich die Kollegen aus der Ökonomie! Sie lernen im Graduiertenbereich von der Pike auf, welche Datenbestände es gibt, was man damit machen kann und wie Datensätze miteinander kombiniert werden können.

„Die Kombination verschiedener Datensätze birgt enormes Potenzial! Relevante Datenbestände zu kennen und damit umgehen zu lernen, müsste Bestandteil im Masterstudiengang empirische Bildungswissenschaften werden.“

Angesichts des zur Verfügung stehenden Datenmaterials lernen sie also von vornherein flexibler zu sein und ihre ursprünglichen Forschungsfragen gegebenenfalls nachzujustieren. Natürlich ist dadurch eine gewisse Limitation gegeben. Andererseits kennen sie aber die enormen Möglichkeiten und Chancen der Kombination von Datensätzen. Nehmen wir zum Beispiel mal den Schulbereich: Ich kann mit den Daten der PISA-Studie untersuchen, ob und wie sich bestimmte Prozesse auf Schulebene auswirken – zum Beispiel, ob Kooperationen der Lehrkräfte eine Bedeutung für die Leistungsstreuung der Schülerinnen und Schüler in verschiedenen Schulformen haben. Diese Ergebnisse kann ich in einem zweiten Schritt mit Informationen aus PIAAC zu Lehrerkompetenzen verbinden und in einem dritten Analyseschritt zusätzlich die Lebensumstände von Lehrern hinzuholen, indem ich aus dem SOEP die Daten zur Einkommensveränderung der Lehrer in den letzten 20 Jahren hole. Natürlich muss ich die Daten entsprechend be- und verarbeiten können, darauf achten, dass Zeiträume und Samples passen. Hinter all diesen Auswertungen stecken natürlich auch Annahmen und Unschärfen. Aber wenn alle Daten repräsentativ sind und ich mit den Grundlagen umgehen kann, muss ich nur wissen, wo ich was finde und wie ich damit umgehen kann. Ich muss quasi die Klaviatur über verschiedene Datenbestände beherrschen. Zu erkennen, dass viele Kolleginnen in der Ökonomie ihre Papers genauso schreiben, war für mich ein erhellender Moment.

Die Reihe „Forschungsdatenzentren stellen sich vor“ erfolgt in Zusammenarbeit mit dem Verbund Forschungsdaten Bildung.

Gibt es Überlegungen, das bestehende Angebot weiter zu entwickeln?

Ich denke ganz klassisch in Zwei-, Fünf- und Zehn-Jahresplänen. In zwei Jahren wünsche ich mir, dass das FDZ technisch und personell so solide aufgestellt ist, dass die Kollegen nicht mehr am oberen Limit arbeiten müssen und trotzdem noch weitere wertvolle Datensätze aus früheren DJI Erhebungen aufarbeiten können. In fünf Jahren sollte das FDZ mit unserer Regionaldatenbank verzahnt sein; sie hält amtliche Statistiken für den kompletten Bereich Kinder, Jugend und Familie wo immer möglich bis zur Gemeindeebene seit 1986 bereit. Die Daten können zwar beim statistischen Bundesamt nachgefragt werden, werden bei uns jedoch über die verschiedenen Bundesländer vereinheitlicht und weiterentwickelt. Aufgrund gesetzlicher Vorgaben können wir sie nicht einfach zum Download zur Verfügung stellen. Unser Ziel ist es deshalb, regional kleinräumige Informationen so aufzubereiten, dass man sie ohne rechtliche Vorgaben zu verletzen im Hintergrund angematcht an Datensätze wie AID:A oder KIBS auswerten kann, um regionenspezifische Analysen und Planungsgrundlagen zu ermöglichen. In zehn Jahren hätte ich dann alles gerne online abrufbar – ähnlich wie die OECD mit ihrem Data Miner, über den man Studienergebnisse und Daten abrufen kann. Dazu brauchen wir natürlich mehr Kapazitäten – ich werde also demnächst mit der Akquise der Projektgelder anfangen müssen (lacht).

Vielen Dank für das Gespräch, Frau Kuger!


Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver


Auch noch interessant:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.