„Heute sind viel mehr Forscher für das Thema Forschungsdaten sensibilisiert“

Forschungdatenzentren stellen sich vor (2): Das GESIS-Datenarchiv für Sozialwissenschaften

Das GESISLeibniz-Institut für Sozialwissenschaften ist mit über 300 Mitarbeiterinnen und Mitarbeitern in Mannheim und Köln die größte deutsche Infrastruktureinrichtung für die Sozialwissenschaften. Das Datenarchiv für Sozialwissenschaften, heute eine Abteilung von GESIS, wurde 1960 unter dem Namen „Zentralarchiv für Empirische Sozialforschung“ gegründet und ist mit seinen ca. 70 Mitarbeiterinnen und Mitarbeitern eine zentrale Infrastruktureinrichtung zur Registrierung, Aufbereitung, Dokumentation und Archivierung von quantitativen Forschungsdaten. Diese ermöglichen nationale, internationale und historische Analysen gesellschaftlicher Entwicklungen. Das Datenarchiv der GESIS ist eines der ältesten und größten für die empirische Sozialforschung weltweit. INTERVIEW mit Reiner Mauer, Stellvertretender Leiter der GESIS-Abteilung Datenarchiv für Sozialwissenschaften.

Reiner Mauer, Stellvertr. Leiter der GESIS-Abteilung Datenarchiv für Sozialwissenschaften

Herr Mauer, was genau macht das GESIS-Datenarchiv für Sozialwissenschaften?

Im Grunde haben wir drei Aufgaben: Wir unterstützen einzelne Forschende, große und kleine Projekte, aber auch Institutionen beim Management von Forschungsdaten und bieten eine Vielzahl entsprechender Services in den Bereichen Data Sharing und Archivierung. Wir unterstützen Forschende bei der Sekundäranalyse, indem wir Daten zugänglich, durchsuchbar und erfahrbar machen, und helfen geeignete Forschungsdaten zu finden; und wir bieten an die Bedarfe der Forschenden angepasste Informations-, Beratungs- und Schulungsangebote an. Zu den Themen Forschungsdatenmanagement und Langzeitarchivierung halten wir zum Beispiel regelmäßig mehrtägige Workshops ab, kürzere Workshops und Vorträge auch direkt vor Ort an Universitäten oder auf Konferenzen und Summer Schools. Wir betreiben also ein recht großes Investment in die Community, damit die produzierten Daten eine größere Wirkung entfalten können. Unser Hauptziel ist, dass vorhandene Forschungsdaten optimal genutzt werden und nicht irgendwo in Schubladen verschimmeln.

Sie sind also viel im Bereich Wissenstransfer unterwegs?

Ja, das ist auch unser Part im Rahmen des Verbunds Forschungsdaten Bildung. Neben Schulungen und Trainings zum Datenmanagement bieten wir neuerdings auch Webinare an; das erste findet übrigens im Dezember statt zum Thema „Daten teilen – Wo fange ich an? Forschungsdatenmanagement in der empirischen Bildungsforschung“. Und weil wir selbst nicht die ganze Szene bedienen können, wollen wir noch ein Train-the-Trainer-Modul für Datenmanagement entwickeln und ausbauen.

Wie groß ist denn der Bestand des GESIS-Datenarchivs? Und wie setzt er sich zusammen?

Wir haben ungefähr 6.000 Studien in unserem Archiv. Allein im letzten Jahr haben wir 63.000 Datensätze an Nutzende weltweit ausgeliefert! Und dass 60% unserer Nutzenden nicht aus Deutschland kommen, hat was mit der Struktur des Bestands zu tun: Wir haben einen Schwerpunkt in der interkulturell-vergleichenden Sozialforschung und sind bei großen internationalen Surveys für die zentrale Archivierungsinfrastruktur zuständig.

Sind die Datenbestände im GESIS-Datenarchiv auch für Bildungsforscher/innen interessant?

Unsere Angebote richten sich primär an Wissenschaftlerinnen und Wissenschaftler, die mit Methoden der empirischen Sozialforschung arbeiten. Unsere Nutzerinnen und Nutzer kommen hauptsächlich aus der Soziologie, der Politikwissenschaft und zu einem geringeren Anteil auch aus verwandten Gebieten wie etwa den Wirtschaftswissenschaften. Aber auch die relativ gesehen eher kleine Nutzergruppe der Erziehungswissenschaftler wird bei uns fündig, denn wir haben einen gar nicht so kleinen Bestand an Daten, die auch für die Bildungsforschung interessant sind. Genau lässt sich das nicht quantifizieren. Die Multidisziplinarität der Bildungsforschung und die Vielfalt der untersuchten Fragestellungen spiegeln sich natürlich auch in unserem Datenbestand wieder. Wir haben sicher einige hundert Studien im Bestand, die auch für diese Disziplin relevant sein könnten. Neben Studien, die man zweifelsfrei der Bildungsforschung zuordnen kann, wie etwa der Monitor Digitale Bildung, der sich mit dem Einsatz von digitalen Lernformen und Lernkonzepten in der Schule befasst, haben wir viele Studien, die man nicht so ohne weiteres direkt der Bildungsforschung zuordnen würde, die aber sicher für den ein oder anderen Bildungsforschenden von großem Interesse sind. Dazu würde ich beispielsweise TwinLife zählen. Das ist eine auf zwölf Jahre angelegte repräsentative verhaltensgenetische Studie zur Entwicklung von sozialen Ungleichheiten. Darüber hinaus gibt es viele weitere Studien, wie etwa die Eurobarometer der Europäischen Kommission, die thematisch so breit aufgestellt sind, dass auch dieser Bestand für einzelne Fragestellungen relevante Informationen bereithält.

„Die PIAAC-Studie der OECD ist unsere wichtigste und größte Studie im Bildungsbereich.“

Die GESIS war bei PIAAC in Person von Prof. Dr. Beatrice Rammstedt und ihrem Team zentral an der Datenerhebung und der anschließenden Aufbereitung und Dokumentation der Daten beteiligt. Und weil die an Design und Erhebung beteiligte Gruppe einen sehr guten Service für Nachnutzende bieten kann, werden die Daten in einem eigens bei uns eingerichteten FDZ PIAAC vorgehalten.

Und wie sieht es mit der Nutzung der Datenbestände aus?

Auf 15% unseres Bestandes konzentriert sich 90% der Nutzung. Das heißt im Umkehrschluss aber nicht, dass die anderen Daten nicht genutzt würden. Für 2016 kann ich sagen, dass pro Jahr die Hälfte unseres Bestandes mindestens einmal genutzt wurde.

„Große, internationale Erhebungen haben zigtausende Nachnutzungen pro Jahr.“

Es gibt also viele Studien, die wenig genutzt werden, das heißt aber nicht, dass sie nicht relevant sind – eine klassische Falle bei rein quantitativ orientierten Indikatoren. Ein bisschen zugespitzt formuliert: Wenn eine Studie nur einmal nachgenutzt wurde, dies aber eine Einsicht brachte, die über eine spätere Publikation zum Nobelpreis führte, dann hat sich das Investment in die Archivierung mehr als gelohnt.

Gibt es Eigenschaften, die darauf hinweisen, ob eine Studie später viel nachgenutzt wird?

Viele große Studien sind von vornherein auf mögliche Sekundäranalysen so konzipiert, dass möglichst viele Fragestellungen bearbeitet werden können. Und für eher forschergetriebene Erhebungen gilt: Nicht zu enge oder zu spezialisierte Forschungsfragen und Offenheit im Zugang. Je höher die Zugangsbeschränkungen der Datensätze sind, desto weniger Nutzer finden sich dafür. Dann noch das Studiendesign an sich, methodische Fragen und die Themenstellung. Aber am Ende ist es nicht wirklich vorhersehbar. Wir haben Studien, die liegen zehn Jahre im Archiv, und auf einmal werden sie nachgefragt.

Und wie werden sie der Datenmengen Herr?

Die Reihe „Forschungsdatenentren stellen sich vor“ erfolgt in Zusammenarbeit mit dem Verbund Forschungsdaten Bildung.

Auch eine große Infrastruktureinrichtung wie GESIS kann nicht alle Daten, die in der Sozialwissenschaft Deutschlands produziert werden, gleichermaßen hochwertig aufbereiten und dokumentieren. Um mit unseren Ressourcen das höhere Aufkommen zu verarbeiten, haben wir für die Bestände unterschiedliche Qualitäts- und Servicestufen definiert: Das fängt an bei niedrigschwelligen Angeboten, bei denen Forschende selbständig ihre Daten in Plattformen eingeben können, und reicht bis zum oben beschriebenen, sehr komplexen Datenmanagementprozess.

Die GESIS ist ja auch sehr stark international engagiert.

Ja, wir sind beispielsweise schon seit den 70er Jahren Teil des Consortiums of European Social Science Data Archives (CESSDA), das sich vor kurzem zu einem sogenannten European Research Infrastructure Consortium (ERIC) weiterentwickelt hat. Hier arbeiten wir mit 15 Datenanbietern aus ganz Europa am Aufbau einer gemeinsamen Infrastruktur. In diesem Kontext spielt auch der Verbund Forschungsdaten Bildung für uns eine große Rolle, da wir dort ebenfalls ganz konkret und operativ mit anderen Datenzentren zusammenarbeiten – und da lernen wir sehr viel, denn die Prozesse auf nationaler Ebene unterscheiden sich in dieser Hinsicht nicht allzu sehr von denen auf europäischer Ebene.

„Das Föderieren von Infrastrukturen ist für uns enorm lehrreich und strategisch bedeutsam.“

Wir können gemeinsam entwickelte Angebote und Standards mitsamt den dahinterliegenden Arbeitsabläufen und rechtlichen Rahmenbedingungen auf einer sehr praktischen, sehr konkreten Ebene ganz nah am Nutzer erproben und ausbauen.

Welche Entwicklungen werden aus Ihrer Sicht in den nächsten Jahren noch wichtig werden?

In den letzten Jahren zeigt sich in den Sozialwissenschaften ein zunehmendes Interesse an digitalen Verhaltensdaten, vor allem um sie mit den bestehenden Daten zu verbinden. Auch wir haben damit begonnen, erste Datenbestände aufzubauen und zu lernen, wie man damit umgeht.

„Digitale Verhaltensdaten, wie sie etwa durch die Nutzung von Facebook, Twitter oder Smartphones entstehen, werden immer wichtiger.“

Überhaupt spielt das Thema Datenverlinkung – zum Beispiel mit raumbezogenen Daten – für uns eine große Rolle. Stichwort „Geofachdaten“: In einem Pilotprojekt hat GESIS zum Beispiel Daten zur subjektiven Lärmbelästigung punktgenaue objektive Daten der Lärmbelastung gegenübergestellt. Die Möglichkeit für solche raumbezogenen Analysen muss infrastrukturell vorbereitet werden. Klar ist jedenfalls, dass die Datenproduktion weiter zunehmen wird, denn es gibt immer mehr Daten und vor allem neue Formen von Daten, die für Wissenschaftler relevant sind.

Herzlichen Dank für das Gespräch, lieber Herr Mauer!


Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver


Auch noch interessant:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert