Forschungsdatenzentren stellen sich vor (11): Forschungsdaten und Forschungsdatenmanagement beim Deutschen Institut für Erwachsenenbildung – Leibniz-Zentrum für Lebenslanges Lernen (DIE)
INTERVIEW mit Hella Huntemann und Harald Kaluza vom Deutschen Institut für Erwachsenenbildung (DIE) über das Engagement des Leibniz-Zentrums für Lebenslanges Lernen in den Bereichen Forschungsdaten und Forschungsdatenmanagement. Zwei Säulen bestimmen die Arbeit an und mit Forschungsdaten im Institut: Am DIE erhobene Anbieterstatistiken wie die Volkshochschul-Statistik (VHS-Statistik) und der 2017 begonnene systematische Aufbau eines Forschungsdatenmanagements für die institutseigenen Projekte.
Fangen wir mit der Volkshochschul-Statistik an, Frau Huntemann. Können Sie uns kurz beschreiben, was da so alles erfasst wird?
Hella Huntemann: Zunächst mal: Die Volkshochschul-Statistik gibt es schon seit 1962, also fast 60 Jahre! Es gibt keine anderen Datenbestände zur Weiterbildung über einen so langen Zeitraum in Deutschland wie die Paneldaten unserer VHS-Statistik. Sie basieren auf einer freiwilligen Befragung, an der von Beginn an weit über 95 Prozent der Volkshochschulen teilnehmen, also eine klassische Vollerhebung! Auch 2020 haben wir, trotz Corona, eine Beteiligung von 99 Prozent erreichen können. Was bietet die Statistik? Nach Themen geordnete Veranstaltungsdaten und institutionelle Daten, Daten zu Personal und zu Finanzen der Volkshochschulen in Deutschland. Die Daten selbst stehen als Scientific-Use-Files ab 1987 zur Verfügung. Seit 2017, also seitdem wir am DIE beschlossen haben, systematisch auch die in den Institutsprojekten erhobenen Forschungsdaten zur Nachnutzung anzubieten, bereiten wir die Datensätze nach heutigen Maßgaben und Kriterien des Forschungsdatenmanagements auf – wir dokumentieren und beschreiben die Daten, anonymisieren sie, versehen sie mit Metadaten und fügen Referenzdaten hinzu. Aber dazu wird Herr Kaluza, der für das Forschungsdatenmangement zuständig ist, Ihnen sicher gleich mehr erzählen.
Neben der VHS-Statistik gibt es noch eine weitere Weiterbildungsstatistik, die am DIE erarbeitet wird?
Hella Huntemann: Ja, wir kooperieren mit den Verbänden der katholischen, der evangelischen und der gewerkschaftlichen Erwachsenenbildung. Die Daten aus den insgesamt rund 1.500 Einrichtungen dieser Träger und die Daten der VHS-Statistik bilden den Verbund Weiterbildungsstatistik. Insgesamt erheben wir also vier Statistiken, die wir Wissenschaftlerinnen und Wissenschaftlern zur Verfügung stellen können. Scientific-Use-Files mit Daten auf Einrichtungsebene bieten wir allerdings derzeit nur für die VHS-Statistik an; aber auf Anfrage stellen wir auch nach Bundesländern aggregierte Daten der anderen drei Verbände zur Verfügung.
Auf einen Blick: Die Forschungsdaten des DIE
Datenbestand
- Die Volkshochschul-Statistik bietet umfangreiche Daten in Zeitreihen seit 1962. Ab 1987 als Scientific-Use-Files.
- Im Verbund Weiterbildungsstatistik veröffentlichen die kooperierenden Verbände Bundesarbeitskreis Arbeit und Leben, Deutsche Evangelische Arbeitsgemeinschaft für Erwachsenenbildung, Katholische Bundesarbeitsgemeinschaft Erwachsenenbildung und Deutscher Volkshochschul-Verband ihre Daten zu einem zentralen gemeinsamen Merkmalskern.
- Im alphamonitor wurden im Rahmen der trägerübergreifenden Anbietererhebung Informationen zu Anbietern und Angeboten im Bereich der Alphabetisierung und Grundbildung erhoben.
- Scientific-Use-File zu Forschungsdaten des Projekt CiLL – Begleitstudie zur deutschen PIAAC-Erhebung inklusive Erweiterung der Stichprobe auf Personen bis zum 80. Lebensjahr
Sammelschwerpunkt
- Volkshochschul-Statistik mit umfangreichen Daten in Zeitreihen seit 1962. Die Beteiligung liegt mit über 900 Einrichtungen bei nahezu 100 Prozent.
- Verbund Weiterbildungsstatistik: Gemeinsame Statistik von Bundesarbeitskreis Arbeit und Leben (BAK AL), Deutsche Evangelische Arbeitsgemeinschaft für Erwachsenenbildung (DEAE), und Katholische Erwachsenenbildung Deutschland (KEB) und Volkshochschul-Statistik.
Service
Standardisiertes Antragsverfahren (max. 10 Minuten) für Scientific-Use-Files; Aufenthalte für Gastwissenschaftler*innen; inhaltliche und methodische Beratung zu den Daten. Das große Metadaten-Portal enthält detaillierte Inhaltsbeschreibungen sowie Klassifikationen nach Berufen, Soziodemografie, Wirtschaftszweigen und Regionen.
Wer nutzt die Daten?
Wissenschaftler*innen aus den Wirtschafts-, Sozial- und Erziehungswissenschaften, auch aus Psychologie und Arbeitsmedizin.
Wer fragt die Daten nach?
Hella Huntemann: Bei der VHS-Statistik gibt es eine lange Tradition der Nachfrage auch und vor allem aus der Praxis. Die Daten werden hier zum Beispiel für das Benchmarking oder andere Vergleiche genutzt. Darüber hinaus haben wir sehr unterschiedliche Nutzergruppen, die sich für Weiterbildung interessieren. Neben der Praxis vor allem Presse, Politik und zunehmend auch die Wissenschaft. Und weil unsere Nutzergruppen so vielfältig sind, müssen wir unsere Erhebungsinhalte und Datenzugänge auch immer wieder überarbeiten, und dies an unsere Datenmelder, die Volkshochschulen, zurückspiegeln. Auch sie müssen von neuen Produkten oder Schnittstellen profitieren können, damit sie weiterhin ihre Daten regelmäßig erheben und uns melden. Um eine solche Vollerhebung bei freiwilliger Beteiligung überhaupt am Laufen halten zu können, muss man sehr viel investieren!
Gibt es Themen, zu denen besonders gern oder viel geforscht wird?
Hella Huntemann: Spezielle oder besonders herausragende Themen gibt es eigentlich nicht. In 2020 gab es einige Projektanfragen zum kulturellen Angebot im ländlichen Raum, zu dem Daten regional und überregional ausgewertet wurden. Auch die Professionalisierung von Weiterbildungspersonal über einen längeren Zeitraum war ein gern bearbeitetes Thema; die Daten wurden genutzt, um die Entwicklung von Berufsprofilen in der Weiterbildung zu untersuchen.
„Es gibt eine große Bandbreite an Themen und Fragestellungen.“
Auch Veranstaltungen sind ein gefragtes Thema; hier dreht sich vieles darum, wie sich der Gesundheitsbereich, die kulturelle oder die politische Bildung entwickeln. Auch Sprachen sind immer interessant. Einmal hatte ich einen Anruf von einem Destatis-Mitarbeiter, der VHS-Finanzen als Grundlage zur Beantwortung einer EU-Anfrage zum Staatsdefizit nutzte. Aber im Grunde sticht kein Thema oder Bereich besonders hervor.
Wie entwickelt sich das Interesse der Bildungsforschung an VHS-Statistik?
Hella Huntemann: In der Erwachsenen-/Weiterbildungsforschung wächst das Interesse an empirischen quantitativen Daten. Es nehmen zum Beispiel die Anfragen von Master-Studenten zu. Das zeigt deutlich, dass sich etwas ändert. Es ist auch erfrischend, dass bei diesen Anfragen immer von einem ganz einfachen und schnellen Datenzugriff ohne Hürden ausgegangen wird. Das gefällt mir sehr gut und weist in die Zukunft!
„Die Erwartung einfach und schnell auf Forschungsdaten zugreifen zu können, wird den ganzen Bereich voranbringen.“
Ansonsten versuchen wir das Interesse an Forschungsdaten respektive der VHS-Statistik weiter zu stärken. Beispielsweise könnte die Programmanalyse des Projekts RetroPro „Retrodigitalisierung und Vernetzung des Volkshochschul-Programmarchivs“ gut auch mit der VHS-Statistik verbunden werden.
Wie viele Anfragen verzeichnen Sie denn im Jahr?
Hella Huntemann: Meist kommen die Wissenschaftlerinnen und Wissenschaftler auf uns zu und vereinbaren für ausgewählte Jahre vertraglich die Nutzung von Scientific-Use-Files; viele rufen aber auch einfach an, beschreiben ihr Forschungsprojekt und wollen wissen, welche unserer Daten für ihre Fragestellung am geeignetsten wären. Ein großer Teil unserer Arbeit besteht darin, zu beraten und Daten für spezielle Forschungsfragen aufzubereiten. Dazu bieten wir auch einen Auswertungsservice an.
Herr Kaluza, das DIE engagiert sich auch sehr im Forschungsdatenmanagement.
Harald Kaluza: Wir haben 2017 angefangen, unsere Forschungsdaten-Policy zu implementieren und erste Projekte in der Antragsphase zu begleiten, die dann um 2018 herum bewilligt wurden. Diese Projekte sind jetzt erst in der Schlussphase, deshalb können wir auch noch keine Datensätze zur Nachnutzung anbieten. Aber auch wenn es erst dieses Jahr so richtig losgehen wird, freue ich mich jetzt schon, die Datenbestände zu präsentieren. Denn viele Projektanträge waren erfolgreich und haben auch die zusätzlichen Mittel für Forschungsdaten beantragen können. AIIerdings wird im Institut noch grundsätzlich geklärt, ob die Datensätze sofort zum Projektende zur Nachnutzung freigegeben werden, oder ob solange gewartet wird, bis die Projektmitarbeiter selbst alle ihre Forschungsergebnisse veröffentlicht haben. Mit viel Optimismus können wir Ende 2021 aber mit Forschungsdaten aus fünf Projekten rechnen.
Wie unterstützen Sie Ihre Kolleginnen und Kollegen beim Forschungsdatenmanagement?
Harald Kaluza: Wir beraten derzeit 22 Projekte, neben Promotionsprojekten auch typische Drittmittelprojekte. Dabei dauern die initialen Beratungsprozesse meist länger, vor allem wenn die Kollegen vorher noch nichts mit Forschungsdatenmanagement zu tun hatten. Da fängt man ganz von vorne an, erklärt, was ein Datenmanagementplan ist und wozu man das überhaupt macht. Einige Leute hatten schon mal davon gehört, wussten aber nichts Genaues, andere waren gleich gewillt, mitzumachen.
„Ausschlaggebend ist, dass der Drittmittelgeber ein Forschungsdatenmanagement einfordert und dafür auch zusätzliches Geld bewilligt.“
Wie nehmen die Forschenden Ihr Angebot insgesamt an?
Harald Kaluza: Die Policy hat sich nach und nach im Haus immer weiter durchgesetzt. Ein wichtiger Faktor für die Akzeptanz war die Datenschutzgrundverordnung, die bei vielen Leuten für Unsicherheit gesorgt hat. Dass ich die Kolleginnen dabei auf den richtigen Weg bringen konnte, weil rechtliche Fragen eben auch Teil des Forschungsdatenmanagements sind, hat mir viele Türen geöffnet. Dennoch herrscht trotz dieser Erfolge immer noch eine gewisse Skepsis, weil das Forschungsdatenmanagement als Mehrarbeit wahrgenommen wird. Aber es handelt sich ja um Arbeiten, die auch so zu erledigen sind!
„Für mich ist gutes Forschungsdatenmanagement gutes Projektmanagement.“
Gerade bei Kooperationsprojekten hilft es, vernünftig an einer gemeinsamen Datenbasis zu arbeiten. Also: Die Akzeptanz wird immer größer, aber es ist immer noch ein langer Weg!
Welcher Art sind denn die Daten, die bei DIE-Projekten erhoben werden?
Harald Kaluza: Alle Datentypen, die man sich in der empirischen Bildungsforschung vorstellen kann. Das DIE erhebt in seinen Studien qualitative ebenso wie quantitative Daten, es gibt auch Mixed-Method-Studien. Angefangen bei Befragungen in Museen und Unterrichtsbeobachtungen in Volkshochschulkursen bis hin zu Analysen von Lernprozessen – zum Beispiel mittels Eye-Tracking-Verfahren erhobene Muster bei der Nutzung von Lerninhalten in Videos.
Werden die Daten aller Projekte für eine Sekundäranalyse aufbereitet?
Harald Kaluza: In unserer Policy haben wir festgelegt, dass die Entscheidung, ob erhobene Daten zur Nachnutzung zur Verfügung gestellt werden, der jeweiligen Projektleitung obliegt. Grundsätzlich ist aber jedes Projekt verpflichtet, sich zumindest mit dem Thema zu beschäftigen.
Wovon ist es abhängig, ob man ein Projekt zur Nachnutzung verfügbar macht?
Harald Kaluza: Natürlich spielen dabei Faktoren wie der erwartete Impact eines Projekts und der Aufwand für die Datenaufbereitung eine Rolle. Man kann nicht jeden qualitativen Datensatz komplett durchanonymisieren. Es muss abgewogen werden, ob etwa bei Mixed Methods-Studien nur Teile eines Projektes genommen werden. Bei qualitativen Daten ist das sehr viel schwieriger als bei quantitativen, da man letztere leichter anonymisieren kann. Eine Unterrichtsbeobachtung mit allen Rechtsfragen, die zu klären, und Einwilligungserklärungen, die einzuholen sind, Dritten zur Verfügung zu stellen, ist ziemlich viel Arbeit. Als Forschungsdatenmanager kann ich da nur beraten; die Entscheidung selbst müssen die Projektverantwortlichen auf Basis der Beratung und im Sinne der DIE-Forschungsstrategie selbst treffen und im Zweifelsfall gegenüber dem Drittmittelgeber vertreten.
Was passiert mit den aufbereiteten Datensätzen?
Harald Kaluza: Unsere Infrastruktur reicht nicht aus, um die Daten selbst zu hosten. Deshalb werden wir die Datensätze über den Verbund Forschungsdaten Bildung veröffentlichen, wo sie gehostet und archiviert werden. Wir selbst werden dann lediglich die Metadaten präsentieren und den Weg zum entsprechenden Repositorium weisen. Zumindest ist das der Plan, der sich in der Praxis noch beweisen muss (lacht). Wir sind jedenfalls froh, als eher kleineres Institut, dessen infrastrukturelle Ausstattung sich nicht mit der des DIPF oder von GESIS vergleichen lässt, Partner des Verbunds Forschungsdaten Bildung zu sein und so an den neuesten Entwicklungen dranbleiben und von guten Lösungen profitieren zu können.
Zum Abschluss noch ein kurzer Blick in die Zukunft?
Harald Kaluza: Neben der konkreten Arbeit haben wir natürlich auch „das große Ganze“ im Blick – Stichwort „Fair Data“. Wir wollen aktiv mitwirken und uns weiter professionalisieren. So bringen wir uns beispielsweise in dem BMBF-Projekt DDP Bildung (Domain Data Protokolle für die empirische Bildungsforschung) ein, bei dem es um die Standardisierung von Datenmanagementplänen geht. Außerdem wollen wir das Forschungsdatenmanagement als einen selbstverständlichen Teil der wissenschaftlichen Forschung im DIE implementieren. Wir müssen also einfach dranbleiben und mit den Aufgaben wachsen. Angesichts des hochdynamischen Umfelds, in dem sich das Forschungsdatenmanagement bewegt, ist das eine große und schöne Herausforderung. Perspektivisch wollen wir die Dienstleistungen auch für die gesamte Erwachsenenbildung in Deutschland anbieten. Es hat tatsächlich auch schon Beratungen für externe Projekte gegeben.
Wo sehen Sie künftige Herausforderungen, Frau Huntemann?
Hella Huntemann: Bei mir liegen Fragen zur technischen Handhabung und Verbreitung der Daten ganz oben. Das fängt an mit den immer größer werdenden Datenmengen; und geht weiter damit, ob uns zukünftige technische Entwicklungen zu Anpassungen und Überarbeitungen zwingen werden. Ganz wichtig ist mir auch, mit unseren Nutzerinnen und Nutzern ins Gespräch zu kommen und mehr darüber zu erfahren, welche Informationen sie in welcher Form benötigen. Nur so können wir unsere Daten angemessen aufbereiten.
„Unser Angebot entwickelt sich mit der Nachfrage – man wächst einfach mit.“
Wir müssen einfach am Ball bleiben und uns laufend orientieren, welche technischen Lösungen wir brauchen, um unsere Daten ins digitale Zeitalter überführen und sie „à jour“ halten zu können. Und weil die Technik sich so rasend schnell weiterentwickelt, muss sie gleichberechtigt zur inhaltlichen Arbeit gesehen werden. Das ist – auch aus finanziellen Gründen – leider nicht immer der Fall.
Frau Huntemann und Herr Kaluza – vielen Dank für das Gespräch!
Hella Huntemann arbeitet im Bereich Forschungsinfrastrukturen des DIE und hat die Leitung Statistik inne.
Harald Kaluza ist Referent für Forschungsinfrastrukturen und Fachinformation am DIE und zuständig für das Forschungsdatenmanagement im Institut.
Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver
Auch noch interessant:
- Forschungsdatenzentren stellen sich vor (9): „Wir bieten Wissenschaftlern Zugang zu hochqualitativen Mikrodaten“. INTERVIEW mit Dr. Jan Goebel, Leiter des Forschungsdatenzentrums des Sozio-oekonomischen Panels am DIW Berlin (FDZ SOEP).
- Forschungsdatenzentren stellen sich vor (8): „Mit unseren Datenbeständen kann man eine Fülle von Forschungsfragen bearbeiten“. INTERVIEW mit Dana Müller, Forschungsbereichsleiterin beim Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung (IAB).
- Forschungsdatenzentren stellen sich vor (7): „Auch in den Bildungswissenschaften sollte man den Umgang mit verschiedenen Datenbeständen beherrschen“. INTERVIEW mit Dr. Susanne Kuger, Leiterin der DJI-Abteilung Zentrum für Dauerbeobachtung und Methoden und verantwortlich für das Forschungsdatenzentrum des Deutschen Jugendinstituts (DJI).
- Forschungsdatenzentren stellen sich vor (6): Das Archiv „Deutsches Gedächtnis“ Soziale Herkunft und Bildungswege in den biografischen Interviews des Archivs „Deutsches Gedächtnis“. Interview mit der Leiterin Dr. Almut Leh
- Forschungdatenzentren stellen sich vor (5): „Forschungsdatenzentren können Reproduzierbarkeit von Forschung unterstützen“.Interview mit Dr. Karsten Stephan, dem Leiter des Forschungsdatenzentrums für Hochschul- und Wissenschaftsforschung
- Forschungdatenzentren stellen sich vor (4): Das Archiv für pädagogische Kasuistik an der Goethe-Universität Frankfurt. Eine Plattform für alle, die sich in Forschung, Lehre oder Studium für die pädagogische Praxis der Schule interessieren. Interview mit Dr. Helge Kminek, dem Administrator der Archivdatenbank.
- Forschungdatenzentren stellen sich vor (3): Das FDZ des Leibniz-Instituts für Bildungsverläufe. „Die NEPS-Studie ist eine große Investition, die für viele Forschungsfragen interessante Daten bietet.“ Interview mit Dr. Daniel Fuß, Arbeitsbereichsleiter des Forschungsdatenzentrums (FDZ) am LIfBi.
- Forschungdatenzentren stellen sich vor (2): Das GESIS-Datenarchiv für Sozialwissenschaften. „Heute sind viel mehr Forscher für das Thema Forschungsdaten sensibilisiert.“ Interview mit Reiner Mauer, dem stellvertretenden Leiter der GESIS-Abteilung Datenarchiv für Sozialwissenschaften.
- Forschungsdatenzentren für die Bildung stellen sich vor (1): Das FDZ am Institut für Qualitätsentwicklung (IQB)
„PISA, IGLU, TIMMS und IQB-Bildungstrends sind natürlich unsere Kassenschlager“. Interview mit Dr. Malte Jansen, wissenschaftlicher Leiter des Forschungsdatenzentrums (FDZ) am IQB