Her mit den Datenbeständen!

Das FDZ Bildung garantiert Forschenden Rechtssicherheit, Auffindbarkeit und Arbeitsersparnis

Open Data in der Bildungsforschung (1)

Seit 2012 können Bildungswissenschaftler/-innen die in ihren Projekten erhobenen Daten im Forschungsdatenzentrum Bildung (FDZ Bildung) zur Nachnutzung archivieren lassen – mitsamt den für die Erhebung notwendigen Instrumenten – oder aber die dort dokumentierten Daten selbst für eine Sekundäranalyse nutzen. INTERVIEW mit Maike Porzelt und Dr. Marius Gerecht. Die beiden erklären, um welche Forschungsdaten und -instrumente es sich  handelt, was die Forschenden davon haben, und wie das mit der Aufbereitung der Datenbestände genau funktioniert.

Das Team des FDZ Bildung: Maike Porzelt, Alexander Schuster, Dr. Doris Bambey, Anja Hemmersbach, Dr. Marius Gerecht (v.l.n.r.)

Frau Porzelt, Herr Gerecht, welche Forschungsdaten finden Wissenschaftler beim FDZ Bildung?

Maike Porzelt: Wir dokumentieren qualitative Daten der Bildungsforschung und Instrumente aus quantitativen Datenerhebungen. Bei den qualitativen Daten stellen wir aktuell 1.884 Video- und Audiodateien von Unterrichts- und Interviewsituationen und 2.288 Textdokumente, also Transkripte und Begleitmaterialien wie Interviewleitfäden, aus acht Studien bereit.

Drei Partner versammeln sich unter dem Dach des Verbunds Forschungsdaten Bildung.

Drei Partner versammeln sich unter dem Dach des Verbunds Forschungsdaten Bildung.

Die quantitativen Daten, also die Ergebnisse aus den Leistungstests, zu denen wir auch die Instrumente dokumentieren, werden von unserem Partner, dem Institut zur Qualitätsentwicklung im Bildungswesen (IQB), aufbereitet. Alle Daten eines Projektes, unabhängig von ihrem Standort, werden in unserem Online-Portal nachgewiesen, man findet sie leicht über die Metasuche unter www.forschungsdaten-bildung.de. Das IQB ist neben dem DIPF und dem Leibniz-Institut für Sozialwissenschaften GESIS auch der dritte Partner im Verbund Forschungsdaten Bildung.

Dokumentiert werden qualitative Daten und Erhebungsinstrumente quantitativer Forschung.

Marius Gerecht: In unserer Sammlung von Erhebungsinstrumenten, den sogenannten quantitativen Forschungsinstrumenten, finden sich die für eine Studie entwickelten (Original-)Fragebogen und, auch kleinteiliger, die Skalen und Items aus den Fragebogen sowie die Tests mit den einzelnen Testitems und der Testskalierung. Dieses Angebot wurde speziell für die Fragebogen und Testentwickler im Dunstkreis der empirischen Bildungsforschung entwickelt. Zurzeit sind das Datenbestände aus 14 Projekten mit insgesamt 56 Teilstudien – 5.600 Testskalen, 24.901 Fragebogenitems, sechs Kompetenztests und 211 Testitems! Das ist schon eine ganze Menge und es soll noch mehr werden!

Was haben Bildungsforscher von einem Forschungsdatenzentrum?

Marius Gerecht: Ganz einfach: Sie können ihre erhobenen Daten archivieren und bereits aufbereitete Bestände für Sekundäranalysen nutzen. Und es gibt noch mehr gute Gründe, Datenbestände dort abzugeben. Die drei wichtigsten sind Rechtssicherheit, Auffindbarkeit und Arbeitsersparnis! Für das Forschungshandeln ist Transparenz entscheidend, weil sie Forschungsergebnisse nachvollziehbar macht und Wissenschaft so vor Manipulationen schützt. Selbst Verlage achten zunehmend darauf, dass die einer Publikation zugrunde liegende Datenbasis veröffentlicht ist.

Drei Argumente für die Datenarchivierung: Auffindbarkeit, Arbeitsersparnis und Rechtssicherheit.

Suche im Datenbestand des FDZ Bildung

Suche im Datenbestand des FDZ Bildung

Ein anderer wichtiger Aspekt: Die Daten gehen nicht verloren, man weiß wo sie sind! Nach dem Wechsel an eine andere Universität oder ein anderes Forschungsinstitut stellt sich die Frage, ob erhobene Daten bei der Institution bleiben oder mitgenommen werden sollen. Sind die Daten an einem zentralen Ort dokumentiert, kann man – auch Jahre später – einfach ans FDZ Bildung verweisen! Dafür machen wir die Daten über den sogenannten Persistent Identifier, also die DOI, zitierbar. Ganz nebenbei wird die gerade in empirischen Forschungsprojekten sehr aufwändige Datenerhebung endlich auch als wissenschaftlicher Output gewürdigt. Und, nicht zu vergessen: Der Zugang zu Daten wird unabhängig von persönlichen Netzwerken und Kontakten möglich. Besonders wichtig ist das für Nachwuchskräfte, die nicht in Forschungsprojekte mit großem Budget eingebunden sind.

Forschungsdaten öffentlich zugänglich zu machen spart also Arbeit und Zeit?

Marius Gerecht: Ja! Man muss davon wegkommen, immer nur den Aufwand zu sehen, der mit der Datenaufbereitung für die Nachnutzung eventuell entsteht. Und auch eine Sekundäranalyse bereits erhobener Daten spart Zeit und Geld. Denn in der Erhebung solcher Datenbestände steckt ein Riesenaufwand, der viel zeitliche und personelle Ressourcen in Anspruch nimmt. Nicht nur für die Forscher/-innen, sondern auch für die Teilnehmenden solcher Studien. Auch für Lehrer und Schüler ist es eine Belastung, im Unterricht über längere Zeit mit Kameras beobachtet zu werden. Zudem handelt es sich bei minderjährigen Probanden um besonders schützenswerte Populationen. Eine Datennachnutzung ist eine sinnvolle Alternative, zumal das vorhandene analytische Potenzial des Materials in den begrenzten Projektlaufzeiten durch die „Primärforscher/-innen“ meist nicht voll ausgeschöpft werden kann.

Wer kann und sollte seine Forschungsdaten veröffentlichen?

Maike Porzelt: Jeder, der ein Forschungsprojekt durchführt, sollte mit dem Anspruch antreten, die Daten auch nach Ende der Laufzeit verfügbar zu machen! Im vom BMBF geförderten Rahmenprogramm zur empirischen Bildungsforschung wurde das Sichern und Zugänglichmachen der erhobenen Daten vor einigen Jahren explizit in die Förderbedingungen aufgenommen: Schon bei der Antragstellung für ein Projekt muss dargelegt werden, was mit den erhobenen Daten nach Projektende geschehen soll. Auch für DFG-Projekte gelten schon seit längerem ähnliche Richtlinien.

Was müssen Wissenschaftler genau tun, wenn sie ihre Datenbestände ans FDZ Bildung abgeben möchten?

Maike Porzelt: Sie wenden sich an den Verbund Forschungsdaten Bildung und können dort ihre Daten sichern und hochladen. Die Kolleginnen entscheiden dann, welche Datenbestände der Studie von welchem der beteiligten Datenzentren aufbereitet werden. Die Meldung erfolgt zentral, die Dokumentation dezentral – je nach Datentyp und dem dafür spezialisierten FDZ. Die Forschenden werden dann automatisch vom jeweils zuständigen FDZ kontaktiert. Der oder die Wissenschaftler/-in muss sich darum nicht kümmern.

Veröffentlichung von Forschungsdaten wird zunehmend verpflichtend.

Marius Gerecht: Die dezentrale Dokumentation kann man an der Studie Deutsch Englisch Schülerleistungen international gut verdeutlichen: Die Kompetenzmess- und Umfragedaten, also die quantitativen Daten, wurden beim IQB erschlossen, die audiovisuellen Unterrichtsdaten, also die qualitativen Daten, liegen beim FDZ Bildung. Und auch die Skalendokumentationen der Eingangsbefragung und Ausgangsbefragung – also die Instrumente – wurden in der Datenbank zur Qualität von Schule (DaQs) im FDZ Bildung aufbereitet. Querverweise auf die jeweils anderen Datenbestände werden über Links hergestellt. Als letzter Baustein fehlt hier nur noch die Dokumentation der Kompetenztests, um alle Forschungsdaten der Studie zur Nachnutzung anbieten zu können. Diesbezüglich befinden wir uns in Verhandlungen mit der KMK.

Und wie muss man die Daten für die Nachnutzung aufbereiten?

Maike Porzelt: Ein großer Teil der Arbeit bei der Aufbereitung von qualitativen Forschungsdaten ist es, den Personenbezug aus den Daten herauszunehmen. Hier gilt es aufzupassen, dem Material nicht komplett das Analysepotenzial zu nehmen! Das widerspräche ja der eigentlichen Intention, warum man Daten vorhalten soll.

Am besten ist es die Nachnutzung an jeder Stelle im Forschungsprozess mitzudenken.

Die Nachnutzung sollte an jeder Stelle des Forschungsprozesses mitgedacht werden. Das ist im Grunde kein allzu großer Aufwand, weil man sich sowieso Gedanken darüber machen muss, wie man seine Daten verwaltet. Man geht eben einen Schritt weiter und überlegt, was nach Projektende mit den Daten passieren soll. Wenn das bereits zu Projektbeginn geklärt ist, hat man die entscheidende Grundlage geschaffen und am Ende der Projektlaufzeit nicht mehr viel zu tun. Bei den Geldgebern können übrigens extra für das Datenmanagement zusätzliche Mittel beantragt werden! Die Datenbestände im Nachhinein zu sichten und aufzubereiten ist ungleich aufwändiger und komplizierter.

Marius Gerecht: Ein Beispiel fürs Mitdenken bei den Erhebungsinstrumenten sind Testitems und -skalen. Sie werden in der Regel von den Wissenschaftlern intern dokumentiert. Für eine sinnvolle Nachnutzung müssen sie aber noch einmal gesondert von uns aufbereitet werden. Zudem können diese internen Dokumentationen nach der Aufbereitung über unser Portal publiziert werden, was wiederum konkrete Formatierungsarbeiten oder die Suche nach einem Verlag erspart.

Werden die Forscherinnen und Forscher bei der Aufbereitung unterstützt?

Maike Porzelt: Klar! Wir bieten Wissenschaftlern Workshops im Forschungsdatenmanagement an. Dabei entstehen praktische Bausteine, die wir auch anderen an die Hand geben können. Außerdem haben wir Leitfäden entwickelt, an denen man sich systematisch abarbeiten kann. Wir versuchen eine Linie vorzugeben und wir merken an den Rückmeldungen, wie dankbar die Forscher dafür sind!

Workshops und Informationsangebote unterstützen Wissenschaftler beim Datenmanagement.

Wie „open“ sind die Daten des FDZ Bildung?

Maike Porzelt: Wir haben drei unterschiedliche Zugriffsstufen, je nach Anonymisierungsgrad von komplett „open“ über registrierungspflichtig bis hin zum Nutzungsvertrag – die restriktivste Stufe. Diese greift, wenn personenbezogene Datenbestände, v. a. AV-Materialien genutzt werden sollen. Wir schließen aber nicht nur mit den Nutzern Verträge ab, sondern auch mit den Lieferanten, die ja die Urheberrechte an den Daten haben. Auch die brauchen die Rechtssicherheit, dass die Bestände nur für wissenschaftliche Zwecke und unter Wahrung des Datenschutzes verwendet werden.

Marius Gerecht: Um diese datenschutzrechtlich sensiblen Datenbestände für eine Sekundäranalyse zu nutzen, muss man sein wissenschaftliches Interesse nachweisen und auch die institutionelle Anbindung angeben. Wenn man sich in der Qualifikationsphase befindet, also noch nicht promoviert ist, ist zusätzlich die Unterschrift des Betreuers notwendig. Außerdem verlangen wir noch ein Post-Ident-Verfahren, man muss sich bei der Post mit seinem Personalausweis seine Identität bestätigen lassen. Dafür übernehmen wir auch die Kosten. Ohne ein nachgewiesenes wissenschaftliches Interesse an den Daten geben wir auch keine Daten frei.

Die Datenbestände unterliegen drei verschiedenen Zugangsstufen.

Marius Gerecht: Bei den Erhebungsinstrumenten von quantitativen Studien sind die Fragebogenitems, Skalen und die dazugehörigen Kennwerte und Gütekriterien frei zugänglich. Auch bei den Kompetenztests sind fast alle Informationen frei zugänglich. Einzig die Ansicht der Testaufgaben selbst sowie die kompletten Testhefte befinden sich in einem geschützten Raum, der verschiedene Zugriffsstufen vorsieht. Eine Zugriffstufe sieht bspw. die Einwilligung des Testentwicklers vor. Er bekommt Informationen, wo und wann der Test eingesetzt werden soll, aber nicht von wem! So werden doppelte oder gleiche Einsätze vermieden und der Zugang frei von persönlichen Vorbehalten und Netzwerken ermöglicht. Wären die Testaufgaben frei zugänglich, könnten sie nicht mehr an einer anderen Schule oder Klasse eingesetzt werden – sie wären verbrannt. So gesehen sind die Bestände des FDZ Bildung nur zum (überwiegenden) Teil „open“!

Maike Porzelt, Marius Gerecht – vielen Dank für das Gespräch!


Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver


Lesen Sie auch

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert