„Fragen der Berufsausbildung lassen sich mit unseren Forschungsdaten hervorragend bearbeiten“

Forschungsdatenzentren stellen sich vor (10): Das Forschungsdatenzentrum des Bundesinstituts für Berufsbildung

INTERVIEW mit Dr. Holger Alda, Arbeitsbereichsleiter des Forschungsdatenzentrums im Bundesinstitut für Berufsbildung (BIBB), das ausschließlich quantitative Daten aus den institutseigenen Forschungsprojekten zur Nachnutzung anbietet. Das sind meist Surveys, also Untersuchungen oder Umfragen, die einen Überblick über bestimmte Themen der Berufsbildungsforschung schaffen sollen. Wie zum Beispiel die Betriebs- und Personendaten, die den Erwerb und die Verwertung beruflicher Qualifikationen im Lebenslauf abbilden. Wer sich also dafür interessiert, wann und wie sich junge Menschen für einen Ausbildungs- und Berufsweg entscheiden, und ob die in der Ausbildung erworbenen Fähigkeiten für eine dauerhafte Beschäftigung in Betrieben ausreichen, ist mit den beim BIBB vorhandenen Forschungsdaten bestens bedient.

Herr Alda, beschreiben Sie uns kurz den Datenbestand des BIBB?

Wir haben Betriebs- und Personendaten im Quer- und Längsschnitt, die den Erwerb und die Verwertung beruflicher Qualifikationen darstellen. Sie bilden idealtypische Stationen im Lebenslauf ab, also Phasen, in denen man sich berufliche Qualifikationen aneignet oder sie verwertet. In der Berufsbildung spricht man vom „Zwei-Schwellen-Modell“: Zuerst gehen Personen in die Schule und überlegen, ob sie Abitur machen und auf die Universität gehen oder eine Ausbildung machen wollen, welchen Ausbildungsberuf sie erlernen möchten und welchen sie bekommen können. Dazu kommen jede Menge Daten, die sich mit der Berufsausbildung an sich beschäftigen, jeweils von der Personenseite und der Betriebsseite aus gesehen.

„Unsere Betriebs- und Personendaten bilden den Erwerb und die Verwertung beruflicher Qualifikationen im Lebenslauf ab.“

Bei den Datenbeständen zur zweiten Schwelle geht es dann um den Übergang von der Ausbildung in den Beruf, und Datensätze zu Berufstätigkeit und Weiterbildung bilden schließlich die Verwertbarkeit und Weiterentwicklung beruflicher Qualifizierung ab.

Was sind ihre bekanntesten Daten?

Auf der Personenseite sind es auf jeden Fall die Erwerbstätigenbefragungen, die das BIBB in Kooperation mit der Bundesanstalt für Arbeitsschutz und Arbeitsmedizin (BAuA) alle sechs Jahre mit sehr hohen Fallzahlen – in der Regel werden 20.000 Beschäftigte gefragt – erhebt. Die Befragungen, die es übrigens schon seit 1979 gibt, spiegeln eigentlich das ganze Potpourri rund um berufliche Bildung und ihre Anwendung am konkreten Arbeitsplatz wider: Welche Qualifikationen haben die Personen erworben? Welche Qualifikationen brauchen sie tatsächlich in ihrer aktuellen Berufstätigkeit? Auch die beruflichen Tätigkeiten spielen eine sehr große Rolle: Welche Aufgaben müssen die Leute lösen? Welche Kompetenzen brauchen sie dafür? Das BIBB erhebt diese Daten etwa um zu schauen, ob Ausbildungsordnungen angepasst werden müssen. Je schneller sich die Angaben wandeln – beispielweise durch die zunehmende Digitalisierung –, umso stärker sind dann auch die Rückkopplungseffekte auf die Berufsausbildung. Die Ergebnisse, nicht nur aus den Erwerbstätigenbefragungen, fließen also in Curricula und Ausbildungsordnungen der verschiedenen Berufe ein.

bibb Bundesinstitut für berufsbildung, darunter "Forschunsgdatentenzentrum"

Wie sieht es auf der Seite der Betriebsdaten aus?

Bei den Betriebsdaten sind beispielsweise die Studien zu Kosten und Nutzen der betrieblichen Berufsausbildung wichtig. Sie bilden einen sehr detaillierten und nahezu weltweit einzigartigen Datenbestand – lediglich in der Schweiz gibt es noch einen vergleichbaren, allerdings nicht in dieser Detailtiefe. Das liegt daran, dass die Berufsausbildung nur in deutschsprachigen Ländern eine so große Rolle spielt. Dann haben wir natürlich noch das BIBB-Betriebspanel zur Qualifizierung und Kompetenzentwicklung, eine sehr große, jährlich wiederholte Befragung von ungefähr 3.000 Betrieben quer durch alle Branchen. Der Fokus liegt darauf, wie sich Ausbildungsstellen entwickeln und wie betriebliche Qualifizierung aussieht.

Was konkret kann man mithilfe dieser Datensätze denn alles untersuchen?

Ich bin selbst immer wieder überrascht, wie kreativ unsere Datennutzer sind. Zum Beispiel kann man etwa – teilweise über den Fragebogenteil der Bundesanstalt für Arbeitsschutz und Arbeitsmedizin – über die Erwerbstätigenbefragungen Fragen zu Homeoffice, Präsentismus und vielem mehr beantworten. Oder man kann untersuchen, inwiefern sich eine schlechte Beleuchtung am Arbeitsplatz auf den Gesundheitszustand und die Lebens -und Arbeitszufriedenheit der Beschäftigten auswirkt. Und da gibt es einen Zusammenhang. (lacht!) Zugegeben: Solche Fragestellungen werden nicht ganz so oft verfolgt, aber das Beispiel zeigt doch, wie thematisch breit gestreut Forschungsfragen sein können, die sich mit unseren Daten bearbeiten lassen. Es gibt viele andere spannende Beispiele, über die ich aus Datenschutzgründen leider nichts erzählen kann – man könnte eventuell rauskriegen, wer das gerade macht.

„Grundsätzlich sind die Einsatzgebiete zur Nachnutzung unserer Daten so vielfältig wie das arbeitsmarktbezogene Bildungsgeschehen!“

Und natürlich lassen sich Fragen der Berufsausbildung mit den Forschungsdaten hervorragend bearbeiten; da wäre die schon angesprochene Berufswahlentscheidung von Jugendlichen, die Bedeutung von Berufsbezeichnungen oder die Attraktivität von Ausbildungs- und Erwerbsberufen. Auf der betrieblichen Seite lässt sich – nur um ein paar Einblicke zu geben – herausarbeiten, welche Betriebe welchen Jugendlichen welche Berufsausbildung anbieten, wie die Berufsausbildung organisiert ist, und wie viele Personen später unter welchen Bedingungen übernommen werden – natürlich auch die Auswirkungen der Digitalisierung auf berufliche Tätigkeiten und Ausbildung. Vor allem aus der BIBB-Erwerbstätigenbefragung lässt sich viel herausholen! Hier wird nämlich ein vergleichsweise detailliertes Tätigkeitsportfolio zu vielen Berufen abgefragt, das recht einzigartig ist. Weltweit gibt es nicht sehr viele Datensätze, die solche Informationen beinhalten, weswegen auch viele internationale Wissenschaftlerinnen und Wissenschaftler auf unsere Daten zugreifen.

Sie haben viele Nachfragen aus dem Ausland?

Ja, 20 Prozent unser Nutzerinnen und Nutzer kommen aus dem Ausland. Die meisten aus Europa, aber auch sehr viele aus UK und den USA. Unsere Datensätze sind interessant für alle, die sich mit dem Arbeitsmarkt oder daran angeschlossenen Forschungsfragen wie etwa sozialen Ungleichheiten beschäftigen. Üblicherweise stammen die Personen aus den Wirtschafts-, Sozial- und Erziehungswissenschaften, teilweise auch aus der Psychologie und aus der Arbeitsmedizin. Die Hälfte unserer Datennutzerinnen kommt aus den Universitäten, 25 Prozent aus außeruniversitären Forschungseinrichtungen und 25 Prozent aus Vereinen, Interessenvertretungen oder Ministerien.

Und welche Daten werden am meisten genutzt?

Bei den Personendaten sind es mit Abstand die Daten der Erwerbstätigenbefragung. Und bei den Betriebsdaten ist es eigentlich das Betriebspanel zur Qualifizierung und Kompetenzentwicklung, gefolgt von den Daten zu Kosten und Nutzen der betrieblichen Berufsausbildung. Die drei Datensätze machen ungefähr 80 Prozent unserer Gesamtnutzung aus. Grundsätzlich haben wir aber zu nahezu jedem von uns angebotenen Datensatz mindestens eine Datennutzung.

Auf einen Blick: Das FDZ des BIBB

Datenbestand

Betriebs- und Personendaten im Quer- und Längsschnitt, die sich mit dem Erwerb und der Verwertung beruflicher Qualifikationen beschäftigen. 55 Personendatensätze und 35 Betriebsdatensätze, zerlegt in knapp 250 Teildatensätze. Personendaten zu folgenden Themenbereichen: Übergänge in die berufliche Ausbildung und Erwerbstätigkeit, Ausbildung, Erwerbstätigkeit und Weiterbildung. Betriebsdaten zu den Themenbereichen Ausbildung, Erwerbstätigkeit und Weiterbildung.

Sammelschwerpunkt

Ausschließlich Mikrodaten der BIBB-Forschungsprojekte. Die Datensätze im BIBB-FDZ unterscheiden sich im Erhebungsdesign (Quer- oder Längsschnitt), in den Erhebungseinheiten (Personen oder Betriebe) und schließlich dem thematischen Fokus (Stelle im Erwerbs- und Verwertungsprozess von beruflicher Bildung (Lebenslaufkonzept)).

Service

Standardisiertes Antragsverfahren (max. 10 Minuten) für Scientific-Use-Files; Aufenthalte für Gastwissenschaftler; inhaltliche und methodische Beratung zu den Daten. Das große Metadaten-Portal enthält detaillierte Inhaltsbeschreibungen sowie Klassifikationen nach Berufen, Soziodemografie, Wirtschaftszweigen und Regionen.

Wer nutzt die Daten

Wissenschaftler*innen aus den Wirtschafts-, Sozial- und Erziehungswissenschaften, auch aus Psychologie und Arbeitsmedizin.

Wie sieht es mit der Anzahl der Nutzer aus?

Seit unserer Gründung im Jahr 2008 verzeichnen wir über 1.500 Personen in insgesamt knapp 1.000 Forschungsprojekten, denen wir einen Zugang zu unseren Forschungsdaten ermöglichen. Das eintausendste Forschungsprojekt müsste eigentlich dieses Jahr (Anm. d. Red.: 2020) noch kommen. Die Nachfrage ist im Zeitverlauf leicht zunehmend, war aber eigentlich schon von Anfang an vergleichsweise hoch. Pro Jahr schwanken unsere Nutzerzahlen immer um die Mittelwerte von etwa 90 neuen Forschungsprojekten und 120 Personen, die neu oder erneut unsere Forschungsdaten nutzen. Wir betreuen quasi zu jedem Zeitpunkt ungefähr 300 aktive Forschungsprojekte mit etwa 450 Nutzerinnen.

Haben Sie schon Ausbaupläne für die nächsten Jahre?

Wir wollen einiges neu entwickeln. Da wäre zum Beispiel das sogenannte Record Linkage, bei dem wir unsere Survey-Daten mit prozessproduzierten Daten zu Erwerbsverläufen verknüpfen wollen. Dazu einen gemeinsamen Datensatz zur Nachnutzung anzubieten ist aber mit gewissen Hürden verbunden, denn es geht dabei meist um Datenbestände verschiedener Institutionen wie denen des Instituts für Arbeitsmarkt- und Berufsforschung oder des Statistischen Bundesamts. Ämter tauschen in der Regel nur Daten aus, wenn es dafür eine explizite gesetzliche Grundlage gibt. Das bedeutet, dass die Daten für eine Nachnutzung gegebenenfalls nicht zur Verfügung stehen aus wissenschaftlicher Sicht ist das unbefriedigend! Aber wir haben auch inhaltlich noch viel vor: Aufgrund des beschleunigten Wandels von beruflichen Tätigkeiten wird es in Zukunft auch im BIBB vermehrt Daten zu formeller und informeller Weiterbildung geben. Und wir würden gerne Indikatoren auf der Ebene von Ausbildungs- und Erwerbsberufen weiter entwickeln, um Daten auf der Aggregatebene „Beruf“ mit anderen Datenbeständen zu verknüpfen; damit könnte man beispielsweise untersuchen, wie hoch der Frauenanteil oder der Anteil der Abiturienten in verschiedenen Berufen sind, und woran das liegt.

Und jetzt noch einen Blick in die Zukunft der Forschungsdateninfrastruktur, bitte.

Der Aufbau der Nationalen Forschungsdateninfrastruktur wird spannend werden! Es sind immerhin mittlerweile 38 Forschungsdatenzentren, die sich derzeit im Rahmen des Aufbaus einer nationalen Forschungsdateninfrastruktur /NFDI) vernetzen. Eine komplette Übersicht darüber, welche Daten es in welchem FDZ gibt, ist jetzt schon eine große Herausforderung vor allem weil wir uns dabei in Größenordnungen von 3 bis 5.000 Datensätzen bewegen. Das alles unter einen Hut zu bringen, heißt wirklich dicke Bretter zu bohren.

„Wie kann über das Internet ein sicherer Zugriff auf einen Datenbestand gewährleistet werden, ohne dass einzelne Daten illegal mit anderen Daten verknüpft werden?“

Und was die Fortschritte in der Digitalisierung angeht, müssen wir im Blick haben, was Suchalgorithmen mittlerweile leisten können. Ich fürchte, unsere Praxis, Datensätze als Scientific-Use-Files anzubieten, wird zunehmend unter Druck geraten, weil automatisierte Suchalgorithmen trotz Anonymisierung gegebenenfalls Verknüpfungen zwischen Daten herstellen können. Das fällt uns gerade in den USA auf die Füße; dorthin dürfen wir zum Beispiel keine Scientific-Use-Files mehr liefern. Wir haben daraus den Schluss gezogen, dass ortsunabhängige Zugangsverfahren, bei denen lediglich ein Remote-Zugriff auf die Forschungsdaten erfolgt, wichtiger werden. Um das zu ermöglichen, müssten die Forschungsdatenzentren aber nochmal kräftig in die Infrastruktur investieren. Aber hoffnungsvoll stimmt mich, dass eine Etablierung von Remote-Verfahren grundsätzlich möglich ist – vom NEPS und anderen Forschungsdatenzentren wie dem IAB werden sie ja bereits erfolgreich eingesetzt.

Vielen Dank für das Gespräch, Herr Alda!


Dieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Christine Schumann für Deutscher Bildungsserver


Auch noch interessant:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert