Die Entwicklung von Text Mining-Methoden für die Analyse der gesellschaftlichen Wahrnehmung von Berufen
Johanna Binnewitt
Mit der fortschreitenden Digitalisierung sind zum einen immer mehr Texte digital verfügbar und zum anderen immer mehr Methoden aus dem Bereich des Natural Language Processing (NLP) im Einsatz, die diese Textsammlungen automatisiert verarbeiten können. In den Forschungsfeldern Digital Humanities und Computational Social Sciences beschäftigt man sich unter anderem mit der Frage, ob und wie diese NLP-Methoden in der Forschung genutzt werden können, um beispielsweise Forschungsfragen über gesellschaftliche Zusammenhänge zu beantworten.
Das Promotionsprojekt möchte einen Beitrag zu diesen Forschungsfeldern leisten, indem es untersucht, wie Berufsbezeichnungen in Debatten des Deutschen Bundestags mithilfe von Transformer-Modellen identifiziert und analysiert werden können. Die Ergebnisse sollen Aufschluss darüber geben, in welchen Zeiträumen (und von welchen Parteien) bestimmte Berufe besonders häufig (oder besonders selten) thematisiert wurden. Darüber hinaus soll eine vertiefende Analyse den Zusammenhang zwischen Berufsbezeichnungen und Stereotypen beleuchten. Die Wahl spezifischer Berufsbezeichnungen in bestimmten Kontexten wird durch gesellschaftliche Erfahrungen und Überzeugungen gegenüber der jeweiligen Berufsgruppe beeinflusst. Diese Überzeugungen spiegeln sich in der Sprache wider und tragen dazu bei, bestimmte Stereotype zu erzeugen oder aufrechtzuerhalten. Beispielsweise wird in dem Satz „Lehrer entscheiden, wer Physikprofessor und wer Krankenschwester werden soll“ eine implizite Wertung der beiden Berufe vermittelt, die auf gesellschaftlichen Erfahrungen und Überzeugungen beruht und wiederum Auswirkung auf die Wahrnehmung der Berufe in der Gesellschaft haben kann.
Im zweiten Teil der Promotion werden Informationen zu Berufen aus Stellenanzeigen extrahiert. Arbeitgeber nutzen Stellenanzeigen in erster Linie dazu, um ihre vakanten Positionen zu bewerben und um geeignete Personen zu finden. Neben formalen Qualifikationen und fachlichen Kompetenzen fordern Arbeitgeber oft bestimmte Persönlichkeitseigenschaften, wie beispielsweise Belastbarkeit, Empathie oder Durchsetzungsvermögen. Die Extraktion dieser soll schließlich mit den Stereotypen aus den Bundestagsdebatten verglichen werden, um Unterschiede und Gemeinsamkeiten in den Bildern aufzuzeigen, die in beiden Quellen von Berufen gezeichnet werden.
Das Dissertationsprojekt soll vor allem aufzeigen, wie große Textsammlungen automatisiert und reflektiert für verschiedene sozial- und gesellschaftswissenschaftliche Fragestellungen genutzt werden können. Textdaten können so eine Säule neben quantitativen und qualitativen Erhebungen bilden. Die Ergebnisse sollen inhaltlich zum einen neue Erkenntnisse zur Wahrnehmung von Berufen in der Gesellschaft liefern. Zum anderen können sich vor allem bei der Analyse der Bundestagsdebatten Fragen aus dem Bereich der Repräsentationsforschung anschließen, weil die Daten aufzeigen können, welche Berufe in den Debatten thematisiert werden.