Die Entwicklung von Text Mining-Methoden für die Analyse der gesellschaftlichen Wahrnehmung von Berufen
Johanna Binnewitt
Durch die Verwendung von computergestützten Verfahren ist es möglich, Informationen aus großen Datenmengen, zum Beispiel für die sozialwissenschaftliche Forschung, aufzubereiten. Wenn es sich bei diesen Datensammlungen um Texte in natürlicher Sprache handelt, können computerlinguistische Verfahren angewandt werden, um die Informationen aus den Texten, strukturiert aufzubereiten. Das Promotionsprojekt beschäftigt sich hier mit der Frage, inwiefern diese Methoden genutzt werden können, um Informationen aus Textsammlungen für die Berufsbildungsforschung zugänglich zu machen. Die Methoden sollen dabei zum einen an Stellenanzeigen und zum anderen an politischen Reden, in denen Berufe erwähnt werden, erprobt werden.
Stellenanzeigen dienen in erster Linie dazu, vakante Positionen zu bewerben. Gleichzeitig beinhalten sie verschiedene Informationen, die Rückschlüsse auf das Rekrutierungsverhalten der Unternehmen zulassen, und sind daher für die Berufsbildungsforschung interessant. Der erste Teil des Promotionsprojekts soll nun untersuchen, wie bestimmte Aspekte des Rekrutierungsverhaltens in Stellenanzeigen automatisiert ermittelt und für die Berufsbildungsforschung nutzbar gemacht werden können. Dabei kommt es vor allem darauf an, dass die Ergebnisse der automatischen Textverarbeitung nachvollziehbar und interpretierbar sind, um anschließende Analysen in der Berufsbildungsforschung zu ermöglichen. Beispielsweise wäre es denkbar, Zusammenhänge zwischen Fachkräftemangel und einem bestimmten Rekrutierungsverhalten in verschiedenen Branchen und Berufen zu untersuchen.
Der zweite Teil der Dissertation befasst sich mit Methoden zur Analyse der öffentlichen Meinung über Berufe, insbesondere in politischen Debatten. Dabei wird zunächst angenommen, dass Berufe in Reden mit unterschiedlichen rhetorischen Funktionen erwähnt werden. Beispielsweise kann ein Bergmann in einer Debatte über den Kohlebergbau erwähnt werden und damit auf den Beruf des Bergmanns als solchen referenzieren. In einem anderen Kontext könnte die Erwähnung eines Bergmanns aber auch eine andere Gruppe repräsentieren, wie beispielsweise die Arbeiterklasse oder Berufe, die vom Stellenabbau betroffen sind. Neben der Identifizierung von Berufsbezeichnungen und der automatischen Klassifizierung in rhetorische Funktionsgruppen besteht die computerlinguistische Herausforderung darin, die Berufsbezeichnung in der politischen Rede einem Eintrag in einer Berufstaxonomie zuzuordnen. Dies ist vor allem bei unscharfen Berufsbezeichnungen (z.B. „Handwerker“) eine Herausforderung, aber notwendig, um eine anschließende Auswertung der Klassifikationsergebnisse in der Berufsbildungsforschung zu ermöglichen. So könnten beispielsweise die rhetorischen Funktionen auf Berufsebene mit Befragungsergebnissen Berufsprestige verglichen werden.