Neue Methoden zur Berufsverkodung

Projektleiter/innen Prof. Dr. Frauke Kreuter Mitarbeiter/innen Antje Marlene Rosebrock, Knut Wenzig DFG-gefördert 2014 – 2021

Forschungsfrage/Ziel:

In vielen Umfragen ist es üblich den Beruf mit offenen Fragen zu erheben. Nach der Befragung müssen diese Texte in eine Klassifikation mit hunderten Kategorien und tausenden Berufen eingeordnet (kodiert) werden. Diese Aufgabe ist nicht nur zeitaufwändig und daher teuer, sondern auch fehleranfällig. Wenn die Berufsbeschreibungen ungenau sind, ist die exakte Kodierung oft unmöglich.
Das Projekt zielte darauf ab, den Messprozess zu verbessern, indem Befragte bereits zum Zeitpunkt des Interviews ihren Beruf anhand einer geschlossenen Frage klassifizieren, unmittelbar nachdem sie in einer offenen Frage ihren Beruf beschrieben haben. Ein Machine-Learning-Algorithmus wurde trainiert, der eine kurze Liste möglicher Berufskategorien vorschlägt, aus der Befragte dann die passendste Kategorie auswählen können. Aufgrund des sorgfältigen Designs des Layouts, der Interaktion zwischen Interviewern und Befragten, sowie der Berufsbeschreibungen, mit deren Hilfe kommuniziert wird, ist eine einfache Bedienbarkeit des Instruments sichergestellt.
Das neue Instrument wurde in verschiedenen Bevölkerungsbefragungen getestet. Interviewer und Befragte haben keine Beschwerden bei der Nutzung des Instruments. Wir argumentieren, dass mit dem Instrument die Datenqualität steigt, da Befragte die für sie passendste Berufskategorie selbst auswählen. Eine detaillierte Analyse der Datenqualität hat sich jedoch als komplexer herausgestellt und ist daher Aufgabe zukünftiger Forschung.


Publikationen

Herausgeberschaften

  • Foster, Ian, Rayid Ghani, Ron S. Jarmin, Frauke Kreuter, Julia Lane (Eds.) (2017): Big Data and Social Science: A Practical Guide to Methods and Tools. 356. London, Chapman & Hall / CRC Press. More

Zeitschriftenartikel

  • Amaya, Ashley, Ruben L. Bach, Florian Keusch, Frauke Kreuter (2021): New Data Sources in Social Science Research: Things to Know Before Working With Reddit Data. Social Science Computer Review, 39, 4, 943-960. More
  • Schierholz, Malte, Miriam Gensicke, Nikolai Tschersich, Frauke Kreuter (2018): Occupation coding during the interview. Journal of the Royal Statistical Society: Series A (Statistics in Society), 181, 2, 379–407. More
  • Schierholz, Malte (2018): Eine Hilfsklassifikation mit Tätigkeitsbeschreibungen für Zwecke der Berufskodierung. AStA Wirtschafts- und Sozialstatistisches Archiv: Eine Zeitschrift der Deutschen Statistischen Gesellschaft, 12, 3-4, 285–298 . More

Präsentationen

  • Schierholz, Malte (2018): A comparison of automatic algorithms for occupation coding. [European Conference on Data Analysis, Paderborn, 03/07/2018 - 05/07/2018]. More
  • Schierholz, Malte (2018): A comparison of automatic algorithms for occupation coding. [Statistische Woche, Linz, 10/09/2018 - 13/09/2018]. More
  • Schierholz, Malte (2017): A New Auxiliary Classification with Job Activities for Occupation Coding. [7th Conference of the European Survey Research Association, Lisbon, 16/07/2017 - 20/07/2017]. More
  • Bethmann, Arne, Malte Schierholz, Knut Wenzig, Markus Zielonka (2014): Automatic Coding of Occupations : Using Machine Learning Algorithms for Occupation Coding in Several German Panel Surveys. [WAPOR 67th Annual Conference : Extensible Public Opinion, Nice, 03/09/2014 - 05/09/2014]. More
  • Schierholz, Malte, Arne Bethmann (2014): Automating Survey Coding for Occupation. [Joint Statistical Meetings 2014, Boston, Mass., 01/08/2014 - 06/08/2014]. More

Berichte

  • Schierholz, Malte (2014): Automating survey coding for occupation. 10/2014, 65. Nürnberg, The Research Data Centre (FDZ) of the Federal Employment Agency in the Institute for Employment Research. More

Thesis

  • Schierholz, Malte (2019): New methods for Job and Occupation Classification. Mannheim, University of Mannheim. More