Vorhersage der Mitarbeiterfluktuation

· Thomas Wood
Vorhersage der Mitarbeiterfluktuation

Erweitern Sie Ihr Team mit NLP-Spezialisten

Entfesseln Sie das Potenzial Ihrer NLP-Projekte mit dem richtigen Talent. Veröffentlichen Sie Ihre Stelle bei uns und ziehen Sie Kandidaten an, die genauso leidenschaftlich über natürliche Sprachverarbeitung sind.

NLP-Experten einstellen

Eine Herausforderung, mit der große Unternehmen heute konfrontiert sind, besteht darin, zu verstehen und vorherzusagen, welche Mitarbeiter das Unternehmen verlassen werden, was als Vorhersage der Mitarbeiterfluktuation oder Vorhersage der Abwanderung von Mitarbeitern bezeichnet wird.

Mitarbeiter beteiligen sich nicht immer an Offboarding-Prozessen, zeigen sich im HR-Austrittsgespräch möglicherweise nicht wirklich offen und wenn das Austrittsgespräch dann kommt, ist es zu spät, die Probleme anzusprechen, die den Mitarbeiter überhaupt zum Ausscheiden veranlasst haben.

Darüber hinaus möchten Sie bei einer großen Belegschaft möglicherweise vorhersagen können, welche Mitarbeiter zu einem bestimmten Zeitpunkt gefährdet sind, das Unternehmen zu verlassen, wie lange sie voraussichtlich bleiben werden und einen Hinweis darauf erhalten, bei welchen Interventionen eine Chance besteht Reduzierung der Fluktuation.

Glücklicherweise verfügen die meisten Unternehmen heutzutage über eine Art Mitarbeiterdatenbank. Dies kann eine Goldgrube für Datenwissenschaftler sein, die die Mitarbeiterfluktuation analysieren, erklären oder vorhersagen möchten.

Wir haben eine Reihe von Projekten im Bereich der Mitarbeiterfluktuationsanalyse durchgeführt, von der Vorhersage der Mitarbeiterfluktuation beim britischen National Health Service bis hin zur Vorhersage der Fluktuation (Abbruch) von Studierenden bei Hochschuleinrichtungen und der schottischen Regierungsbehörde Skills Development Scotland . In beiden Fällen haben wir die Ursachen der Fluktuation analysiert und ein Abwanderungsvorhersagemodell entwickelt, mit dem das Problem gemindert werden könnte.

Bei der Vorhersage der Mitarbeiterfluktuation ist der Datenschutz von entscheidender Bedeutung

Dieses Problem der Mitarbeiterfluktuationsanalyse ist etwas schwieriger als die Vorhersage der Kundenausgaben . Jede Mitarbeiterdatenbank enthält hochsensible Informationen . Wenn Sie sich im Vereinigten Königreich oder in der EU befinden, schränkt die DSGVO die Art der Analyse ein, die Sie in einer Mitarbeiterdatenbank durchführen können, die Aktionen, die Sie auf der Grundlage von Mitarbeiterdaten durchführen dürfen, und sogar die Technologie, die Sie verwenden können. Möglicherweise können Sie externe Datenspeicher und Prozessoren wie Cloud-Dienste nicht nutzen und sind in diesem Fall auf europäische Server beschränkt.

Wie können wir also mithilfe der Datenwissenschaft die Fluktuation von Mitarbeitern vorhersagen?

Typischerweise verfügen Sie in Ihrem Unternehmen über unterschiedliche Datenbanken wie Gehaltsdatenbanken, Mitarbeiteradressdatenbanken, Einstellungs- und Einstellungsunterlagen usw. Diese werden wahrscheinlich von verschiedenen Abteilungen verwaltet.

Der erste Schritt wäre, einen Weg zu finden, die Datensätze zu vereinheitlichen, sodass Sie für jeden aktuellen und früheren Mitarbeiter problemlos auf alle Daten über ihn zugreifen können. Sie möchten wissen, wann jemand der Organisation beigetreten ist, wann er eine höhere Gehaltsstufe erreicht hat und wann er die Organisation verlassen hat.

Hier ein Punkt zu Datenstrategien, die Sie als Organisation anwenden können, um die Analyse der Mitarbeiterfluktuation zu vereinfachen:

  • Idealerweise verfügen Sie über eine Mitarbeiter-ID, die im gesamten Unternehmen verwendet wird, damit Mitarbeiter nachverfolgt werden können. Namen können bei der Heirat falsch geschrieben oder geändert werden, und Sozialversicherungs- oder Sozialversicherungsnummern können mit Datenschutz- und Portabilitätsproblemen verbunden sein.
  • Idealerweise hätte die Organisation ihre Datenbanken so eingerichtet, dass, wenn ein Mitarbeiter beispielsweise umzieht und seine Adresse aktualisiert, die alte Adresse und die neue Adresse sowie das Datum der Aktualisierung gespeichert würden. Ebenso sollten Sie den Gehaltsverlauf und nicht nur die aktuelle Gehaltsstufe speichern.
Microsoft Access schema of an example employee database in a fictional organisation. An employee database consists of several tables joined together by IDs. In practice in a company there would be data on employees scattered across different systems such as payroll, timesheets, recruitment, HR, accounting etc so there is a considerable amount of work needed to connect them in order to develop a model for predicting employee turnover. Image source: MySQL at dev.mysql.com.

Eine Mitarbeiterdatenbank besteht aus mehreren Tabellen, die durch IDs miteinander verbunden sind. In der Praxis wären in einem Unternehmen Daten über Mitarbeiter über verschiedene Systeme wie Gehaltsabrechnung, Stundenzettel, Personalbeschaffung, Personalwesen, Buchhaltung usw. verstreut, so dass ein erheblicher Arbeitsaufwand für deren Verknüpfung erforderlich wäre, um ein Modell zur Vorhersage der Mitarbeiterfluktuation zu entwickeln. Bildquelle: MySQL unter dev.mysql.com.

Sobald Sie herausgefunden haben, wie Sie die Datensätze aller Mitarbeiter zusammenführen können, besteht der nächste Schritt für die Mitarbeiterfluktuationsanalyse darin, zu versuchen, einen Datensatz in eine einzelne flache Tabelle umzuwandeln. Dies ist das einfachste Format, das in einen Algorithmus für maschinelles Lernen eingespeist werden kann.

Der Snapshot-Ansatz für ein Abwanderungsvorhersagemodell: ein Klassifizierungsmodell zur Vorhersage der Mitarbeiterfluktuation

Employee turnover analysis

Analysing employee turnover?

Wir haben Erfahrung in der Vorhersage der Mitarbeiterfluktuation, auch bekannt als Mitarbeiterabwanderung oder Mitarbeiterabwanderung (Mitarbeiterfluktuationsanalyse), sowie mit ähnlichen Problemen wie der Vorhersage der Kundenabwanderung und der Vorhersage der Kundenausgaben .

Es gibt viele Möglichkeiten, Ihre Mitarbeiterdaten in eine einzige Tabelle umzuwandeln, aber hier ist eine der einfachsten:

Sie erstellen eine einzelne Tabelle, die jeden Mitarbeiter darstellt, der am 1. Januar 2019 in der Organisation anwesend war, mit Spalten für Werte wie die Zeit, die er in der Organisation verbracht hat, und einer letzten Spalte, die auf TRUE oder FALSE (ein boolescher Wert) gesetzt ist und angibt, ob dies der Fall ist ob er die Organisation bis zum 31. Januar verlassen hat oder nicht. Dies können Ihre Trainingsdaten sein.

A table with all employee data joined so each employee has its own row - this can be input directly into a model for predicting employee turnover

Ein Beispiel für eine Mitarbeitertabelle. Die letzte Spalte ist ein boolescher Wert, den wir vorhersagen möchten. Beachten Sie, dass es sich beim Alter um das Alter am 1. Januar 2019 und nicht um das aktuelle Alter des Mitarbeiters handelt. Jeder Mitarbeiter verfügt über eine eigene Zeile, sodass diese Tabelle direkt in ein Modell zur Analyse und Vorhersage der Mitarbeiterfluktuation eingegeben werden kann.

Erstellen Sie dann dieselbe Snapshot-Tabelle für den 1. Januar 2020, die Ihre Testdaten sein kann.

Bei Ihren Kolumnen können Sie Ihrer Kreativität freien Lauf lassen. Wenn Sie beispielsweise die Privatadresse der Mitarbeiter zum Zeitpunkt des Schnappschusses haben, können Sie deren Entfernung zum Büro, Reisezeit usw. berechnen. Wichtig ist, dass alle Werte in Ihrer Tabelle die Werte zum Datum des Schnappschusses sein sollten. Daher sollte die Entfernung in der Schulungstabelle die Entfernung vom Büro am 1. Januar 2019 zu ihrem Zuhause am 1. Januar 2019 sein, und ebenso sollte das Alter dem Alter des Mitarbeiters an diesem Datum entsprechen.

Es ist ziemlich schwierig, diesen letzten Punkt richtig zu machen, und wenn Sie die Verknüpfungsoperation in SQL durchführen, müssen Sie Fensterfunktionen verwenden.

Trainieren Sie Ihr Abwanderungsvorhersagemodell zur Vorhersage der Mitarbeiterfluktuation

Nachdem Sie nun beide Tabellen haben, können Sie sie in einen maschinellen Lernalgorithmus Ihrer Wahl einspeisen. Sie teilen dem Algorithmus diese beiden Dinge mit:

Ich kenne das Alter des Mitarbeiters, die Entfernung zum Büro, die Zeit in der Gehaltsstufe und die Zeit in der Organisation

Ich möchte die Fluktuation des Mitarbeiters im folgenden Monat vorhersagen

Wenn Sie Python mögen, empfehle ich Ihnen, einen Random Forest oder Gradient Boosted Tree auszuprobieren, oder Sie können auch ein cloudbasiertes Auto-ML- Tool wie Microsoft Azure oder Google Cloud Platform verwenden. Für den Einstieg stehen zahlreiche Tutorials zur Verfügung.

Achten Sie darauf, die Mitarbeiter-ID von der Analyse auszuschließen, da sonst die Gefahr besteht, dass Ihr Modell sich nur noch merkt, welche Mitarbeiter noch übrig sind!

Sie können Ihr Modell anhand der Daten von 2019 trainieren und anhand der Daten von 2020 auswerten. Wenn es gut funktioniert, wissen Sie, dass Ihr Modell robust genug ist, um Muster zu lernen und sie in einem Jahr in der Zukunft auf eine Kohorte von Mitarbeitern anzuwenden.

Das bedeutet, dass Sie die aktuelle Mitarbeiterkohorte analysieren und eine Rangliste derjenigen erstellen können, bei denen das Risiko eines Abbruchs am höchsten ist, sodass Ihre Personalabteilung gezielte Bindungsmaßnahmen ergreifen kann.

(In der Praxis würde ich nicht nur einen Schnappschuss an einem einzelnen Datum machen, sondern das ganze Jahr über mehrere Schnappschüsse machen und versuchen, gleichmäßige Datenmengen von jedem Monat beizubehalten, um Verzerrungen durch saisonale Effekte zu vermeiden. Es gibt keinen Grund, den überwachten Zeitraum auf zu beschränken Entweder 1 Monat – Sie können es jederzeit trainieren, um die Fluktuation im nächsten Jahr oder Jahrzehnt vorherzusagen, wenn Sie über genügend Daten verfügen.)

Natürlich wird Ihr Modell die Covid-19-Pandemie nicht vorhergesehen haben. Dies wird immer eine Einschränkung des maschinellen Lernens sein, bei dem es darum geht, Muster aus der Vergangenheit zu lernen, um sie auf die Zukunft anzuwenden. Sie können jedoch jedes System mithilfe Ihres Modells so entwerfen, dass ein manueller „Anpassungsfaktor“ möglich ist, um beispielsweise während eines Wirtschaftsabschwungs die Fluktuation aller Mitarbeiter anhand einer benutzerdefinierten Konstante anzupassen.

Fluktuationsanalyse: Analyse der Ursachen der Mitarbeiterfluktuation

Bei den meisten Modellen für maschinelles Lernen können Sie nach innen schauen und analysieren, wie sie die von ihnen zurückgegebenen Entscheidungen treffen. Dies wird als Modellerklärbarkeit oder Merkmalsbedeutung bezeichnet: ( Lesen Sie mehr über erklärbare KI oder XAI )

Factors behind employee turnover analysis from model explanation. Example of the feature importances output of the [Random Forest](https://deepai.org/machine-learning-glossary-and-terms/random-forest) model in [Scikit-Learn](https://scikit-learn.org/stable) Python library.

Beispiel für die Ausgabe der Feature-Wichtigkeiten des Random Forest-Modells in der Scikit-Learn-Python-Bibliothek.

Wenn Sie feststellen, dass die Entfernung zwischen Wohnort und Büro ein wesentlicher Faktor für die Fluktuation ist, können Sie die Einstellungspolitik so anpassen, dass Kandidaten, die in der Nähe wohnen, Vorrang haben, ein Umzugspaket einschließen oder einen Firmenbus oder Fahrgemeinschaften anbieten. Natürlich können Sie diese Informationen nicht zur Diskriminierung aufgrund des Alters verwenden.

Fazit: Wie geht es mit der Mitarbeiterfluktuationsanalyse weiter?

Die Vorteile der Anwendung eines solchen Modells zur Vorhersage der Mitarbeiterfluktuation gehen über die reinen Vorhersagefunktionen hinaus und umfassen Erkenntnisse, die die Abläufe des Unternehmens als Ganzes verändern können. Durch die Mitarbeiterfluktuationsanalyse ergeben sich für das Unternehmen zwei Kosteneinsparungen, da HR-Experten die Erklärungen des Modells nutzen können, um Bindungsrichtlinien im gesamten Unternehmen zu entwickeln und auch Personen mit hohem Risiko mit Bindungsinitiativen anzusprechen.

Nachtrag: Alternative Ansätze zum Klassifizierungsmodell zur Mitarbeiterfluktuationsanalyse

Neben dem oben beschriebenen Klassifizierungsmodell fallen mir zwei weitere Möglichkeiten ein, mit denen Sie versuchen könnten, die Mitarbeiterfluktuation zu modellieren.

Regression zur Mitarbeiterfluktuationsanalyse?

Erstens: Warum nicht anstelle einer Klassifizierung ein Regressionsmodell ausprobieren, um die Gesamtzeit vorherzusagen, die ein Mitarbeiter ab einem bestimmten Datum im Unternehmen bleiben wird?

Tatsächlich würde ich die Regression aus folgenden Gründen nicht empfehlen: Für die Mitarbeiter am 1. Januar 2019 wissen wir, wie lange jeder bis zum heutigen Tag, dem 29. April 2020, im Unternehmen geblieben ist, also 484 Tage. Für jeden, der am Tag 484 noch im Geschäft ist, wissen wir, dass sein Gesamtaufenthalt größer oder gleich 484 ist, aber wir können ihn nicht definieren. Für diese undefinierten Werte müssten Sie sich einen Workaround für das Modell überlegen. Wenn Sie den Aufenthalt auf 484 oder einen beliebigen großen Wert festlegen, führen Sie eine Verzerrung ein, die ein Regressionsmodell nicht richtig verarbeiten kann. Wenn Sie diese Leute einfach ausschließen, führen Sie zu einer weiteren Voreingenommenheit . Statistiker würden sagen, dass unsere Daten rechtszensiert sind.

Wenn Sie maschinelles Lernen verwenden möchten, um die gesamte verbleibende Zeit, die jemand im Unternehmen verbleibt, vorherzusagen, würde ich vorschlagen, ein separates Klassifizierungsmodell zu trainieren, um die Fluktuation innerhalb von 1 Monat, 2 Monaten usw. vorherzusagen, und diese zu kombinieren, wann immer Sie möchten eine Vorraussage.

Kann uns die Überlebensanalyse dabei helfen, die Mitarbeiterfluktuation vorherzusagen? Eine Alternative zur Klassifizierung als Abwanderungsvorhersagemodell

Als weitere Alternative zum Klassifizierungsmodell könnte die Überlebensanalyse ein mögliches alternatives Tool sein, das wir aus der Statistik nutzen könnten.

Dies wird beispielsweise in klinischen Studien zu Erkrankungen mit hohen Letalitätsraten (hauptsächlich Krebs-, Herzinfarkt- und Schlaganfallpatienten) genutzt, um den Anteil einer Ausgangskohorte oder von Patienten zu analysieren, die zu verschiedenen Zeitpunkten noch nicht verstorben sind.

Die Überlebensraten können auf einer Kurve dargestellt werden, die als Kaplan-Meier-Kurve bezeichnet wird:

An example Kaplan-Meier plot showing survival of two patient groups with Acute Myeloid Leukaemia. Could this technique be transferred to the problem of predicting employee turnover?

Kaplan-Meier-Überlebenskurve für Patienten mit akuter myeloischer Leukämie, aufgeteilt in zwei Gruppen, von denen eine behandelt wird und die andere nicht.

Sie können auch eine Zahl namens Kaplan-Meier-Schätzer berechnen, die eine Annäherung an die Überlebensrate zu jedem Zeitpunkt darstellt.

Die Überlebensanalyse ist robust gegenüber Rechtszensur und könnte daher zur Analyse der Mitarbeiterabwanderung über einen längeren Zeitraum als das Modell des maschinellen Lernens verwendet werden. Allerdings wird die Überlebensanalyse komplexer, wenn wir Vorhersagen auf der Grundlage vieler unabhängiger Variablen treffen (Pendellänge, Alter, Gehaltsstufe usw.).

Mir ist kein Unternehmen bekannt, das Überlebensanalysen verwendet, um die Fluktuation von Mitarbeitern vorherzusagen, aber es würde mich interessieren, ob jemand dies tut.

Weitere Informationen zur Mitarbeiterfluktuationsanalyse und zu Modellen zur Abwanderungsvorhersage

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Big-Data-Beratung – 4 häufigste Probleme gelöst
Data scienceBig data

Big-Data-Beratung – 4 häufigste Probleme gelöst

Mittlerweile sind es Organisationen aller Größenordnungen und fast aller Sektoren werden zunehmend datengesteuert, insbesondere als größere Datenspeicher Systeme und schnellere Computer treiben die Leistungsgrenzen immer weiter voran.

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution
Ai and societyData science

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution

Aufgrund des umfangreichen Einsatzes von Technologie und der Arbeitsteilung hat die Arbeit des durchschnittlichen Gig-Economy-Arbeiters jeden individuellen Charakter und damit auch jeden Charme für den Arbeitnehmer verloren.

KI im Personalwesen: Die Zukunft der Arbeit verändern
Ai and societyData science

KI im Personalwesen: Die Zukunft der Arbeit verändern

Die Auswirkungen von KI auf die Humanressourcen Die Arbeitswelt verändert sich rasant, sowohl aufgrund der Einführung traditioneller Data-Science-Praktiken in immer mehr Unternehmen als auch aufgrund der zunehmenden Beliebtheit generativer KI-Tools wie ChatGPT und Googles BARD bei nicht-technischen Arbeitnehmern.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us