Vorhersage der Mitarbeiterfluktuation

Große Unternehmen stehen heute vor der Herausforderung, zu verstehen und vorherzusagen, welche Mitarbeiter das Unternehmen verlassen werden. Diese sogenannte Mitarbeiterfluktuationsprognose oder Personalabwanderungsprognose ist eine der größten Herausforderungen für Unternehmen.

Mitarbeiter nehmen nicht immer an Offboarding-Prozessen teil, sind im Austrittsgespräch mit der Personalabteilung möglicherweise nicht wirklich mitteilsam und wenn es dann zum Austrittsgespräch kommt, ist es zu spät, die Probleme anzusprechen, die den Mitarbeiter ursprünglich zum Ausscheiden veranlasst haben.

Wenn Sie über eine große Belegschaft verfügen, möchten Sie möglicherweise außerdem vorhersagen können, bei welchen Mitarbeitern zu einem bestimmten Zeitpunkt die Gefahr besteht, dass sie das Unternehmen verlassen, wie lange sie voraussichtlich bleiben werden und Hinweise darauf erhalten, mit welchen Maßnahmen sich die Fluktuation verringern lässt.

Glücklicherweise verfügen die meisten Unternehmen heute über eine Mitarbeiterdatenbank. Diese kann eine wahre Goldgrube für Datenwissenschaftler sein, die die Fluktuation von Mitarbeitern analysieren, erklären oder vorhersagen möchten, und ist eine der spannendsten Anwendungen von KI in der Wirtschaft .

Wir haben eine Reihe von Projekten im Bereich der Analyse der Mitarbeiterfluktuation durchgeführt, von der Vorhersage der Mitarbeiterfluktuation für den britischen National Health Service bis hin zur Vorhersage der Studentenfluktuation (Abbruch) für Hochschulen und die schottische Regierungsorganisation Skills Development Scotland . In beiden Fällen analysierten wir die Ursachen der Fluktuation und entwickelten ein Fluktuationsvorhersagemodell, mit dem das Problem gemildert werden konnte.

Datenschutz ist entscheidend bei der Prognose der Mitarbeiterfluktuation

Dieses Problem der Mitarbeiterfluktuationsanalyse ist etwas kniffliger als die Vorhersage von Kundenausgaben . Jede Mitarbeiterdatenbank enthält hochsensible Informationen . Wenn Sie sich in Großbritannien oder der EU befinden, beschränkt die DSGVO die Art der Analyse, die Sie in einer Mitarbeiterdatenbank durchführen können, die Maßnahmen, die Sie auf der Grundlage von Mitarbeiterdaten ergreifen dürfen, und sogar die Technologie, die Sie verwenden können. Möglicherweise können Sie keine externen Datenspeicher und -prozessoren wie Cloud-Dienste verwenden, und wenn Sie dies tun, sind Sie auf europäische Server beschränkt.

Wie können wir also mithilfe der Datenwissenschaft die Mitarbeiterfluktuation vorhersagen?

In Ihrem Unternehmen verfügen Sie in der Regel über unterschiedliche Datenbanken, beispielsweise Gehaltsdatenbanken, Mitarbeiteradressdatenbanken, Onboarding- und Einstellungsunterlagen usw. Diese werden wahrscheinlich von unterschiedlichen Abteilungen verwaltet.

Der erste Schritt wäre, einen Weg zu finden, die Datensätze zu vereinheitlichen, sodass Sie für jeden aktuellen und ehemaligen Mitarbeiter problemlos auf alle Daten über ihn zugreifen können. Sie möchten wissen, wann jemand in die Organisation eingetreten ist, wann er in die Gehaltsstufe aufgestiegen ist und wann er das Unternehmen verlassen hat.

Hier ein Punkt zu Datenstrategien, die Sie als Unternehmen übernehmen können, um die Analyse der Mitarbeiterfluktuation zu vereinfachen:

Idealerweise haben Sie eine unternehmensweit verwendete Mitarbeiter-ID, damit die Mitarbeiter nachverfolgt werden können. Namen können falsch geschrieben sein oder sich bei einer Heirat ändern, und bei der Sozialversicherungsnummer können Datenschutz- und Portabilitätsprobleme auftreten.
Im Idealfall hätte die Organisation ihre Datenbanken so eingerichtet, dass, wenn ein Mitarbeiter beispielsweise umzieht und seine Adresse aktualisiert, die alte und die neue Adresse sowie das Datum der Aktualisierung gespeichert würden. Ebenso sollten Sie die Gehaltsverlaufshistorie und nicht nur die aktuelle Gehaltsstufe speichern.

Eine Mitarbeiterdatenbank besteht aus mehreren Tabellen, die durch IDs miteinander verknüpft sind. In der Praxis sind die Mitarbeiterdaten eines Unternehmens über verschiedene Systeme wie Gehaltsabrechnung, Arbeitszeitnachweise, Personalbeschaffung, Personalwesen, Buchhaltung usw. verstreut. Es ist also ein erheblicher Arbeitsaufwand erforderlich, um diese zu verknüpfen und ein Modell zur Vorhersage der Mitarbeiterfluktuation zu entwickeln. Bildquelle: MySQL unter dev.mysql.com.

Wenn Sie herausgefunden haben, wie Sie die Datensätze aller Mitarbeiter zusammenführen, besteht der nächste Schritt bei der Analyse der Mitarbeiterfluktuation darin, zu versuchen, einen Datensatz in eine einzige flache Tabelle umzuwandeln. Dies ist das einfachste Format, um es in einen Algorithmus für maschinelles Lernen einzuspeisen.

Der Snapshot-Ansatz für ein Churn-Prognosemodell: Ein Klassifizierungsmodell zur Vorhersage der Mitarbeiterfluktuation

Employee turnover analysis

Analysing employee turnover?

Wir haben Erfahrung mit der Vorhersage der Mitarbeiterfluktuation, auch als Mitarbeiterabwanderung oder Mitarbeiterabnutzung bezeichnet (Mitarbeiterfluktuationsanalyse), sowie mit ähnlichen Problemen wie der Vorhersage der Kundenabwanderung und der Vorhersage der Kundenausgaben .

Es gibt viele Möglichkeiten, Ihre Mitarbeiterdaten in eine einzige Tabelle zu transformieren. Dies ist jedoch eine der einfachsten:

Sie erstellen eine einzelne Tabelle, die alle Mitarbeiter darstellt, die am 1. Januar 2019 in der Organisation anwesend waren, mit Spalten für Werte wie die Zeit, die sie in der Organisation verbracht haben, und einer letzten Spalte, die auf TRUE oder FALSE (ein Boolescher Wert) gesetzt ist und angibt, ob sie die Organisation bis zum 31. Januar verlassen haben oder nicht. Dies können Ihre Trainingsdaten sein.

Eine Beispieltabelle für Mitarbeiter. Die letzte Spalte ist ein Boolescher Wert, den wir vorhersagen möchten. Beachten Sie, dass das Alter das Alter am 1. Januar 2019 ist und nicht das aktuelle Alter des Mitarbeiters. Jeder Mitarbeiter hat seine eigene Zeile, sodass diese Tabelle direkt in ein Modell zur Analyse und Vorhersage der Mitarbeiterfluktuation eingegeben werden kann.

Erstellen Sie dann dieselbe Snapshot-Tabelle für den 1. Januar 2020, die als Ihre Testdaten dienen kann.

Sie können bei Ihren Spalten kreativ sein. Wenn Sie beispielsweise die Privatadresse der Mitarbeiter am Datum der Momentaufnahme haben, können Sie ihre Entfernung zum Büro, ihre Fahrtzeit usw. berechnen. Wichtig ist, dass alle Werte in Ihrer Tabelle die Werte zum Datum der Momentaufnahme sind. Die Entfernung in der Trainingstabelle sollte also die Entfernung vom Büro am 1. Januar 2019 zu ihrem Zuhause am 1. Januar 2019 sein, und das Alter sollte dem Alter des Mitarbeiters an diesem Datum entsprechen.

Es ist ziemlich schwierig, den letzten Punkt richtig hinzubekommen, und wenn Sie die Verbindungsoperation in SQL durchführen, müssen Sie Fensterfunktionen verwenden.

Training Ihres Churn-Prediction-Modells zur Vorhersage der Mitarbeiterfluktuation

Jetzt haben Sie beide Tabellen und können sie in einen maschinellen Lernalgorithmus Ihrer Wahl einspeisen. Sie teilen dem Algorithmus diese beiden Dinge mit:

Ich kenne das Alter des Mitarbeiters, die Entfernung zum Büro, die Zeit in der Gehaltsstufe, die Zeit in der Organisation

Ich möchte die Fluktuation des Mitarbeiters im nächsten Monat vorhersagen

Wenn Sie Python mögen, empfehle ich Ihnen, einen Random Forest oder Gradient Boosted Tree auszuprobieren. Sie können aber auch ein cloudbasiertes Auto-ML- Tool wie Microsoft Azure oder Google Cloud Platform verwenden. Für den Einstieg stehen zahlreiche Tutorials zur Verfügung.

Achten Sie darauf, die Mitarbeiter-ID von der Analyse auszuschließen, da sonst die Gefahr besteht, dass Ihr Modell sich nur merkt, welche Mitarbeiter das Unternehmen verlassen haben!

Sie können Ihr Modell mit den Daten von 2019 trainieren und mit den Daten von 2020 auswerten. Wenn es gut funktioniert, wissen Sie, dass Ihr Modell robust genug ist, um Muster zu lernen und diese in einem Jahr auf eine Kohorte von Mitarbeitern anzuwenden.

Das bedeutet, dass Sie den aktuellen Mitarbeiterbestand analysieren und eine Rangfolge derjenigen erstellen können, bei denen das größte Risiko eines Ausscheidens besteht. So kann Ihre Personalabteilung gezielt Maßnahmen zur Mitarbeiterbindung ergreifen.

(In der Praxis würde ich nicht nur an einem einzigen Tag eine Momentaufnahme machen, sondern mehrere Momentaufnahmen über das Jahr verteilt und versuchen, für jeden Monat die gleiche Datenmenge zu behalten, um Verzerrungen durch saisonale Effekte auszuschließen. Es gibt auch keinen Grund, den Überwachungszeitraum auf einen Monat zu beschränken – Sie können das System jederzeit darauf trainieren, die Fluktuation im nächsten Jahr oder Jahrzehnt vorherzusagen, wenn Sie über genügend Daten verfügen.)

Natürlich hat Ihr Modell die Covid-19-Pandemie nicht vorhergesehen. Dies wird immer eine Einschränkung des maschinellen Lernens sein, bei dem es darum geht, Muster aus der Vergangenheit zu lernen, um sie auf die Zukunft anzuwenden. Sie können jedoch jedes System, das Ihr Modell verwendet, so gestalten, dass ein manueller „Anpassungsfaktor“ möglich ist, beispielsweise um die Fluktuation für alle Mitarbeiter während eines wirtschaftlichen Abschwungs um eine benutzerdefinierte Konstante anzupassen.

Fluktuationsanalyse: Ursachen der Mitarbeiterfluktuation analysieren

Bei den meisten Modellen des maschinellen Lernens können Sie einen Blick ins Innere werfen und analysieren, wie die von ihnen zurückgegebenen Entscheidungen getroffen werden. Dies wird als Modellerklärbarkeit oder Merkmalswichtigkeit bezeichnet: ( Lesen Sie mehr über erklärbare KI oder XAI )

Beispiel für die Ausgabe der Merkmalswichtigkeiten des Random-Forest-Modells in der Scikit-Learn-Python-Bibliothek.

Wenn Sie feststellen, dass die Entfernung zwischen Wohnort und Büro ein wesentlicher Faktor für die Fluktuation ist, können Sie Ihre Einstellungspolitik anpassen, um Bewerbern, die in der Nähe wohnen, den Vorzug zu geben, ein Umzugspaket anzubieten oder ein Firmenbus- oder Fahrgemeinschaftsprogramm anzubieten. Natürlich dürfen Sie diese Informationen nicht dazu verwenden, um nach Alter zu diskriminieren.

Fazit: Wie geht es weiter mit der Fluktuationsanalyse?

Die Vorteile der Anwendung eines solchen Modells zur Vorhersage der Mitarbeiterfluktuation gehen über die reinen Vorhersagefähigkeiten hinaus und liefern Erkenntnisse, die die Abläufe im gesamten Unternehmen verändern können. Die Kosteneinsparungen für das Unternehmen durch die Analyse der Mitarbeiterfluktuation sind zweifach, da HR-Experten die Erklärungen des Modells nutzen können, um unternehmensweite Bindungsrichtlinien zu entwickeln und auch gezielt Mitarbeiter mit hohem Risiko mit Bindungsinitiativen anzusprechen.

Nachtrag: Alternative Ansätze zum Klassifikationsmodell zur Fluktuationsanalyse

Außer dem oben beschriebenen Klassifizierungsmodell fallen mir noch zwei weitere Möglichkeiten ein, mit denen Sie versuchen könnten, die Mitarbeiterfluktuation zu modellieren.

Regression zur Analyse der Mitarbeiterfluktuation?

Erstens: Warum versuchen Sie es nicht statt mit einer Klassifizierung mit einem Regressionsmodell , um die Gesamtdauer vorherzusagen, die ein Mitarbeiter ab einem bestimmten Datum im Unternehmen verbleibt?

Tatsächlich würde ich die Verwendung einer Regression aus folgenden Gründen nicht empfehlen: Von den Mitarbeitern vom 1. Januar 2019 wissen wir, wie viel länger jeder bis heute, 29. April 2020, im Unternehmen geblieben ist, also 484 Tage. Von allen, die am 484. Tag noch im Unternehmen sind, wissen wir, dass ihre Gesamtverweildauer größer oder gleich 484 ist, aber wir können sie nicht definieren. Für diese undefinierten Werte müssten Sie sich einen Workaround für das Modell überlegen. Wenn Sie die Verweildauer auf 484 oder einen beliebig großen Wert festlegen, führen Sie eine Verzerrung ein, mit der ein Regressionsmodell nicht richtig umgehen kann. Wenn Sie diese Personen einfach ausschließen, führen Sie eine weitere Verzerrung ein. Statistiker würden sagen, unsere Daten sind rechtszensiert .

Wenn Sie maschinelles Lernen verwenden möchten, um die verbleibende Gesamtdauer vorherzusagen, die eine Person im Unternehmen verbleibt, würde ich vorschlagen, ein separates Klassifizierungsmodell zu trainieren, um die Fluktuation innerhalb von 1 Monat, 2 Monaten usw. vorherzusagen, und diese zu kombinieren, wenn Sie eine Vorhersage treffen möchten.

Kann die Überlebensanalyse uns helfen, die Fluktuation von Mitarbeitern vorherzusagen? Eine Alternative zur Klassifizierung als Modell zur Vorhersage der Fluktuation

Als weitere Alternative zum Klassifizierungsmodell könnte die Überlebensanalyse ein mögliches alternatives Tool aus der Statistik sein, das wir verwenden könnten.

Dies wird zum Beispiel in klinischen Studien zu Krankheiten mit hohen Sterblichkeitsraten (vor allem Krebs-, Herzinfarkt- und Schlaganfallpatienten) angewendet, um den Anteil einer Ausgangskohorte oder von Patienten zu analysieren, die zu verschiedenen Zeitpunkten noch nicht verstorben sind.

Die Überlebensraten können in einer sogenannten Kaplan-Meier-Kurve dargestellt werden:

Kaplan-Meier-Überlebenskurve für Patienten mit akuter myeloischer Leukämie, unterteilt in zwei Gruppen, von denen eine behandelt wird, die andere nicht.

Sie können auch eine Zahl namens Kaplan-Meier-Schätzer berechnen, die eine Annäherung an die Überlebensrate zu einem beliebigen Zeitpunkt darstellt.

Die Überlebensanalyse ist robust gegenüber Rechtszensur und kann daher zur Analyse der Mitarbeiterfluktuation über einen längeren Zeitraum hinweg verwendet werden als das maschinelle Lernmodell. Die Überlebensanalyse wird jedoch komplexer, wenn wir Vorhersagen auf der Grundlage vieler unabhängiger Variablen treffen (Pendelstrecke, Alter, Gehaltsstufe usw.).

Mir ist kein Unternehmen bekannt, das Überlebensanalysen zur Vorhersage der Mitarbeiterfluktuation einsetzt, aber es würde mich interessieren, ob das jemand tut.

Weitere Informationen zur Mitarbeiterfluktuationsanalyse und zu Fluktuationsvorhersagemodellen

Wiesweg, Multivariate Überlebensanalyse , R-Projekt (2020)
Hulley et al., Gestaltung klinischer Forschung , Wolters Kluwer (2013)