Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!
Finden Sie Ihren TraumjobGroße Unternehmen stehen heute vor der Herausforderung, zu verstehen und vorherzusagen, welche Mitarbeiter das Unternehmen verlassen werden. Diese sogenannte Mitarbeiterfluktuationsprognose oder Personalabwanderungsprognose ist eine der größten Herausforderungen für Unternehmen.
Mitarbeiter nehmen nicht immer an Offboarding-Prozessen teil, sind im Austrittsgespräch mit der Personalabteilung möglicherweise nicht wirklich mitteilsam und wenn es dann zum Austrittsgespräch kommt, ist es zu spät, die Probleme anzusprechen, die den Mitarbeiter ursprünglich zum Ausscheiden veranlasst haben.
Wenn Sie über eine große Belegschaft verfügen, möchten Sie möglicherweise außerdem vorhersagen können, bei welchen Mitarbeitern zu einem bestimmten Zeitpunkt die Gefahr besteht, dass sie das Unternehmen verlassen, wie lange sie voraussichtlich bleiben werden und Hinweise darauf erhalten, mit welchen Maßnahmen sich die Fluktuation verringern lässt.
Glücklicherweise verfügen die meisten Unternehmen heute über eine Mitarbeiterdatenbank. Diese kann eine wahre Goldgrube für Datenwissenschaftler sein, die die Fluktuation von Mitarbeitern analysieren, erklären oder vorhersagen möchten, und ist eine der spannendsten Anwendungen von KI in der Wirtschaft .
Wir haben eine Reihe von Projekten im Bereich der Analyse der Mitarbeiterfluktuation durchgeführt, von der Vorhersage der Mitarbeiterfluktuation für den britischen National Health Service bis hin zur Vorhersage der Studentenfluktuation (Abbruch) für Hochschulen und die schottische Regierungsorganisation Skills Development Scotland . In beiden Fällen analysierten wir die Ursachen der Fluktuation und entwickelten ein Fluktuationsvorhersagemodell, mit dem das Problem gemildert werden konnte.
Dieses Problem der Mitarbeiterfluktuationsanalyse ist etwas kniffliger als die Vorhersage von Kundenausgaben . Jede Mitarbeiterdatenbank enthält hochsensible Informationen . Wenn Sie sich in Großbritannien oder der EU befinden, beschränkt die DSGVO die Art der Analyse, die Sie in einer Mitarbeiterdatenbank durchführen können, die Maßnahmen, die Sie auf der Grundlage von Mitarbeiterdaten ergreifen dürfen, und sogar die Technologie, die Sie verwenden können. Möglicherweise können Sie keine externen Datenspeicher und -prozessoren wie Cloud-Dienste verwenden, und wenn Sie dies tun, sind Sie auf europäische Server beschränkt.
In Ihrem Unternehmen verfügen Sie in der Regel über unterschiedliche Datenbanken, beispielsweise Gehaltsdatenbanken, Mitarbeiteradressdatenbanken, Onboarding- und Einstellungsunterlagen usw. Diese werden wahrscheinlich von unterschiedlichen Abteilungen verwaltet.
Der erste Schritt wäre, einen Weg zu finden, die Datensätze zu vereinheitlichen, sodass Sie für jeden aktuellen und ehemaligen Mitarbeiter problemlos auf alle Daten über ihn zugreifen können. Sie möchten wissen, wann jemand in die Organisation eingetreten ist, wann er in die Gehaltsstufe aufgestiegen ist und wann er das Unternehmen verlassen hat.
Hier ein Punkt zu Datenstrategien, die Sie als Unternehmen übernehmen können, um die Analyse der Mitarbeiterfluktuation zu vereinfachen:
Eine Mitarbeiterdatenbank besteht aus mehreren Tabellen, die durch IDs miteinander verknüpft sind. In der Praxis sind die Mitarbeiterdaten eines Unternehmens über verschiedene Systeme wie Gehaltsabrechnung, Arbeitszeitnachweise, Personalbeschaffung, Personalwesen, Buchhaltung usw. verstreut. Es ist also ein erheblicher Arbeitsaufwand erforderlich, um diese zu verknüpfen und ein Modell zur Vorhersage der Mitarbeiterfluktuation zu entwickeln. Bildquelle: MySQL unter dev.mysql.com.
Wenn Sie herausgefunden haben, wie Sie die Datensätze aller Mitarbeiter zusammenführen, besteht der nächste Schritt bei der Analyse der Mitarbeiterfluktuation darin, zu versuchen, einen Datensatz in eine einzige flache Tabelle umzuwandeln. Dies ist das einfachste Format, um es in einen Algorithmus für maschinelles Lernen einzuspeisen.
Employee turnover analysis
Es gibt viele Möglichkeiten, Ihre Mitarbeiterdaten in eine einzige Tabelle zu transformieren. Dies ist jedoch eine der einfachsten:
Sie erstellen eine einzelne Tabelle, die alle Mitarbeiter darstellt, die am 1. Januar 2019 in der Organisation anwesend waren, mit Spalten für Werte wie die Zeit, die sie in der Organisation verbracht haben, und einer letzten Spalte, die auf TRUE oder FALSE (ein Boolescher Wert) gesetzt ist und angibt, ob sie die Organisation bis zum 31. Januar verlassen haben oder nicht. Dies können Ihre Trainingsdaten sein.
Eine Beispieltabelle für Mitarbeiter. Die letzte Spalte ist ein Boolescher Wert, den wir vorhersagen möchten. Beachten Sie, dass das Alter das Alter am 1. Januar 2019 ist und nicht das aktuelle Alter des Mitarbeiters. Jeder Mitarbeiter hat seine eigene Zeile, sodass diese Tabelle direkt in ein Modell zur Analyse und Vorhersage der Mitarbeiterfluktuation eingegeben werden kann.
Erstellen Sie dann dieselbe Snapshot-Tabelle für den 1. Januar 2020, die als Ihre Testdaten dienen kann.
Sie können bei Ihren Spalten kreativ sein. Wenn Sie beispielsweise die Privatadresse der Mitarbeiter am Datum der Momentaufnahme haben, können Sie ihre Entfernung zum Büro, ihre Fahrtzeit usw. berechnen. Wichtig ist, dass alle Werte in Ihrer Tabelle die Werte zum Datum der Momentaufnahme sind. Die Entfernung in der Trainingstabelle sollte also die Entfernung vom Büro am 1. Januar 2019 zu ihrem Zuhause am 1. Januar 2019 sein, und das Alter sollte dem Alter des Mitarbeiters an diesem Datum entsprechen.
Es ist ziemlich schwierig, den letzten Punkt richtig hinzubekommen, und wenn Sie die Verbindungsoperation in SQL durchführen, müssen Sie Fensterfunktionen verwenden.
Jetzt haben Sie beide Tabellen und können sie in einen maschinellen Lernalgorithmus Ihrer Wahl einspeisen. Sie teilen dem Algorithmus diese beiden Dinge mit:
Ich kenne das Alter des Mitarbeiters, die Entfernung zum Büro, die Zeit in der Gehaltsstufe, die Zeit in der Organisation
Ich möchte die Fluktuation des Mitarbeiters im nächsten Monat vorhersagen
Wenn Sie Python mögen, empfehle ich Ihnen, einen Random Forest oder Gradient Boosted Tree auszuprobieren. Sie können aber auch ein cloudbasiertes Auto-ML- Tool wie Microsoft Azure oder Google Cloud Platform verwenden. Für den Einstieg stehen zahlreiche Tutorials zur Verfügung.
Achten Sie darauf, die Mitarbeiter-ID von der Analyse auszuschließen, da sonst die Gefahr besteht, dass Ihr Modell sich nur merkt, welche Mitarbeiter das Unternehmen verlassen haben!
Sie können Ihr Modell mit den Daten von 2019 trainieren und mit den Daten von 2020 auswerten. Wenn es gut funktioniert, wissen Sie, dass Ihr Modell robust genug ist, um Muster zu lernen und diese in einem Jahr auf eine Kohorte von Mitarbeitern anzuwenden.
Das bedeutet, dass Sie den aktuellen Mitarbeiterbestand analysieren und eine Rangfolge derjenigen erstellen können, bei denen das größte Risiko eines Ausscheidens besteht. So kann Ihre Personalabteilung gezielt Maßnahmen zur Mitarbeiterbindung ergreifen.
(In der Praxis würde ich nicht nur an einem einzigen Tag eine Momentaufnahme machen, sondern mehrere Momentaufnahmen über das Jahr verteilt und versuchen, für jeden Monat die gleiche Datenmenge zu behalten, um Verzerrungen durch saisonale Effekte auszuschließen. Es gibt auch keinen Grund, den Überwachungszeitraum auf einen Monat zu beschränken – Sie können das System jederzeit darauf trainieren, die Fluktuation im nächsten Jahr oder Jahrzehnt vorherzusagen, wenn Sie über genügend Daten verfügen.)
Natürlich hat Ihr Modell die Covid-19-Pandemie nicht vorhergesehen. Dies wird immer eine Einschränkung des maschinellen Lernens sein, bei dem es darum geht, Muster aus der Vergangenheit zu lernen, um sie auf die Zukunft anzuwenden. Sie können jedoch jedes System, das Ihr Modell verwendet, so gestalten, dass ein manueller „Anpassungsfaktor“ möglich ist, beispielsweise um die Fluktuation für alle Mitarbeiter während eines wirtschaftlichen Abschwungs um eine benutzerdefinierte Konstante anzupassen.
Bei den meisten Modellen des maschinellen Lernens können Sie einen Blick ins Innere werfen und analysieren, wie die von ihnen zurückgegebenen Entscheidungen getroffen werden. Dies wird als Modellerklärbarkeit oder Merkmalswichtigkeit bezeichnet: ( Lesen Sie mehr über erklärbare KI oder XAI )
Beispiel für die Ausgabe der Merkmalswichtigkeiten des Random-Forest-Modells in der Scikit-Learn-Python-Bibliothek.
Wenn Sie feststellen, dass die Entfernung zwischen Wohnort und Büro ein wesentlicher Faktor für die Fluktuation ist, können Sie Ihre Einstellungspolitik anpassen, um Bewerbern, die in der Nähe wohnen, den Vorzug zu geben, ein Umzugspaket anzubieten oder ein Firmenbus- oder Fahrgemeinschaftsprogramm anzubieten. Natürlich dürfen Sie diese Informationen nicht dazu verwenden, um nach Alter zu diskriminieren.
Die Vorteile der Anwendung eines solchen Modells zur Vorhersage der Mitarbeiterfluktuation gehen über die reinen Vorhersagefähigkeiten hinaus und liefern Erkenntnisse, die die Abläufe im gesamten Unternehmen verändern können. Die Kosteneinsparungen für das Unternehmen durch die Analyse der Mitarbeiterfluktuation sind zweifach, da HR-Experten die Erklärungen des Modells nutzen können, um unternehmensweite Bindungsrichtlinien zu entwickeln und auch gezielt Mitarbeiter mit hohem Risiko mit Bindungsinitiativen anzusprechen.
Außer dem oben beschriebenen Klassifizierungsmodell fallen mir noch zwei weitere Möglichkeiten ein, mit denen Sie versuchen könnten, die Mitarbeiterfluktuation zu modellieren.
Erstens: Warum versuchen Sie es nicht statt mit einer Klassifizierung mit einem Regressionsmodell , um die Gesamtdauer vorherzusagen, die ein Mitarbeiter ab einem bestimmten Datum im Unternehmen verbleibt?
Tatsächlich würde ich die Verwendung einer Regression aus folgenden Gründen nicht empfehlen: Von den Mitarbeitern vom 1. Januar 2019 wissen wir, wie viel länger jeder bis heute, 29. April 2020, im Unternehmen geblieben ist, also 484 Tage. Von allen, die am 484. Tag noch im Unternehmen sind, wissen wir, dass ihre Gesamtverweildauer größer oder gleich 484 ist, aber wir können sie nicht definieren. Für diese undefinierten Werte müssten Sie sich einen Workaround für das Modell überlegen. Wenn Sie die Verweildauer auf 484 oder einen beliebig großen Wert festlegen, führen Sie eine Verzerrung ein, mit der ein Regressionsmodell nicht richtig umgehen kann. Wenn Sie diese Personen einfach ausschließen, führen Sie eine weitere Verzerrung ein. Statistiker würden sagen, unsere Daten sind rechtszensiert .
Wenn Sie maschinelles Lernen verwenden möchten, um die verbleibende Gesamtdauer vorherzusagen, die eine Person im Unternehmen verbleibt, würde ich vorschlagen, ein separates Klassifizierungsmodell zu trainieren, um die Fluktuation innerhalb von 1 Monat, 2 Monaten usw. vorherzusagen, und diese zu kombinieren, wenn Sie eine Vorhersage treffen möchten.
Als weitere Alternative zum Klassifizierungsmodell könnte die Überlebensanalyse ein mögliches alternatives Tool aus der Statistik sein, das wir verwenden könnten.
Dies wird zum Beispiel in klinischen Studien zu Krankheiten mit hohen Sterblichkeitsraten (vor allem Krebs-, Herzinfarkt- und Schlaganfallpatienten) angewendet, um den Anteil einer Ausgangskohorte oder von Patienten zu analysieren, die zu verschiedenen Zeitpunkten noch nicht verstorben sind.
Die Überlebensraten können in einer sogenannten Kaplan-Meier-Kurve dargestellt werden:
Kaplan-Meier-Überlebenskurve für Patienten mit akuter myeloischer Leukämie, unterteilt in zwei Gruppen, von denen eine behandelt wird, die andere nicht.
Sie können auch eine Zahl namens Kaplan-Meier-Schätzer berechnen, die eine Annäherung an die Überlebensrate zu einem beliebigen Zeitpunkt darstellt.
Die Überlebensanalyse ist robust gegenüber Rechtszensur und kann daher zur Analyse der Mitarbeiterfluktuation über einen längeren Zeitraum hinweg verwendet werden als das maschinelle Lernmodell. Die Überlebensanalyse wird jedoch komplexer, wenn wir Vorhersagen auf der Grundlage vieler unabhängiger Variablen treffen (Pendelstrecke, Alter, Gehaltsstufe usw.).
Mir ist kein Unternehmen bekannt, das Überlebensanalysen zur Vorhersage der Mitarbeiterfluktuation einsetzt, aber es würde mich interessieren, ob das jemand tut.
Entfesseln Sie das Potenzial Ihrer NLP-Projekte mit dem richtigen Talent. Veröffentlichen Sie Ihre Stelle bei uns und ziehen Sie Kandidaten an, die genauso leidenschaftlich über natürliche Sprachverarbeitung sind.
NLP-Experten einstellenGenerative KI Einführung Generative KI , ein Teilbereich der KI, verändert Branchen grundlegend und gestaltet die Zukunft. Durch die Nutzung fortschrittlicher Algorithmen kann generative KI Inhalte, Designs und Lösungen erstellen, die zuvor undenkbar waren.
Große Daten Das Aufkommen von Big Data hat ganze Branchen revolutioniert und traditionelle Geschäftsmodelle und Entscheidungsprozesse verändert. In dieser umfassenden Untersuchung gehen wir der Frage nach, was Big Data ist, welche erheblichen Auswirkungen es auf die Geschäftsstrategie hat und wie Unternehmen riesige Datenmengen nutzen können, um Innovationen voranzutreiben und sich einen Wettbewerbsvorteil zu verschaffen.
What we can do for you