Boehringer Ingelheim – NLP-Clustering auf Fabrikfehlerberichten

Boehringer Ingelheim – NLP-Clustering auf Fabrikfehlerberichten

Wie wir einen Clustering-Algorithmus zur Verarbeitung natürlicher Sprache eingesetzt haben, um dem Pharmaunternehmen Boehringer Ingelheim dabei zu helfen, Einblicke in seine Herstellungsprozesse zu gewinnen und Themen zu entdecken. Das Pharmaunternehmen Boehringer Ingelheim stellt zahlreiche Diabetes- und Krebsmedikamente sowie Tiergesundheitsprodukte her. Boehringer verfügt über ein großes Netzwerk an Produktionsstätten rund um den Globus. Arzneimittel können in einem Land synthetisiert, in einem anderen verpackt und zur Verteilung in ein Drittland verschifft werden.

Fast Data Science - London

Need a business solution?

Seit 2016 führend in den Bereichen NLP, ML und Data Science – kontaktieren Sie uns für eine NLP-Beratungssitzung.

Pie chart showing sample output of NLP algorithm using topic detection / clustering LDA model Kreisdiagramm, das die Beispielausgabe des NLP-Algorithmus unter Verwendung des LDA-Modells zur Themenerkennung/-clusterung zeigt

In den Produktions-, Verpackungs- und Vertriebsanlagen überwachen Mitarbeiter die Ausrüstung und das Produkt in allen Phasen auf etwaige Anomalien. Wenn ein Fehler auftritt, wird er in einem Computersystem mit einer Freitextbeschreibung des Problems protokolliert, z. B. „Temperaturabweichung aufgrund verstopfter Entlüftung“, „Verpackung beim Transport gerissen“ usw. Oft werden diese Fehler in einer Landessprache protokolliert statt Englisch.

Das Fertigungs- und Vertriebsteam von Boehringer wollte die häufigsten Herstellungsfehler identifizieren und sie in Kategorien einteilen. Leider war es aufgrund der Textmenge nicht möglich, dies manuell zu tun.

Zu diesem Zweck beauftragten sie Thomas Wood von Fast Data Science mit der Analyse des Textdatensatzes mit NLP-Techniken. Er erstellte ein Clustering-Modell (Themenerkennung) mithilfe der Latent Dirichlet Allocation . Mit diesem Modell konnten die häufigsten Herstellungsfehler identifiziert und in Cluster gruppiert werden. Das Ergebnis der statischen Analyse ermöglichte es Boehringer, klar zu erkennen, welche Hauptursachen für Herstellungsfehler in seiner Lieferkette waren.

Wenn Sie über eine große Anzahl unstrukturierter Textdokumente verfügen und möchten, dass Fast Data Science Sie bei der Themenfindung, Clusteranalyse oder einer anderen NLP-Analyse unterstützt, nehmen Sie bitte Kontakt mit uns auf .

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us