Wie wir a verwendet haben Verarbeitung natürlicher Sprache Clustering-Algorithmus, um das Pharmaunternehmen Boehringer Ingelheim dabei zu unterstützen, Einblicke in ihre Herstellungsprozesse zu gewinnen und Themen zu entdecken.

Das Pharmaunternehmen Boehringer Ingelheim stellt eine Reihe von Diabetes- und Krebsmedikamenten sowie Tiergesundheitsprodukten her. Boehringer verfügt über ein großes Netzwerk von Produktionsstätten, die sich über den ganzen Globus erstrecken. Medikamente können in einem Land synthetisiert, in einem anderen verpackt und zum Vertrieb in ein Drittland versandt werden.

In den Produktions-, Verpackungs- und Vertriebseinrichtungen überwachen die Mitarbeiter die Ausrüstung und das Produkt in allen Phasen auf Anomalien. Wenn ein Fehler auftritt, wird er in einem Computersystem mit einer Freitextbeschreibung des Problems protokolliert, z. B. „Temperaturabweichung aufgrund blockierter Entlüftung“, „Verpackung beim Transport gerissen“ usw. Oft werden diese Fehler in einer Landessprache protokolliert statt englisch.

Das Fertigungs- und Vertriebsteam von Boehringer wollte die häufigsten Fertigungsfehler identifizieren und in Kategorien einteilen. Leider machte es die Textmenge unpraktisch, dies manuell zu tun.

Zu diesem Zweck beauftragten sie Thomas Wood von Fast Data Science mit der Analyse des Textdatensatzes mit NLP-Techniken. Er baute ein Clustering-Modell (Topic Discovery) mit Latente Dirichlet-Zuordnung. Dieses Modell war in der Lage, die häufigsten Herstellungsfehler zu identifizieren und sie in Clustern zu gruppieren.

Sample output of NLP algorithm using topic detection / clustering LDA model

Das Ergebnis der statischen Analyse ermöglichte es Boehringer, die Hauptursachen für Herstellungsfehler in seiner Lieferkette klar zu erkennen.

Wenn Sie eine große Anzahl unstrukturierter Textdokumente haben und möchten, dass Fast Data Science Sie bei der Themenfindung, Clusteranalyse oder einer anderen NLP-Analyse unterstützt, Bitte nehmen Sie Kontakt mit uns auf.