Das Office of Rail and Road (ORR) ist die britische nationale Eisenbahnregulierungsbehörde, die für Gesundheit und Sicherheit auf den Hauptstrecken des Schienenverkehrs, der Londoner U-Bahn, der Stadtbahn und der Straßenbahnen verantwortlich ist.
Die ORR verfügt über eine große Menge strukturierter Datenfeeds in einem standardisierten Format mit Standort, Datum und Wert, die Zugleistung, Wetter, Wartungskosten, unbefugtes Betreten und andere Vorfälle aufzeichnen. Darüber hinaus gibt es einen großen Datensee mit unstrukturierten Textdaten. Die ORR hat einen Aufruf an Software- und KI-Spezialisten gestartet, um sie bei der Analyse der im gesamten Schienennetz aufgezeichneten Vorfalldaten mit einer benutzerfreundlichen Schnittstelle wie einem Drag-and-Drop-Tool zu unterstützen.
Die Ingenieure und Analysten bei ORR sind oft mit der Erstellung kausaler Analysen beauftragt, wie zum Beispiel
Fast Data Science - London
Ein Hindernis für diese Art von Analyse ist jedoch die Schwierigkeit, unterschiedliche und unterschiedlich strukturierte Datensätze miteinander zu verknüpfen. Das ORR verfügte über eine strukturierte Datenbank mit Variablen, die Verspätungen, Wetterdaten, Reparaturkosten, Wartung, Unfälle und andere Informationen darstellten. Sie verfügten über eine vorhandene Power BI-Lösung, mit der sie Datensätze untersuchen und bis zu einem gewissen Grad verknüpfen konnten. Es gab jedoch keine Drag-and-Drop-Lösung, mit der ein nicht-technischer Benutzer mit maschinellem Lernen und KI experimentieren konnte. Hier kam Fast Data Science ins Spiel.
Der ORR legte den Bedarf für eine grafische Benutzeroberfläche dar, die es nicht-technischen Beteiligten ermöglicht, Muster und Beziehungen innerhalb der Daten der Organisation zu untersuchen, und zwar über die Möglichkeiten der Standard-Power-BI-Konfiguration hinaus.
Wir haben ein Drag-and-Drop-Tool für den Browser entwickelt, mit dem Benutzer Datensätze grafisch erkunden und miteinander verknüpfen können. So können sie Modelle für maschinelles Lernen erstellen, die Auswirkungen wie hochwasserbedingte Verzögerungen als Funktion von Hochwasser und für die Entwässerung aufgewendeten Geldern vorhersagen können. Wir haben es Benutzern außerdem ermöglicht, die Verarbeitung natürlicher Sprache (NLP) zu nutzen, um Schlüsselsätze und Themen zu finden, die in bestimmten Gebieten des Landes oder zu bestimmten Daten üblich sind.
Unsere GUI war eine Premiere beim ORR, da sie hochrangigen Stakeholdern ermöglichte, mithilfe einer einfachen und leicht verständlichen grafischen Oberfläche mit maschinellem Lernen zu experimentieren, und dem ORR ermöglichte, Ideen über das zukünftige Potenzial des maschinellen Lernens in der Eisenbahnregulierung zu entwickeln.
Mithilfe unseres Tools war es nun auch einem Nicht-Datenwissenschaftler in der Organisation möglich, Datensätze per Drag-and-Drop in der Benutzeroberfläche zu verschieben, um Zugverspätungen in Abhängigkeit von Wetter und Reparaturkosten vorherzusagen. Die Benutzeroberfläche bot den Benutzern die Möglichkeit, lineare Regressions- oder Random-Forest-Modelle zu verwenden.
Damit konnte ein Benutzer Fragen simulieren wie:
What we can do for you