Datenwissenschaft, Projektmanagement

Wie funktioniert Projektmanagement in der Datenwissenschaft?

· Thomas Wood
Wie funktioniert Projektmanagement in der Datenwissenschaft?

Warum ist es so schwierig, traditionelles Projektmanagement auf Data-Science-Projekte anzuwenden? Wie Sie Ihr Data-Science-Projektmanagement reibungslos gestalten.

A foolish consistency is the hobgoblin of little minds.

Ralph Waldo Emerson (1803-1882)

Data Science passt normalerweise nicht sehr gut in Standard-Projektmanagementansätze, die in anderen Disziplinen seit langem etabliert sind. Warum ist das?

Data-Science-Projekte beinhalten traditionell eine lange Erkundungsphase und viele Unbekannte, sogar erst recht spät in einem Projekt. Dies unterscheidet sich von der herkömmlichen Softwareentwicklung, bei der es möglich ist, Aufgaben zu Beginn aufzuzählen und zu quantifizieren. Ein Softwareprojektmanager definiert häufig die Dauer und das Endergebnis des Projekts, bevor eine Codezeile geschrieben wurde.

Traditionelle Ansätze

1 / 4
Kanban
2 / 4
Agile
3 / 4
Gantt
4 / 4
Gantt

Die bekanntesten traditionellen Projektmanagementansätze sind

  • Wasserfall – bekannt für das Gantt-Diagramm, eine Art kaskadierendes Balkendiagramm, das Aufgaben und deren Aufgaben zeigt Abhängigkeiten.

  • Agile – Aufgaben aufgeteilt in Sprints von 1–2 Wochen.

  • Kanban – Karten, die sich von links nach rechts über ein Brett bewegen, von to do über in Bearbeitung bis erledigt.

  • Es gibt auch ein datenwissenschaftlich orientiertes Projektmanagementsystem namens CRISP-DM , das eine Reihe von Phasen des Projekts umfasst: business Verständnis, Datenverständnis, Datenvorbereitung, Modellierung, Bewertung und Bereitstellung.

Ich glaube, das Hauptproblem all dieser Ansätze besteht darin, dass Data-Science-Projekte höchst unvorhersehbar und Änderungen unterworfen sind. Leider lässt sich oft erst dann vorhersagen, was in einem Data-Science-Projekt erreicht werden kann, wenn bereits erheblicher Aufwand investiert wurde.

Anpassung des Projektmanagements an die Datenwissenschaft

Ich würde empfehlen, sich erst nach der ersten Erkundungsphase von einer Woche für eine Projektstruktur zu entscheiden.

Dann würde ich vorschlagen, zu entscheiden, was das Unternehmen braucht:

  • ein eingesetztes Vorhersagemodell?

  • eine eigenständige Analyse?

  • eine vollwertige Website und API?

Der Schlüssel liegt in der Flexibilität, dass sich diese Anforderungen später ändern können.

Ein Beispiel dafür, wie ein Data-Science-Projekt verwaltet werden könnte

Nehmen wir ein Beispiel: ein Projekt zur Bereitstellung eines Vorhersagemodells. Nehmen wir an, dass die Werbespots und die Zustimmung des Stakeholders bereits vorhanden sind.
Stellen Sie sich vor, ein hypothetisches Unternehmen möchte ein Vorhersagemodell, um vorherzusagen, welche Produkte seine Kunden kaufen werden.

Das Projekt könnte mit den folgenden ungefähren Phasen fortfahren:

  • 2-5 Tage: Das Geschäftsproblem verstehen.

  • 2–5 Tage: Verstehen Sie die verfügbaren Daten. Man fängt an, eine Vorstellung davon zu bekommen, ob das Projekt überhaupt möglich ist und ob es sich auf einen Zeitraum von Wochen, Monaten oder Jahren erstrecken wird.

  • 10–20 Tage: Erstellen Sie einen „Quick and Dirty“-Prototyp. Dies läuft möglicherweise nur auf einem Laptop, vermittelt dem Beteiligten aber einen qualitativen Eindruck davon, was erreichbar ist.

  • Stakeholder-Treffen : Definieren Sie KPIs und Anforderungen, Zeitrahmen usw. Zu diesem Zeitpunkt haben Sie eine Vorstellung davon, wie lange das Projekt dauern wird – viel später, als wenn es ein Projekt wäre in der Softwareentwicklung oder Konstruktion.

  • 3–6 Monate: Verfeinern Sie das Modell und erarbeiten Sie, wie es auf Echtzeitdaten zum Laufen gebracht werden kann. Dabei werden in der Regel 200 verschiedene Modelle erstellt und jedes anhand des KPI bewertet. Während des gesamten Prozesses wird es außerdem eine enge Kommunikation mit den Stakeholdern geben, während das Projekt und das Modell Gestalt annehmen.

  • 3 Monate: Bereitstellung, Lasttests, Qualitätssicherung, Sicherstellung der Integration in die Systeme des Kunden. Dabei sind Entwickler auf Kundenseite involviert und können mit den üblichen Software-Entwicklungstools projektiert werden.

  • Stakeholder-Treffen zur Bewertung des Projektergebnisses, Abschluss des Projekts, Übergabe, Dokumentation und Wartungspläne usw.

Abgesehen von der letzten Bereitstellungsphase würde ich vorschlagen, dass alle Phasen des Projekts recht flexibel definiert werden sollten.

Insbesondere wenn Sie denken, dass eine Aufgabe 1 Monat dauern sollte, wenn Sie zum ersten Mal versuchen, sie zu quantifizieren, dauert es in der Praxis aufgrund der vielen unbekannten Probleme, die wahrscheinlich auftauchen, oft 2 Monate. Zu jedem Zeitpunkt des Projekts kann es zu Überraschungen kommen, die die Gesamtdauer eher verlängern als verkürzen.

Die Kehrseite dieser Flexibilität besteht darin, dass regelmäßige Besprechungen, E-Mails und die Kommunikation mit den Stakeholdern unerlässlich sind, um sicherzustellen, dass das Unternehmen über den Projektfortschritt auf dem Laufenden bleibt und die Datenwissenschaftler alles erhalten, was sie benötigen (Daten, Zugriff durch Sicherheit, Zusammenarbeit mit den zuständigen Abteilungen des Unternehmens usw.).

Abschluss

Der Schlüssel liegt im Namen: data science. Bei der Wissenschaft geht es darum, eine Hypothese zu definieren und zu testen, und bei der Datenwissenschaft handelt es sich um einen iterativen Prozess des Ausprobierens, Scheiterns und Verbesserns. Versuche, es in Projektmanagementtechniken anderer Disziplinen einzuschleusen, enden in Frustration und erhöhen die Wahrscheinlichkeit, dass das Projekt scheitert oder aufgegeben wird.

Ich möchte nicht vorschlagen, überhaupt keine Agile- oder Wasserfall-Methoden zu verwenden. Tatsächlich können sie von entscheidender Bedeutung sein, insbesondere wenn Sie ein Data-Science-Team skalieren müssen. Allerdings sollte jeder gewählte Projektmanagement-Ansatz nur als Richtlinie dienen und nicht strikt eingehalten werden.

Wenn Sie sich für die Verwendung einer Wasserfall-Projektmanagementphilosophie entscheiden, haben wir im Abschnitt Ressourcen unserer Website einen browserinternen Gantt-Diagrammgenerator für NLP-Projekte bereitgestellt sowie eine Checkliste für den Kickoff eines Data-Science-Projekts , einen Planer für eine Data-Science-Roadmap , eine Projektkostenplaner-Tabelle und ein .

Text Mining – Die Einführung in die geschäftliche Nutzung
DatenwissenschaftProjektmanagement

Text Mining – Die Einführung in die geschäftliche Nutzung

Text Mining: Kurzer Überblick Das moderne Unternehmen hat Zugriff auf riesige Mengen unstrukturierter Daten, doch diese Daten können sich nur dann als nützlich erweisen, wenn daraus die gewünschten Erkenntnisse gewonnen werden können.

Der Stand der Textanalyse im Jahr 2023: Trends und Möglichkeiten
DatenwissenschaftProjektmanagement

Der Stand der Textanalyse im Jahr 2023: Trends und Möglichkeiten

Wie sieht Textanalyse-KI im Jahr 2023 aus, wie sie generell funktioniert und wie Sie damit Ihre Kunden, Mitarbeiter und Ihre Marke auf das nächste Level heben können – all das und mehr in unserem ausführlichen Artikel.

Was ist Natural Language Understanding (NLU) und wie wird es verwendet? in der Praxis.
DatenwissenschaftProjektmanagement

Was ist Natural Language Understanding (NLU) und wie wird es verwendet? in der Praxis.

Natural Language Understanding (NLU): Überblick Wenn wir darüber nachdenken, ist Sprache eines der mächtigsten Werkzeuge in unserem Arsenal. Wir nutzen es, um auszudrücken, was wir fühlen oder denken.

Was wir für Sie tun können

Verwandeln Sie unstrukturierte Daten in umsetzbare Erkenntnisse

Kontaktiere uns