Wie funktioniert Projektmanagement in der Datenwissenschaft?

· Thomas Wood
Wie funktioniert Projektmanagement in der Datenwissenschaft?

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Warum ist es so schwierig, traditionelles Projektmanagement auf Data-Science-Projekte anzuwenden? Wie Sie Ihr Data-Science-Projektmanagement reibungslos gestalten.

Eine törichte Konsequenz ist der Kobold der Kleingeister.

Ralph Waldo Emerson (1803-1882)

Data Science passt normalerweise nicht sehr gut in Standard-Projektmanagementansätze, die in anderen Disziplinen seit langem etabliert sind. Warum ist das?

Data-Science-Projekte beinhalten traditionell eine lange Erkundungsphase und viele Unbekannte, sogar erst recht spät in einem Projekt. Dies unterscheidet sich von der herkömmlichen Softwareentwicklung, bei der es möglich ist, Aufgaben zu Beginn aufzuzählen und zu quantifizieren. Ein Softwareprojektmanager definiert häufig die Dauer und das Endergebnis des Projekts, bevor eine Codezeile geschrieben wurde.

Traditionelle Ansätze

1 / 4
Kanban
2 / 4
Agile
3 / 4
Gantt
4 / 4
Gantt

Die bekanntesten traditionellen Projektmanagementansätze sind

  • Wasserfall – bekannt für das Gantt-Diagramm, eine Art kaskadierendes Balkendiagramm, das Aufgaben und ihre Abhängigkeiten zeigt.

  • Agil – Aufgaben aufgeteilt in Sprints von 1–2 Wochen.

  • Kanban -Karten, die sich von links nach rechts über ein Brett bewegen, von „zu erledigen“ über „in Bearbeitung“ bis „ erledigt “.

  • Es gibt auch ein datenwissenschaftsorientiertes Projektmanagementsystem namens CRISP-DM , das eine Reihe von Phasen des Projekts umfasst: Geschäftsverständnis , Datenverständnis , Datenvorbereitung , Modellierung , Bewertung und Bereitstellung .

Ich glaube, das Hauptproblem all dieser Ansätze besteht darin, dass Data-Science-Projekte höchst unvorhersehbar und Änderungen unterworfen sind. Leider lässt sich oft erst dann vorhersagen, was in einem Data-Science-Projekt erreicht werden kann, wenn bereits erheblicher Aufwand investiert wurde.

Anpassung des Projektmanagements an die Datenwissenschaft

Ich würde empfehlen, sich erst nach der ersten Erkundungsphase von einer Woche für eine Projektstruktur zu entscheiden.

Dann würde ich vorschlagen, zu entscheiden, was das Unternehmen braucht:

  • ein eingesetztes Vorhersagemodell?

  • eine eigenständige Analyse?

  • eine vollwertige Website und API?

Der Schlüssel liegt in der Flexibilität, dass sich diese Anforderungen später ändern können.

Ein Beispiel dafür, wie ein Data-Science-Projekt verwaltet werden könnte

Nehmen wir ein Beispiel: ein Projekt zur Bereitstellung eines Vorhersagemodells. Nehmen wir an, dass die Werbespots und die Zustimmung des Stakeholders bereits vorhanden sind. Stellen Sie sich vor, ein hypothetisches Unternehmen möchte ein Vorhersagemodell, um vorherzusagen, welche Produkte seine Kunden kaufen werden.

Das Projekt könnte mit den folgenden ungefähren Phasen fortfahren:

  • 2-5 Tage: Das Geschäftsproblem verstehen.

  • 2–5 Tage: Verstehen Sie die verfügbaren Daten. Sie beginnen eine Vorstellung davon zu bekommen, ob das Projekt überhaupt möglich ist und ob es sich auf einen Zeitraum von Wochen, Monaten oder Jahren erstrecken wird.

  • 10–20 Tage: Erstellen Sie einen „Quick and Dirty“-Prototyp. Dies läuft möglicherweise nur auf einem Laptop, vermittelt dem Beteiligten aber einen qualitativen Eindruck davon, was erreichbar ist.

  • Stakeholder-Treffen : Definieren Sie KPIs und Anforderungen, Zeitrahmen usw. Zu diesem Zeitpunkt haben Sie eine Vorstellung davon, wie lange das Projekt dauern wird – viel später, als wenn es sich um ein Projekt in der Softwareentwicklung oder Konstruktion handeln würde.

  • 3–6 Monate: Verfeinern Sie das Modell und erarbeiten Sie, wie es auf Echtzeitdaten zum Laufen gebracht werden kann. Dabei werden in der Regel 200 verschiedene Modelle erstellt und jedes anhand des KPI bewertet. Während des gesamten Prozesses wird es außerdem eine enge Kommunikation mit den Stakeholdern geben, während das Projekt und das Modell Gestalt annehmen.

  • 3 Monate: Bereitstellung, Lasttests, Qualitätssicherung, Sicherstellung der Integration in die Systeme des Kunden. Dabei sind Entwickler auf Kundenseite involviert und können mit den üblichen Software-Entwicklungstools projektiert werden.

  • Stakeholder-Treffen zur Bewertung des Projektergebnisses, Abschluss des Projekts, Übergabe, Dokumentation und Wartungspläne usw.

Abgesehen von der letzten Bereitstellungsphase würde ich vorschlagen, dass alle Phasen des Projekts recht flexibel definiert werden sollten.

Insbesondere wenn Sie denken, dass eine Aufgabe 1 Monat dauern sollte, wenn Sie zum ersten Mal versuchen, sie zu quantifizieren, dauert es in der Praxis aufgrund der vielen unbekannten Probleme, die wahrscheinlich auftauchen, oft 2 Monate. Zu jedem Zeitpunkt des Projekts kann es zu Überraschungen kommen, die die Gesamtdauer eher verlängern als verkürzen.

Die Kehrseite dieser Flexibilität besteht darin, dass regelmäßige Besprechungen, E-Mails und die Kommunikation mit den Stakeholdern unerlässlich sind, um sicherzustellen, dass das Unternehmen über den Projektfortschritt auf dem Laufenden bleibt und die Datenwissenschaftler alles erhalten, was sie benötigen (Daten, Zugriff durch Sicherheit, Zusammenarbeit mit den zuständigen Abteilungen des Unternehmens usw.).

Abschluss

Der Schlüssel liegt im Namen: Data Science . Bei der Wissenschaft geht es darum, eine Hypothese zu definieren und zu testen, und bei der Datenwissenschaft handelt es sich um einen iterativen Prozess des Ausprobierens, Scheiterns und Verbesserns. Versuche, es in Projektmanagementtechniken anderer Disziplinen einzuschleusen, enden in Frustration und erhöhen die Wahrscheinlichkeit, dass das Projekt scheitert oder aufgegeben wird.

Ich möchte nicht vorschlagen, überhaupt keine Agile- oder Wasserfall-Methoden zu verwenden. Tatsächlich können sie von entscheidender Bedeutung sein, insbesondere wenn Sie ein Data-Science-Team skalieren müssen. Allerdings sollte jeder gewählte Projektmanagement-Ansatz nur als Richtlinie dienen und nicht strikt eingehalten werden.

Wenn Sie sich für die Verwendung einer Waterfall-Projektmanagementphilosophie entscheiden, haben wir im Abschnitt „ Ressourcen “ unserer Website einen Gantt-Diagrammgenerator im Browser für NLP-Projekte sowie eine Kickoff-Checkliste für Data-Science-Projekte und einen Data-Science-Roadmap-Planer bereitgestellt . eine Projektkostenplaner-Tabelle und ein Projektrisiko-Tool .

Finden Sie Top-NLP-Talente!

Suchen Sie Experten in Natürlicher Sprachverarbeitung? Veröffentlichen Sie Ihre Stellenangebote bei uns und finden Sie heute Ihren idealen Kandidaten!

Veröffentlichen Sie einen Job

Big-Data-Beratung – 4 häufigste Probleme gelöst
Data scienceBig data

Big-Data-Beratung – 4 häufigste Probleme gelöst

Mittlerweile sind es Organisationen aller Größenordnungen und fast aller Sektoren werden zunehmend datengesteuert, insbesondere als größere Datenspeicher Systeme und schnellere Computer treiben die Leistungsgrenzen immer weiter voran.

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution
Ai and societyData science

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution

Aufgrund des umfangreichen Einsatzes von Technologie und der Arbeitsteilung hat die Arbeit des durchschnittlichen Gig-Economy-Arbeiters jeden individuellen Charakter und damit auch jeden Charme für den Arbeitnehmer verloren.

KI im Personalwesen: Die Zukunft der Arbeit verändern
Ai and societyData science

KI im Personalwesen: Die Zukunft der Arbeit verändern

Die Auswirkungen von KI auf die Humanressourcen Die Arbeitswelt verändert sich rasant, sowohl aufgrund der Einführung traditioneller Data-Science-Praktiken in immer mehr Unternehmen als auch aufgrund der zunehmenden Beliebtheit generativer KI-Tools wie ChatGPT und Googles BARD bei nicht-technischen Arbeitnehmern.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us