Agile Data Science - Data Science-Prozess
In diesem Kapitel werden wir den datenwissenschaftlichen Prozess und die Terminologien verstehen, die zum Verständnis des Prozesses erforderlich sind.
"Data Science ist die Mischung aus Datenschnittstelle, Algorithmusentwicklung und Technologie, um komplexe analytische Probleme zu lösen."
Die Datenwissenschaft ist ein interdisziplinäres Feld, das wissenschaftliche Methoden, Prozesse und Systeme mit Kategorien wie maschinelles Lernen, Mathematik und Statistikwissen mit traditioneller Forschung umfasst. Es beinhaltet auch eine Kombination von Hacking-Fähigkeiten mit fundiertem Fachwissen. Die Datenwissenschaft basiert auf Prinzipien aus Mathematik, Statistik, Informationswissenschaft und Informatik, Data Mining und prädiktiver Analyse.
Die verschiedenen Rollen, die Teil des Data Science-Teams sind, werden nachfolgend aufgeführt:
Kunden
Kunden sind die Personen, die das Produkt verwenden. Ihr Interesse bestimmt den Erfolg des Projekts und ihr Feedback ist in der Datenwissenschaft sehr wertvoll.
Geschäftsentwicklung
Dieses Team von Data Science meldet frühe Kunden entweder aus erster Hand oder durch die Erstellung von Zielseiten und Werbeaktionen an. Das Geschäftsentwicklungsteam liefert den Wert des Produkts.
Produktmanager
Produktmanager legen Wert darauf, das beste Produkt zu schaffen, das auf dem Markt wertvoll ist.
Interaktionsdesigner
Sie konzentrieren sich auf Entwurfsinteraktionen um Datenmodelle, damit Benutzer einen angemessenen Wert finden.
Datenwissenschaftler
Datenwissenschaftler untersuchen und transformieren die Daten auf neue Weise, um neue Funktionen zu erstellen und zu veröffentlichen. Diese Wissenschaftler kombinieren auch Daten aus verschiedenen Quellen, um einen neuen Wert zu schaffen. Sie spielen eine wichtige Rolle bei der Erstellung von Visualisierungen mit Forschern, Ingenieuren und Webentwicklern.
Forscher
Wie der Name schon sagt, sind Forscher an Forschungsaktivitäten beteiligt. Sie lösen komplizierte Probleme, die Datenwissenschaftler nicht lösen können. Diese Probleme beinhalten einen intensiven Fokus und eine intensive Zeit des Moduls für maschinelles Lernen und Statistik.
Anpassung an Veränderungen
Alle Teammitglieder von Data Science müssen sich an neue Änderungen anpassen und auf der Grundlage der Anforderungen arbeiten. Es sollten verschiedene Änderungen vorgenommen werden, um eine agile Methodik mit Data Science zu übernehmen, die wie folgt erwähnt werden:
Generalisten vor Spezialisten wählen.
Bevorzugung kleiner Teams gegenüber großen Teams.
Verwenden von Tools und Plattformen auf hoher Ebene.
Kontinuierliches und iteratives Teilen von Zwischenarbeiten.
Note
Im Agile Data Science-Team verwendet ein kleines Team von Generalisten hochrangige Tools, die skalierbar sind und Daten durch Iterationen in immer höhere Wertzustände verfeinern.
Betrachten Sie die folgenden Beispiele im Zusammenhang mit der Arbeit der Mitglieder des Data Science-Teams:
Designer liefern CSS.
Webentwickler erstellen ganze Anwendungen, verstehen die Benutzererfahrung und das Interface-Design.
Datenwissenschaftler sollten sowohl an der Forschung als auch am Aufbau von Webdiensten einschließlich Webanwendungen arbeiten.
Die Forscher arbeiten in der Codebasis, die Ergebnisse zeigt, die Zwischenergebnisse erklären.
Produktmanager versuchen, die Mängel in allen verwandten Bereichen zu identifizieren und zu verstehen.