Agile Data Science - Processus de Data Science

Dans ce chapitre, nous comprendrons le processus de science des données et les terminologies nécessaires pour comprendre le processus.

«La science des données est le mélange d'interface de données, de développement d'algorithmes et de technologie afin de résoudre des problèmes analytiques complexes».

La science des données est un domaine interdisciplinaire englobant des méthodes, des processus et des systèmes scientifiques avec des catégories incluses dans l'apprentissage automatique, les connaissances mathématiques et statistiques avec la recherche traditionnelle. Il comprend également une combinaison de compétences en piratage avec une expertise de fond. La science des données s'inspire des mathématiques, des statistiques, des sciences de l'information et de l'informatique, de l'exploration de données et de l'analyse prédictive.

Les différents rôles qui font partie de l'équipe de science des données sont mentionnés ci-dessous -

Les clients

Les clients sont les personnes qui utilisent le produit. Leur intérêt conditionne le succès du projet et leurs retours sont très précieux en science des données.

Développement des affaires

Cette équipe de science des données signe chez les premiers clients, soit de première main, soit par la création de pages de destination et de promotions. L'équipe de développement commercial délivre la valeur du produit.

Gestionnaires de produits

Les chefs de produit prennent l'importance de créer le meilleur produit, ce qui est précieux sur le marché.

Concepteurs d'interaction

Ils se concentrent sur les interactions de conception autour des modèles de données afin que les utilisateurs trouvent la valeur appropriée.

Scientifiques des données

Les data scientists explorent et transforment les données de nouvelles manières pour créer et publier de nouvelles fonctionnalités. Ces scientifiques combinent également des données provenant de diverses sources pour créer une nouvelle valeur. Ils jouent un rôle important dans la création de visualisations avec des chercheurs, des ingénieurs et des développeurs Web.

Des chercheurs

Comme son nom l'indique, les chercheurs participent à des activités de recherche. Ils résolvent des problèmes complexes, ce que les data scientists ne peuvent pas faire. Ces problèmes impliquent une concentration et un temps intenses du module d'apprentissage automatique et de statistiques.

S'adapter au changement

Tous les membres de l'équipe de la science des données sont tenus de s'adapter aux nouvelles évolutions et de travailler en fonction des besoins. Plusieurs changements doivent être apportés pour adopter une méthodologie agile avec la science des données, qui sont mentionnés comme suit -

  • Choisir des généralistes plutôt que des spécialistes.

  • Préférence des petites équipes par rapport aux grandes équipes.

  • Utilisation d'outils et de plates-formes de haut niveau.

  • Partage continu et itératif des travaux intermédiaires.

Note

Dans l'équipe de science des données Agile, une petite équipe de généralistes utilise des outils de haut niveau qui sont évolutifs et affinent les données via des itérations dans des états de valeur de plus en plus élevés.

Considérez les exemples suivants liés au travail des membres de l'équipe de science des données -

  • Les concepteurs fournissent du CSS.

  • Les développeurs Web créent des applications entières, comprennent l'expérience utilisateur et la conception de l'interface.

  • Les scientifiques des données devraient travailler à la fois à la recherche et à la création de services Web, y compris des applications Web.

  • Les chercheurs travaillent dans la base de code, qui montre des résultats expliquant les résultats intermédiaires.

  • Les chefs de produit essaient d'identifier et de comprendre les failles dans tous les domaines connexes.