Big Data Analytics - Data Scientist
Le rôle d'un data scientist est normalement associé à des tâches telles que la modélisation prédictive, le développement d'algorithmes de segmentation, des systèmes de recommandation, des cadres de test A / B et souvent travailler avec des données brutes non structurées.
La nature de leur travail exige une compréhension approfondie des mathématiques, des statistiques appliquées et de la programmation. Il existe quelques compétences communes entre un analyste de données et un scientifique des données, par exemple la capacité d'interroger des bases de données. Les deux analysent les données, mais la décision d'un data scientist peut avoir un impact plus important dans une organisation.
Voici un ensemble de compétences qu'un data scientist doit normalement posséder -
- Programmation dans un package statistique tel que: R, Python, SAS, SPSS ou Julia
- Capable de nettoyer, d'extraire et d'explorer les données de différentes sources
- Recherche, conception et mise en œuvre de modèles statistiques
- Connaissances approfondies en statistiques, mathématiques et informatique
Dans l'analyse de Big Data, les gens confondent normalement le rôle d'un data scientist avec celui d'un data architect. En réalité, la différence est assez simple. Un architecte de données définit les outils et l'architecture dans lesquels les données seraient stockées, tandis qu'un data scientist utilise cette architecture. Bien sûr, un data scientist devrait être en mesure de mettre en place de nouveaux outils si nécessaire pour des projets ad hoc, mais la définition et la conception de l'infrastructure ne devraient pas faire partie de sa tâche.