Ciencia de datos ágil: proceso de ciencia de datos
En este capítulo, comprenderemos el proceso de ciencia de datos y las terminologías necesarias para comprender el proceso.
“La ciencia de datos es la combinación de interfaz de datos, desarrollo de algoritmos y tecnología para resolver problemas analíticos complejos”.
La ciencia de datos es un campo interdisciplinario que abarca métodos, procesos y sistemas científicos con categorías incluidas en él como aprendizaje automático, conocimiento matemático y estadístico con investigación tradicional. También incluye una combinación de habilidades de piratería con experiencia sustancial. La ciencia de datos extrae principios de las matemáticas, la estadística, la ciencia de la información y la informática, la minería de datos y el análisis predictivo.
Los diferentes roles que forman parte del equipo de ciencia de datos se mencionan a continuación:
Clientes
Los clientes son las personas que utilizan el producto. Su interés determina el éxito del proyecto y sus comentarios son muy valiosos en la ciencia de datos.
Desarrollo de negocios
Este equipo de ciencia de datos registra a los primeros clientes, ya sea de primera mano o mediante la creación de páginas de destino y promociones. El equipo de desarrollo empresarial ofrece el valor del producto.
Gerentes de producto
Los gerentes de producto asumen la importancia de crear el mejor producto, que es valioso en el mercado.
Diseñadores de interacción
Se centran en las interacciones de diseño en torno a modelos de datos para que los usuarios encuentren el valor adecuado.
Científicos de datos
Los científicos de datos exploran y transforman los datos de nuevas formas para crear y publicar nuevas funciones. Estos científicos también combinan datos de diversas fuentes para crear un nuevo valor. Desempeñan un papel importante en la creación de visualizaciones con investigadores, ingenieros y desarrolladores web.
Investigadores
Como su nombre lo especifica, los investigadores están involucrados en actividades de investigación. Resuelven problemas complicados que los científicos de datos no pueden hacer. Estos problemas implican un enfoque intenso y un tiempo de aprendizaje automático y módulo de estadísticas.
Adaptarse al cambio
Todos los miembros del equipo de ciencia de datos deben adaptarse a los nuevos cambios y trabajar en función de los requisitos. Se deben realizar varios cambios para adoptar una metodología ágil con ciencia de datos, que se mencionan a continuación:
Elección de generalistas sobre especialistas.
Preferencia de equipos pequeños sobre equipos grandes.
Utilizando herramientas y plataformas de alto nivel.
Compartición continua e iterativa del trabajo intermedio.
Note
En el equipo de ciencia de datos ágiles, un pequeño equipo de generalistas utiliza herramientas de alto nivel que son escalables y refinan los datos a través de iteraciones en estados de valor cada vez más altos.
Considere los siguientes ejemplos relacionados con el trabajo de los miembros del equipo de ciencia de datos:
Los diseñadores entregan CSS.
Los desarrolladores web crean aplicaciones completas, comprenden la experiencia del usuario y el diseño de la interfaz.
Los científicos de datos deben trabajar tanto en la investigación como en la construcción de servicios web, incluidas las aplicaciones web.
Los investigadores trabajan en código base, que muestra resultados que explican los resultados intermedios.
Los gerentes de producto intentan identificar y comprender las fallas en todas las áreas relacionadas.