3 cosas que te ayudarán a aprovechar al máximo tu bootcamp de ciencia de datos

Nov 28 2022
Y recomendaciones de recursos gratuitos.
Los bootcamps de ciencia de datos son intensivos con un plan de estudios repleto. Si no está seguro de si un bootcamp es la mejor manera de aprender ciencia de datos, puede leer mi artículo anterior aquí.
Foto de David Iskander en Unsplash

Los bootcamps de ciencia de datos son intensivos con un plan de estudios repleto. Si no está seguro de si un bootcamp es la mejor manera de aprender ciencia de datos, puede leer mi artículo anterior aquí. En este artículo, comparto mis pensamientos sobre cómo aprovechar al máximo el bootcamp una vez que haya tomado la decisión de unirse a uno.

Cuando comencé con mi bootcamp con Codeop , tenía una vaga idea de lo que aprendería según el plan de estudios que se me proporcionó al comienzo del curso. Ahora que estoy en el meollo del asunto, estoy agradecido por algunas cosas que hice antes del primer día de clases y otras que desearía haber dedicado tiempo a hacer como parte de la preparación. Entonces, según mi experiencia, en previsión del primer día de clase, use el tiempo intermedio para:

  1. Familiarícese con el lenguaje de programación de su elección
  2. Aprende los fundamentos de la estadística.
  3. Comprender las terminologías básicas del aprendizaje automático

Descargo de responsabilidad: los recursos compartidos no son contenido patrocinado. Todos están basados ​​en mi experiencia personal de usarlos.

Familiarícese con el lenguaje de programación de su elección

Como es el caso de ser un principiante en cualquier campo, la curva de aprendizaje con la codificación será más pronunciada al principio. Habrá obstáculos frecuentes para navegar y no hay escapatoria de esta ardua parte del viaje para convertirse en un científico de datos. Sin embargo, las habilidades aprendidas en este punto son peldaños que sientan las bases de lo bueno que uno puede llegar a ser. Por lo tanto, es importante comprender los conceptos y tener una sólida comprensión de los conceptos básicos de codificación en cualquier lenguaje de programación.

El plan de estudios de los bootcamps tiene poco espacio para la holgura y eso hace que sea fácil quedarse atrás en la consolidación de una comprensión adecuada de los temas presentados. Dentro de una estructura de este tipo, puede ser atractivo saltarse algunos pasos o pasar al siguiente paso con una comprensión superflua de los temas anteriores. Para evitar caer en esa trampa, es extremadamente útil comenzar a aprender los conceptos básicos del lenguaje de programación con el que se desea codificar. Estos pueden incluir conceptos como el entorno de codificación, la sintaxis y las estructuras de datos, entre otras cosas.

Mi recomendación:

Recomiendo hacer los cursos introductorios en Dataquest donde uno puede comenzar a aprender gratis (con suscripciones pagas para acceso ilimitado después de cierto punto). Es a su propio ritmo y se entrega completamente en línea. Me gustó especialmente el enfoque de 'aprender haciendo' de los cursos en esta plataforma que es diferente a otras (como Datacamp ). Este enfoque me ayudó con una mayor retención de lo que aprendí. Los cursos se centran en enseñar a los estudiantes cómo aprender pensando en un problema y orientándolos hacia la documentación. Desglosar un problema complejo y usar la documentación como ayuda son habilidades invaluables para un científico de datos.

Aprende los fundamentos de la estadística.

Uno de los componentes centrales de la ciencia de datos es la estadística. Los científicos de datos usan estadísticas para recopilar, revisar, analizar y sacar conclusiones de los datos, así como para construir modelos de datos. En resumen, las estadísticas ayudan a extraer información significativa de los datos que pueden respaldar acciones basadas en evidencia.

Un buen bootcamp tendrá como objetivo cubrir conceptos estadísticos importantes como parte de su plan de estudios. Pero puede volverse técnico para alguien que nunca antes se ha encontrado con las estadísticas. Incluso para aquellos que podrían haber hecho estadística 101 en algún momento de su educación, obtener una buena comprensión de todos los temas necesarios para áreas como el aprendizaje automático puede no ser pan comido.

Si bien puede ser desalentador averiguar dónde se debe comenzar a aprender, hay muchos recursos gratuitos disponibles sobre los conceptos básicos de las estadísticas necesarias para la ciencia de datos. Veo tres áreas principales de estadísticas que son útiles en la ciencia de datos:

  1. Conceptos básicos de estadísticas : estadísticas descriptivas, distribuciones, pruebas de hipótesis y regresión.
  2. Estadísticas bayesianas : probabilidad condicional, anteriores, posteriores y máxima verosimilitud.
  3. Aprendizaje automático estadístico: conceptos básicos de máquinas estadísticas útiles en el modelado predictivo que se distingue de los métodos estadísticos clásicos
  • Si le gusta aprender a través de los libros, puede consultar Estadísticas prácticas para científicos de datos de Peter Bruce, Andrew Bruce y Peter Gedeck. El libro cubre los temas esenciales en un formato fácil de leer y es adecuado para principiantes.
  • Si prefieres aprender a través de videos (como yo), te recomendaría la serie de videos sobre Fundamentos de Estadística de Josh Starmer en su canal de youtube Statquest. Explica los conceptos estadísticos con un estilo de enseñanza claro y conciso mientras hace un buen uso de las imágenes.

El aprendizaje automático (ML) es un subconjunto del campo general de la ciencia de datos. El aprendizaje automático es un conjunto de métodos, herramientas y algoritmos informáticos que se utilizan para entrenar máquinas para analizar, comprender y encontrar patrones ocultos en los datos y hacer predicciones. Se usa comúnmente en empresas dentro del dominio de la inteligencia artificial.

Es probable que los bootcamps tecnológicos cubran temas de aprendizaje automático dentro de su plan de estudios, ya que es un conjunto de habilidades buscado en una carrera de ciencia de datos en la actualidad. Para obtener una buena comprensión de los conceptos teóricos a través del bootcamp, es útil repasar algunas terminologías y conceptos básicos en su propio tiempo. Esto permitirá el uso de las clases reales para aclarar la comprensión y profundizar en temas específicos de interés para eventualmente comenzar a construir modelos ML.

Mi recomendación:

Encontré el video de Cassie Kozyrov Introducción a ML e IA: MFML Parte 1 como un recurso increíble disponible para principiantes. Making Friends with Machine Learning (MFML) era un curso de Google solo para uso interno que ahora está disponible para todos. Se enfoca en la comprensión conceptual (en lugar de los detalles matemáticos y de programación) y guía a través de las ideas que forman la base del aprendizaje automático. Si en cambio prefieres leer al respecto, ella también ha escrito un artículo mediano al respecto.