¡Tu carrera como ingeniero de datos, recursos y algunos consejos importantes!

Dec 03 2022
Como mencioné anteriormente en el artículo anterior sobre las habilidades que debe tener para ser un ingeniero de datos y algunas buenas hojas de ruta. Puede consultar el artículo anterior aquí: debe comenzar el viaje con un umbral de habilidades para que pueda construir sobre él, por lo que necesita tener una base sólida.

Como mencioné anteriormente en el artículo anterior sobre las habilidades que debe tener para ser un ingeniero de datos y algunas buenas hojas de ruta.

Puedes consultar el artículo anterior aquí:

Su camino para convertirse en ingeniero de datos.

Debe comenzar el viaje con un umbral de habilidades para poder construir sobre él, por lo que necesita tener una base sólida.

En este artículo, voy a poner algunos cursos y libros con los que debe comenzar y cómo obtener este umbral para que pueda moverse fácilmente con habilidades más avanzadas en DE.

Empecemos.

-SQL

Es la habilidad más importante que debe tener cualquier persona que trabaje en el campo de datos, por lo que hay habilidades comunes entre los títulos de trabajo de analista de datos, científico de datos, ingeniero de aprendizaje automático e ingeniero de datos, y SQL es uno de ellos.

Hay muchas fuentes para aprender SQL correctamente, pero tengo que usar SQL para el análisis de datos de Udacity:

¡Es un buen curso para aprender SQL y es gratis!

Para los amantes de los libros, recomiendo encarecidamente este libro si ya está familiarizado con la sintaxis de SQL y tiene sentido práctico.

Este libro lo guiará desde los conceptos básicos hasta los temas avanzados, cómo manejar datos complejos usando SQL, cómo preparar datos para análisis, análisis de texto y análisis de experimentos.

- pitón

Python es el lenguaje de programación más utilizado en el campo de los datos, independientemente de su especialización, y esto se debe a la comunidad y a las amplias bibliotecas que lo ayudan a realizar sus tareas de manera más rápida y sencilla.

Para los cursos, elegiría 100 días de código de Angela Yu: The Complete Python Pro Bootcamp for 2023 (Paid):

https://www.udemy.com/course/100-days-of-code/

Y si eres nuevo en programación y python, iría con Udacity: Introducción a la programación de Python (gratis):

Para los amantes de los libros que están familiarizados con Python, elegiría Python for Data Analysis de Wes McKinney:

Este libro te hará una bestia cuando se trata de Pandas y Numpy.

Aprenderá mucho sobre la limpieza, la transformación, la fusión y la remodelación de sus datos, y sobre cómo usar Pandas y Numpy con la agregación de datos, la disputa de datos, el trazado y la visualización, y la carga de datos.

- Conceptos de ingeniería de datos

Ahora que ha terminado de aprender SQL y Python "lea los consejos a continuación"

tenemos que conocer un umbral de conceptos para que cuando vea una publicación en LinkedIn, un artículo o un podcast relacionado con la ingeniería de datos, lo entienda.

Por lo tanto, tenemos que conocer algunos conceptos como:

  • Concepto ETL, concepto ELT, Data Mart — Almacén de datos — Data Lake, Hadoop, ¿y por qué?, Big Data, esquema Snowflake y Star Schema, Staging Area, HDFS, MapReduce e Yarn, Modelado de datos y Modelado dimensional.

Si eres nuevo en esos conceptos y quieres tener esta descripción general de la ingeniería de datos.

Recomendaría 2 libros que cubran todos estos conceptos, y también cómo escalar su aplicación y qué base de datos debe usar para qué datos tiene, etc.

y 1 canal en youtube (para hablantes de árabe)

  • El primer libro es Designing Data-Intensive Applications de Martin Kleppmann (en lectura actual):
  • El segundo libro es Fundamentos de ingeniería de datos por Joe Reis y Matt Housley.

(Para hablantes de árabe):

El canal Garage Education me ayudó mucho cuando estaba estudiando conceptos de ingeniería de datos por primera vez, contenido increíble con un plan de estudios bien estructurado.

https://www.youtube.com/@GarageEducation

-Algunos consejos importantes

1- ¡Practica, Practica, Practica! No aprendas nada teóricamente sin aplicarlo. Las habilidades como Python y SQL deben aplicarse día a día, incluso si es media hora para cada uno.

Los sitios web como Leetcode, HackerRank y Stratascratch son importantes para subir de nivel con esas habilidades.

2- Sé un finalizador, no empieces algo y lo dejes sin terminar, aunque ya no te interese. Créeme, ayudará mucho a tu futura versión. especialmente en el campo de la tecnología.

3- No vuelvas a la cama con la misma mente que despertaste.

¡Aprender! y no solo hablo de conocimientos técnicos, hablo de aprendizaje en general.

toma una novela o un libro, o mira un documental. lo que quieras, la idea es entrenar tu mente todos los días.

¡Gracias por leer! Si te gusta el artículo, asegúrate de aplaudir (¡hasta 50!)
y conéctate conmigo en LinkedIn y sígueme en Medium para mantenerte actualizado con mis nuevos artículos.

LinkedIn Medio GitHub