Votre carrière en tant qu'ingénieur de données, ressources et quelques conseils importants !

Dec 03 2022
Comme je l'ai mentionné au début de l'article précédent sur les compétences que vous devriez avoir pour être un ingénieur de données et quelques bonnes feuilles de route. Vous pouvez consulter l'article précédent ici : Vous devez commencer le voyage avec un seuil de compétences afin de pouvoir construire dessus, vous devez donc avoir une base solide.

Comme je l'ai mentionné au début de l'article précédent sur les compétences que vous devriez avoir pour être un ingénieur de données et quelques bonnes feuilles de route.

Vous pouvez consulter l'article précédent ici :

Votre route pour devenir un ingénieur de données.

Vous devez commencer le voyage avec un seuil de compétences afin de pouvoir vous appuyer dessus, vous devez donc avoir une base solide.

Dans cet article, je vais mettre quelques cours et livres avec lesquels vous devriez commencer et comment obtenir ce seuil afin que vous puissiez évoluer facilement avec des compétences plus avancées en DE !

Commençons.

- SQL

C'est la compétence la plus importante que toute personne travaillant dans le domaine des données devrait avoir. Il existe donc des compétences communes entre les titres de poste d'analyste de données, de scientifique de données, d'ingénieur en apprentissage automatique et d'ingénieur de données, et SQL en fait partie.

Il existe de nombreuses sources pour apprendre correctement SQL mais je dois utiliser SQL pour l'analyse de données d'Udacity :

C'est un bon cours pour apprendre SQL et c'est gratuit !

Pour les amateurs de livres, je recommanderais vivement ce livre si vous êtes déjà familiarisé avec la syntaxe SQL et avez un sens pratique.

Ce livre vous guidera à travers les bases des sujets avancés, comment traiter des données complexes à l'aide de SQL, comment préparer des données pour l'analyse, l'analyse de texte et l'analyse d'expériences.

-Python

Python est le langage de programmation le plus utilisé dans le domaine des données, quelle que soit votre spécialisation, et cela est dû à la communauté et aux nombreuses bibliothèques qui vous aident à effectuer vos tâches plus rapidement et plus facilement.

Pour les cours, j'irais avec Angela Yu's 100 Days of Code: The Complete Python Pro Bootcamp for 2023 (Payant) :

https://www.udemy.com/course/100-days-of-code/

Et si vous êtes novice en programmation et en python, je choisirais Udacity — Introduction à la programmation Python (gratuit) :

Pour les amateurs de livres qui connaissent un peu Python, j'opterais pour Python for Data Analysis de Wes McKinney :

Ce livre va faire de vous une bête en ce qui concerne Pandas et Numpy.

Vous allez en apprendre beaucoup sur le nettoyage, la transformation, la fusion et le remodelage de vos données, et sur la façon d'utiliser Pandas & Numpy avec l'agrégation de données, la manipulation de données, le traçage et la visualisation, et le chargement de données.

- Concepts d'ingénierie des données

Maintenant que vous avez fini d'apprendre SQL et Python "lisez les conseils ci-dessous"

nous devons connaître un certain seuil de concepts afin que lorsque vous voyez un message sur LinkedIn, un article ou un podcast lié à l'ingénierie des données, vous le compreniez.

Par conséquent, nous devons connaître certains concepts tels que :

  • Concept ETL, concept ELT, Data Mart — Data Warehouse — Data Lake, Hadoop, et pourquoi ?, Big Data, schéma Snowflake et Star Schema, Staging Area, HDFS, MapReduce et Yarn, Data Modeling et Dimensional Modeling.

Si vous êtes nouveau dans ces concepts et que vous souhaitez avoir cet aperçu de l'ingénierie des données.

Je recommanderais 2 livres qui couvrent tous ces concepts, et aussi comment faire évoluer votre application et quelle base de données vous devriez utiliser pour quelles données vous avez, etc. !

et 1 chaîne sur youtube (pour les arabophones)

  • Le premier livre est Designing Data-Intensive Applications By Martin Kleppmann (en cours de lecture) :
  • Le deuxième livre est Fundamentals of Data Engineering de Joe Reis et Matt Housley.

(Pour les arabophones) :

La chaîne Garage Education m'a beaucoup aidé lorsque j'étudiais pour la première fois les concepts d'ingénierie des données, un contenu incroyable avec un programme bien structuré.

https://www.youtube.com/@GarageEducation

-Quelques conseils importants

1- Pratiquez, pratiquez, pratiquez ! N'apprenez rien théoriquement sans l'appliquer. Des compétences comme Python et SQL doivent être appliquées au jour le jour, même si c'est une demi-heure pour chacune.

Des sites Web comme Leetcode, HackerRank et Stratascratch sont importants pour améliorer votre niveau avec ces compétences.

2- Soyez un finisseur, Ne commencez pas quelque chose et laissez-le sans le finir, même si vous n'êtes plus intéressé. Croyez-moi, cela aidera beaucoup la future version de vous. notamment dans le domaine Tech.

3- Ne revenez pas au lit avec le même esprit qui s'est réveillé.

Apprendre! et je ne parle pas seulement des connaissances techniques, je parle de l'apprentissage en général.

prenez un roman ou un livre, ou regardez un documentaire. quoi que vous aimiez, l'idée est d'entraîner votre esprit tous les jours.

Merci d'avoir lu! Si vous aimez l'article, assurez-vous d'applaudir (jusqu'à 50 !)
et connectez-vous avec moi sur LinkedIn et suivez-moi sur Medium pour rester à jour avec mes nouveaux articles.

Médium LinkedIn GitHub