Ваша карьера инженера данных, ресурсы и несколько важных советов!

Dec 03 2022
Как я упоминал ранее в предыдущей статье о навыках, которыми вы должны обладать, чтобы быть инженером данных, и о некоторых хороших дорожных картах. Вы можете проверить предыдущую статью здесь: Вы должны начать путешествие с порогом навыков, чтобы вы могли опираться на него, поэтому вам нужна прочная основа.

Как я упоминал ранее в предыдущей статье о навыках, которыми вы должны обладать, чтобы быть инженером данных, и о некоторых хороших дорожных картах.

Вы можете проверить предыдущую статью здесь:

Ваш путь к тому, чтобы стать инженером данных.

Вы должны начать путешествие с порогом навыков, чтобы вы могли опираться на него, поэтому вам нужна прочная база.

В этой статье я расскажу о некоторых курсах и книгах, с которых вы должны начать, и о том, как получить этот порог, чтобы вы могли легко двигаться с более продвинутыми навыками в немецком языке!

Давайте начнем.

- SQL

Это самый важный навык, которым должен обладать каждый, кто работает в области данных. Таким образом, у должностей аналитика данных, специалиста по данным, инженера по машинному обучению и инженера по данным есть общие навыки, и SQL является одним из них.

Есть много источников для правильного изучения SQL, но я должен использовать SQL для анализа данных из Udacity:

Это хороший курс для изучения SQL, и он бесплатный!

Любителям книг я очень рекомендую эту книгу, если вы уже знакомы с синтаксисом SQL и имеете практический смысл.

Эта книга проведет вас от основ до продвинутых тем, как работать со сложными данными с помощью SQL, как подготовить данные для анализа, анализа текста и анализа экспериментов.

- Питон

Python — это язык программирования, который чаще всего используется в области данных, независимо от вашей специализации, и это благодаря сообществу и большому количеству библиотек, которые помогают вам выполнять ваши задачи быстрее и проще.

В качестве курсов я бы выбрал 100 Days of Code: The Complete Python Pro Bootcamp Анджелы Ю на 2023 год (платно):

https://www.udemy.com/course/100-days-of-code/

И если вы новичок в программировании и Python, я бы выбрал Udacity — Introduction to Python Programming (бесплатно):

Для любителей книг, которые немного знакомы с Python, я бы выбрал Python для анализа данных Уэса МакКинни:

Эта книга сделает вас настоящим зверем, когда дело доходит до Pandas и Numpy.

Вы узнаете много нового об очистке, преобразовании, слиянии и изменении формы ваших данных, а также о том, как использовать Pandas и Numpy с агрегацией данных, обработкой данных, построением графиков и визуализацией, а также загрузкой данных.

- Концепции инженерии данных

Теперь вы закончили изучение SQL и Python. Прочтите советы ниже.

мы должны знать некоторый порог понятий, поэтому, когда вы видите сообщение в LinkedIn, статью или подкаст, связанный с Data Engineering, вы понимаете это.

Поэтому мы должны знать некоторые понятия, такие как:

  • Концепция ETL, концепция ELT, витрина данных — хранилище данных — озеро данных, Hadoop и почему?, большие данные, схема «снежинка» и схема «звезда», промежуточная область, HDFS, MapReduce и Yarn, моделирование данных и пространственное моделирование.

Если вы новичок в этих концепциях и хотите получить этот обзор Data Engineering.

Я бы порекомендовал 2 книги, которые охватывают все эти концепции, а также то, как масштабировать ваше приложение и какую базу данных вы должны использовать для каких данных у вас есть и т. д.!

и 1 канал на ютубе (для говорящих по-арабски)

  • Первая книга — «Проектирование приложений с интенсивным использованием данных» Мартина Клеппманна (в данный момент читает):
  • Вторая книга — «Основы инженерии данных» Джо Рейса и Мэтта Хаусли.

(Для говорящих на арабском языке):

Канал Garage Education очень помог мне, когда я впервые изучал концепции Data Engineering. Удивительный контент с хорошо структурированной программой.

https://www.youtube.com/@GarageEducation

-Некоторые важные советы

1- Практика, практика, практика! Не изучайте ничего теоретически, не применяя это. Такие навыки, как Python и SQL, нужно применять изо дня в день, даже если на каждый уходит полчаса.

Такие веб-сайты, как Leetcode, HackerRank и Stratascratch, важны для повышения вашего уровня этих навыков.

2- Будьте доводчиком, не начинайте что-то и не бросайте, не закончив, даже если вам это больше не интересно. Поверьте, это очень поможет вашей будущей версии. особенно в области техники.

3- Не возвращайтесь в постель с теми же мыслями, с которыми проснулись.

Учиться! и я говорю не только о технических знаниях, я говорю об обучении в целом.

возьмите роман или книгу или посмотрите документальный фильм. что бы вы ни хотели, идея состоит в том, чтобы тренировать свой ум каждый день.

Спасибо за чтение! Если вам понравилась статья, не забудьте похлопать (до 50!)
и связаться со мной в LinkedIn и подписаться на меня на Medium, чтобы быть в курсе моих новых статей.

Среда LinkedIn GitHub