3 вещи, которые помогут вам максимально эффективно использовать буткемп по науке о данных

Учебные курсы по науке о данных насыщены насыщенной учебной программой. Если вы не уверены, является ли буткемп лучшим способом освоить науку о данных, вы можете прочитать мою предыдущую статью здесь. В этой статье я делюсь своими мыслями о том, как извлечь максимальную пользу из буткемпа после того, как вы приняли решение присоединиться к нему.
Когда я начинал свой буткемп с Codeop , у меня было смутное представление о том, что я буду изучать, основываясь на учебной программе, предоставленной мне в начале курса. Теперь, когда я в самом разгаре, я благодарен за некоторые вещи, которые я сделал до первого дня занятий, и за некоторые, на которые я хотел бы потратить время в рамках подготовки. Итак, исходя из моего опыта, в преддверии первого дня занятий используйте время между ними, чтобы:
- Ознакомьтесь с выбранным языком программирования
- Изучите основы статистики
- Понимание основных терминов машинного обучения
Отказ от ответственности: общие ресурсы не являются спонсируемым контентом. Все они основаны на моем личном опыте их использования.
Ознакомьтесь с выбранным языком программирования
Как и в случае с новичком в любой области, кривая обучения кодированию будет самой крутой в начале. Будут частые камни преткновения, через которые нужно пройти, и невозможно избежать этой трудной части пути, чтобы стать специалистом по данным. Тем не менее, навыки, полученные на этом этапе, являются ступеньками, которые закладывают основу того, насколько хорошо можно добиться успеха. Поэтому важно понимать концепции и хорошо разбираться в основах кодирования на любом языке программирования.
В учебной программе буткемпов мало места для слабины, и это позволяет легко отставать в закреплении правильного понимания представленных тем. В такой структуре может быть заманчиво пропустить несколько шагов или перейти к следующему шагу с избыточным пониманием предыдущих тем. Чтобы не попасть в эту ловушку, чрезвычайно полезно заранее изучить основы языка программирования, на котором вы хотите кодировать. Среди прочего, они могут включать такие понятия, как среда кодирования, синтаксис и структуры данных.
Моя рекомендация:
Я рекомендую пройти вводные курсы на Dataquest , где можно начать обучение бесплатно (с платными подписками для неограниченного доступа после определенного момента). Это самостоятельный темп и доставляется полностью онлайн. Мне особенно понравился подход «учись на практике» курсов на этой платформе, который отличается от других (таких как Datacamp ). Такой подход помог мне лучше запомнить то, что я узнал. Курсы направлены на то, чтобы научить студентов тому, как учиться, обдумывая проблему и указывая им на документацию. Разборка сложной проблемы и использование документации для помощи — бесценные навыки, которыми должен обладать специалист по данным.
Изучите основы статистики
Одним из основных компонентов науки о данных является статистика. Специалисты по обработке и анализу данных используют статистику для сбора, просмотра, анализа и получения выводов на основе данных, а также для построения моделей данных. Короче говоря, статистика помогает извлекать значимую информацию из данных, которые могут поддерживать действия, основанные на фактических данных.
Хороший учебный курс будет направлен на то, чтобы охватить важные статистические концепции в рамках своей учебной программы. Но это может стать техническим для тех, кто никогда раньше не сталкивался со статистикой. Даже для тех, кто мог заниматься статистикой в какой-то момент своего образования, хорошее понимание каждой темы, необходимой для таких областей, как машинное обучение, может оказаться непростым делом.
Хотя может быть сложно понять, с чего начать обучение, существует достаточно бесплатных ресурсов по основам статистики, необходимой для науки о данных. Я вижу три основных области статистики, которые полезны в науке о данных:
- Основные понятия статистики — описательная статистика, распределения, проверка гипотез и регрессия.
- Байесовская статистика — условная вероятность, априорные, апостериорные и максимальная вероятность.
- Статистическое машинное обучение - основные концепции статистических машин, полезные в прогнозном моделировании, которое отличается от классических статистических методов.
- Если вам нравится учиться по книгам, вы можете ознакомиться с «Практической статистикой для специалистов по данным » Питера Брюса, Эндрю Брюса и Питера Гедека. Книга охватывает основные темы в удобном для чтения формате и подходит для начинающих.
- Если вы предпочитаете учиться с помощью видео (как и я), я бы порекомендовал серию видеороликов Джоша Стармера « Основы статистики » на его канале YouTube Statquest. Он объясняет статистические понятия в ясной и лаконичной манере преподавания, хорошо используя наглядные материалы.
Машинное обучение (ML) является подмножеством общей области науки о данных. Машинное обучение — это набор методов, инструментов и компьютерных алгоритмов, используемых для обучения машин анализировать, понимать и находить скрытые закономерности в данных и делать прогнозы. Он обычно используется в компаниях в области искусственного интеллекта.
Технические учебные курсы, вероятно, охватывают темы машинного обучения в рамках его учебной программы, поскольку сегодня это востребованный набор навыков в карьере специалиста по данным. Чтобы получить хорошее представление о теоретических концепциях через буткемп, полезно в свободное время изучить некоторые основные термины и концепции. Затем это позволит использовать фактические классы для уточнения понимания и более глубокого изучения конкретных тем, представляющих интерес, чтобы в конечном итоге приступить к созданию моделей машинного обучения.
Моя рекомендация:
Видео Кэсси Козыров « Введение в машинное обучение и искусственный интеллект — часть 1 MFML » показалось мне замечательным ресурсом, доступным для начинающих. «Подружиться с машинным обучением» (MFML) был курсом Google только для внутреннего пользования, который теперь доступен всем. Она фокусируется на концептуальном понимании (а не на математических деталях и деталях программирования) и рассказывает об идеях, которые составляют основу машинного обучения. Если вместо этого вы предпочитаете читать об этом, она также написала об этом статью для СМИ .