3 rzeczy, które pomogą Ci w pełni wykorzystać swój bootcamp data science

Nov 28 2022
I zalecenia dotyczące bezpłatnych zasobów
Bootcampy związane z nauką o danych są intensywne i mają wypełniony po brzegi program nauczania. Jeśli jesteś osobą, która nie jest pewna, czy bootcamp jest najlepszym sposobem na rozpoczęcie nauki o danych, możesz przeczytać mój poprzedni artykuł tutaj.
Zdjęcie autorstwa Davida Iskandera na Unsplash

Bootcampy związane z nauką o danych są intensywne i mają wypełniony po brzegi program nauczania. Jeśli jesteś osobą, która nie jest pewna, czy bootcamp jest najlepszym sposobem na rozpoczęcie nauki o danych, możesz przeczytać mój poprzedni artykuł tutaj. W tym artykule podzielę się przemyśleniami na temat tego, jak najlepiej wykorzystać bootcamp, gdy już podejmiesz decyzję o dołączeniu do niego.

Kiedy zaczynałem swój bootcamp z Codeopem , miałem mgliste pojęcie o tym, czego będę się uczył w oparciu o program dostarczony mi na początku kursu. Teraz, gdy jestem w samym środku, jestem wdzięczny za niektóre rzeczy, które zrobiłem przed pierwszym dniem zajęć i niektóre, których żałuję, że nie spędziłem czasu w ramach przygotowań. Opierając się więc na moim doświadczeniu, w oczekiwaniu na pierwszy dzień zajęć, wykorzystaj czas pomiędzy:

  1. Zapoznaj się z wybranym językiem programowania
  2. Poznaj podstawy statystyki
  3. Zrozumienie podstawowej terminologii uczenia maszynowego

Zastrzeżenie: udostępnione zasoby nie są treściami sponsorowanymi. Wszystkie opierają się na moich osobistych doświadczeniach z ich używania.

Zapoznaj się z wybranym językiem programowania

Podobnie jak w przypadku początkujących w dowolnej dziedzinie, krzywa uczenia się kodowania będzie najbardziej stroma na początku. Często będą pojawiać się przeszkody do pokonania i nie ma ucieczki od tej żmudnej części podróży, aby zostać naukowcem danych. Jednak umiejętności nabyte w tym momencie są kamieniami milowymi, które kładą podwaliny pod to, jak dobrze można się dostać. Dlatego ważne jest, aby rozumieć koncepcje i dobrze rozumieć podstawy kodowania w dowolnym języku programowania.

W programie bootcampów nie ma miejsca na luzy, co sprawia, że ​​łatwo jest zostać w tyle, jeśli chodzi o ugruntowanie właściwego zrozumienia przedstawionych tematów. W ramach takiej struktury kuszące może być pominięcie kilku kroków lub przejście do następnego kroku ze zbędnym zrozumieniem poprzednich tematów. Aby uniknąć wpadnięcia w tę pułapkę, niezwykle pomocne jest zdobycie przewagi w nauce podstaw języka programowania, w którym chce się programować. Mogą one obejmować między innymi takie koncepcje, jak środowisko kodowania, składnia i struktury danych.

Moja rekomendacja:

Polecam kursy wprowadzające na Dataquest , gdzie można rozpocząć naukę za darmo (z płatnymi subskrypcjami z nieograniczonym dostępem po pewnym momencie). Jest we własnym tempie i jest dostarczany całkowicie online. Szczególnie podobało mi się podejście „uczyć się przez działanie” kursów na tej platformie, które różni się od innych (takich jak Datacamp ). Takie podejście pomogło mi lepiej zapamiętać to, czego się nauczyłem. Kursy koncentrują się na nauczaniu studentów, jak uczyć się poprzez przemyślenie problemu i wskazanie dokumentacji. Rozwiązywanie złożonego problemu i korzystanie z dokumentacji w celu uzyskania pomocy to nieocenione umiejętności, które powinien posiadać jako naukowiec zajmujący się danymi.

Poznaj podstawy statystyki

Jednym z podstawowych elementów nauki o danych jest statystyka. Analitycy danych wykorzystują statystyki do gromadzenia, przeglądania, analizowania i wyciągania wniosków z danych, a także do budowania modeli danych. Krótko mówiąc, statystyki pomagają wydobyć z danych istotne informacje, które mogą wspierać działania oparte na dowodach.

Dobry bootcamp będzie miał na celu omówienie ważnych pojęć statystycznych w ramach swojego programu nauczania. Ale może to być techniczne dla kogoś, kto nigdy wcześniej nie zetknął się ze statystykami. Nawet dla tych, którzy na pewnym etapie swojej edukacji zajmowali się statystyką, dobre zrozumienie każdego tematu niezbędnego w obszarach takich jak uczenie maszynowe może nie być bułką z masłem.

Chociaż ustalenie, od czego zacząć naukę, może być trudne, dostępnych jest wiele bezpłatnych zasobów dotyczących podstaw statystyki potrzebnych do nauki o danych. Widzę trzy główne obszary statystyki przydatne w data science:

  1. Podstawowe pojęcia statystyki — statystyki opisowe, rozkłady, testowanie hipotez i regresja.
  2. Statystyki bayesowskie — prawdopodobieństwo warunkowe, a priori, a posteriori i maksymalne prawdopodobieństwo.
  3. Statistical Machine Learning — podstawowe koncepcje maszyn statystycznych przydatne w modelowaniu predykcyjnym, które różni się od klasycznych metod statystycznych
  • Jeśli lubisz uczyć się z książek, możesz sprawdzić Praktyczne statystyki dla naukowców zajmujących się danymi autorstwa Petera Bruce'a, Andrew Bruce'a i Petera Gedecka. Książka omawia podstawowe zagadnienia w łatwym do odczytania formacie i jest odpowiednia dla początkujących.
  • Jeśli wolisz uczyć się za pomocą filmów (tak jak ja), polecam serię filmów na temat podstaw statystyki autorstwa Josha Starmera na jego kanale YouTube Statquest. Wyjaśnia pojęcia statystyczne w jasny i zwięzły sposób nauczania, dobrze wykorzystując materiały wizualne.

Uczenie maszynowe (ML) jest podzbiorem ogólnej dziedziny nauki o danych. Uczenie maszynowe to zestaw metod, narzędzi i algorytmów komputerowych używanych do szkolenia maszyn w zakresie analizowania, rozumienia i znajdowania ukrytych wzorców w danych oraz przewidywania. Jest powszechnie stosowany w firmach zajmujących się sztuczną inteligencją.

Bootcampy technologiczne prawdopodobnie obejmą tematy związane z uczeniem maszynowym w ramach programu nauczania, ponieważ jest to poszukiwany zestaw umiejętności w dzisiejszej karierze związanej z nauką o danych. Aby dobrze zrozumieć teoretyczne koncepcje podczas bootcampu, warto przejrzeć kilka podstawowych terminologii i pojęć w wolnym czasie. Umożliwi to następnie wykorzystanie rzeczywistych klas do wyjaśnienia zrozumienia i zagłębienia się w określone interesujące tematy, aby ostatecznie rozpocząć budowanie modeli ML.

Moja rekomendacja:

Znalazłem film Cassie Kozyrov Wprowadzenie do ML i AI — MFML Część 1 , który jest niesamowitym źródłem dostępnym dla początkujących. Zaprzyjaźnianie się z uczeniem maszynowym (MFML) był kursem Google przeznaczonym wyłącznie do użytku wewnętrznego, który teraz jest dostępny dla wszystkich. Koncentruje się na zrozumieniu konceptualnym (a nie na szczegółach matematycznych i programistycznych) i prowadzi przez idee, które stanowią podstawę uczenia maszynowego. Jeśli zamiast tego wolisz o tym czytać, napisała o tym również średni artykuł .