3 coisas que ajudarão você a aproveitar ao máximo seu bootcamp de ciência de dados

Os bootcamps de ciência de dados são intensivos com um currículo lotado. Se você é alguém que não tem certeza se um bootcamp é a melhor maneira de aprender ciência de dados, pode ler meu artigo anterior aqui. Neste artigo, compartilho meus pensamentos sobre como aproveitar ao máximo o bootcamp depois de tomar a decisão de ingressar em um.
Quando comecei meu bootcamp com Codeop , tinha uma vaga ideia do que iria aprender com base no currículo que me foi fornecido no início do curso. Agora que estou no meio disso tudo, sou grato por algumas coisas que fiz antes do primeiro dia de aula e outras que gostaria de ter feito como parte da preparação. Portanto, com base na minha experiência, antes do primeiro dia de aula, use o tempo intermediário para:
- Familiarize-se com a linguagem de programação de sua escolha
- Aprenda os fundamentos da estatística
- Entenda as terminologias básicas do aprendizado de máquina
Isenção de responsabilidade: os recursos compartilhados não são conteúdo patrocinado. Eles são todos baseados em minha experiência pessoal de usá-los.
Familiarize-se com a linguagem de programação de sua escolha
Como é o caso de ser iniciante em qualquer área, a curva de aprendizado com codificação será mais acentuada no início. Haverá obstáculos frequentes para navegar e não há como escapar dessa parte árdua da jornada para se tornar um cientista de dados. No entanto, as habilidades aprendidas neste ponto são trampolins que estabelecem as bases para o quão bom alguém pode ser. Portanto, é importante entender os conceitos e ter um forte domínio sobre os fundamentos da codificação em qualquer linguagem de programação.
O currículo dos bootcamps tem pouco espaço para folgas e isso torna fácil ficar para trás na consolidação de uma compreensão adequada dos tópicos apresentados. Dentro de tal estrutura, pode ser sedutor pular algumas etapas ou passar para a próxima com uma compreensão supérflua dos tópicos anteriores. Para evitar cair nessa armadilha, é extremamente útil começar a aprender o básico da linguagem de programação com a qual deseja codificar. Isso pode incluir conceitos como ambiente de codificação, sintaxe e estruturas de dados, entre outras coisas.
Minha recomendação:
Recomendo fazer os cursos introdutórios no Dataquest onde se pode começar a aprender de graça (com assinaturas pagas para acesso ilimitado a partir de certo ponto). É individualizado e entregue totalmente online. Gostei particularmente da abordagem 'aprender fazendo' dos cursos desta plataforma que é diferente de outras (como o Datacamp ). Essa abordagem me ajudou a reter melhor o que aprendi. Os cursos são focados em ensinar os alunos a aprender pensando em um problema e apontando-os para a documentação. Analisar um problema complexo e usar a documentação para obter ajuda são habilidades inestimáveis para um cientista de dados.
Aprenda os fundamentos da estatística
Um dos principais componentes da ciência de dados é a estatística. Os cientistas de dados usam estatísticas para coletar, revisar, analisar e tirar conclusões de dados, bem como construir modelos de dados. Em suma, a estatística ajuda a extrair informações significativas de dados que podem apoiar ações baseadas em evidências.
Um bom bootcamp terá como objetivo cobrir conceitos estatísticos importantes como parte de seu currículo. Mas pode ser técnico para alguém que nunca se deparou com estatísticas antes. Mesmo para aqueles que podem ter feito estatística 101 em algum momento de sua educação, obter uma boa compreensão de todos os tópicos necessários para áreas como aprendizado de máquina pode não ser fácil.
Embora possa ser assustador descobrir por onde começar a aprender, existem muitos recursos gratuitos disponíveis sobre os fundamentos da estatística necessários para a ciência de dados. Vejo três áreas principais de estatísticas que são úteis na ciência de dados:
- Conceitos Básicos de Estatística — Estatísticas descritivas, distribuições, teste de hipóteses e regressão.
- Estatística Bayesiana — Probabilidade condicional, a priori, a posteriori e máxima verossimilhança.
- Aprendizagem de Máquina Estatística — conceitos básicos de máquina estatística úteis na modelagem preditiva que se distingue dos métodos estatísticos clássicos
- Se você gosta de aprender por meio de livros, pode conferir o Practical Statistics for Data Scientists , de Peter Bruce, Andrew Bruce e Peter Gedeck. O livro cobre os tópicos essenciais em um formato fácil de ler e é adequado para iniciantes.
- Se você preferir aprender por meio de vídeos (como eu), recomendo a série de vídeos Fundamentos de Estatística de Josh Starmer em seu canal do youtube Statquest. Ele explica conceitos estatísticos com um estilo de ensino claro e conciso, fazendo bom uso de recursos visuais.
O aprendizado de máquina (ML) é um subconjunto do campo geral da ciência de dados. O aprendizado de máquina é um conjunto de métodos, ferramentas e algoritmos de computador usados para treinar máquinas para analisar, entender e encontrar padrões ocultos em dados e fazer previsões. É comumente usado em empresas dentro do domínio da inteligência artificial.
É provável que os bootcamps de tecnologia abordem tópicos de aprendizado de máquina em seu currículo, pois é um conjunto de habilidades procurado em uma carreira de ciência de dados hoje. Para obter uma boa compreensão dos conceitos teóricos durante o bootcamp, é útil passar por algumas terminologias e conceitos básicos em seu próprio tempo. Isso permitirá o uso das aulas reais para esclarecer a compreensão e aprofundar tópicos de interesse específicos para, eventualmente, começar a construir modelos de ML.
Minha recomendação:
Achei o vídeo de Cassie Kozyrov, Introduction to ML and AI — MFML Part 1 , um recurso incrível disponível para iniciantes. Making Friends with Machine Learning (MFML) era um curso interno do Google agora disponível para todos. Ela se concentra na compreensão conceitual (em vez dos detalhes matemáticos e de programação) e orienta as ideias que formam a base do aprendizado de máquina. Se você preferir ler sobre isso, ela também escreveu um artigo médio sobre isso.