Do projeto Kaggle ao estágio de ciência de dados: Desbloqueando oportunidades de ciência de dados
Escrevendo meu primeiro artigo aqui no medium e pensando em tópicos relacionados à minha jornada em ciência de dados. Então, pensei que nada poderia ser melhor do que compartilhar minha experiência de conseguir um estágio em Ciência de Dados. Portanto, se você está interessado em ciência de dados e quer saber como entrar no setor, acredito que este artigo pode ser um passo inicial para você.
Então, enquanto aprendia PNL (Processamento de Linguagem Natural), comecei a procurar por ideias de projetos e a ideia de filtragem de spam de nossa caixa de entrada de e-mail realmente me intrigou para mergulhar mais fundo nisso. Então criei o fluxo de trabalho do projeto, verifiquei projetos semelhantes em plataformas de código aberto e comecei a escrever código no meu notebook jupyter. Levei 10 dias para terminar o projeto com várias vezes eu só queria largar esse projeto no meio do caminho ou muitas vezes depois de lutar por horas para identificar o problema com meu código, um estranho no StackOverflow acabou sendo meu salvador e me ajudou a entender o que estava causando o problema.
Não falarei muito sobre detalhes técnicos do meu projeto, mas mais sobre como apresentá-lo em uma entrevista, pois você pode projetar ideias e códigos muito melhor na Internet do que este (compartilharei o link do kaggle do meu projeto no final deste artigo ). Então, começando com o primeiro e mais importante fator que virou a entrevista do meu lado, é a demonstração de trabalho do meu projeto. Enquanto explicava meu projeto depois de dar um breve resumo, pedi à entrevista para dar entrada de sua parte para uma mensagem de spam e uma não-spam para a demonstração ao vivo que ele deu e meu projeto exibiu a saída correta pela qual ele ficou realmente impressionado e então comecei a explicar minha motivação para o projeto, lógica por trás do código, resultados (precisão_pontuação de 97% e precisão_pontuação de 100%) e terminando com problemas que enfrentei neste projeto e como os resolvi.

Outro fator que me ajudou é explicar meu EDA (análise exploratória de dados) com algumas visualizações e, para mim, é mais fácil explicar imagens do que o código. Compartilhando alguns deles aqui para você ter um vislumbre.


Como expliquei no início, também aquela demonstração ao vivo do projeto acaba sendo a melhor quando o entrevistador pode interagir com seu projeto. Aqui está um vislumbre da demonstração ao vivo do meu projeto que fiz usando streamlit seguindo um tutorial no youtube:
Espero que gostem deste artigo e como prometido aqui está o link do projeto kaggle
https://www.kaggle.com/code/akshatrailaddha/sms-spam-classification-nlp-project
faça upvote se você estiver no kaggle.Nothing técnico apenas pequenos pedaços da minha experiência de entrevista. Compartilhe seus feedbacks.
Obrigado!!!