5 projetos de ciência de dados incríveis
Seja o 10x Cientista de Dados que todos procuram ou simplesmente tenha um portfólio de Ciência de Dados altamente impactante.
Hoje estamos olhando para 5 projetos fantásticos para trabalhar, tanto em termos de experiência prática e útil para uma carreira profissional, quanto para ampliar sua mente e horizonte e abrir seus olhos para as mais novas tecnologias e possibilidades futuras.
Se você é um cientista de dados, desenvolvedor júnior ou apenas um programador apaixonado que adora mergulhar na análise e engenharia de dados, há um certo conjunto de projetos que podem ajudar a diferenciar seu portfólio de ciência de dados de muitos outros.
Esses projetos são ótimos para qualquer portfólio de ciência de dados. Se você está se perguntando como pode criar um portfólio incrível de ciência de dados, desmistifiquei o processo neste artigo:
O portfólio de ciência de dados matador que faz você ser contratadoFollow me for 5 more kick ass projects next week!
You can also hit the message icon to get notified when I publish it.
1. Detecção de Fake News
Um tópico que continua a ser altamente debatido é o efeito que notícias falsas, vídeos deepfake e outros conteúdos manipulados de forma semelhante têm em nossa sociedade. Como conclui este artigo de Eliza Shoemaker, é impossível impedir que notícias falsas sejam criadas, mas detectá-las é possível.
Normalmente, esses projetos também incluem o uso de árvores de decisão, NLP, Stop Word, TFIDF, PoS e algoritmos VADER para detectar e reconhecer diferentes formas de conteúdo. Isso pode ser útil em muitos outros campos, como tradução e geração de conteúdo de IA, bem como reconhecimento de voz, etc.
Você também deve verificar esses projetos públicos para se inspirar em como eles fizeram isso.
O que eu amo neste projeto é como eles explicaram bem sua lógica e fluxo de dados.
2. Chatbot inteligente alimentado por IA
Outro projeto comum para novos cientistas de dados é o chamado Chatbot. Esses projetos normalmente incluem o uso de processamento de linguagem natural, mas também podem ser construídos usando recursos NLU e NLG, bem como métodos para correspondência de padrões.
Ao construir seu próprio Chatbot do zero, você pode mostrar aos potenciais empregadores que conhece a biblioteca NLTK do Python, que é muito usada para uma infinidade de propósitos no mundo profissional. E você também terá a chance de mostrar como processa, testa e treina cenários de dados.
Aqui está um projeto simples, bem escrito e fácil de entender que você pode tentar replicar e aprender. Conforme você trabalha com isso, certifique-se de adicionar suas próprias otimizações (tanto a qualidade do código quanto a lógica).
3. Análise de sentimento
Este projeto é outra escolha popular para muitos estudantes e profissionais em todo o mundo e é usado em muitos setores. Se você está interessado no mercado de ações, pode concentrar seu projeto em um punhado de cotações de ações e, em seguida, vasculhar a web em busca de sentimentos, a fim de descobrir o quanto uma determinada empresa é apreciada.
A análise de sentimento também pode ser usada para analisar análises de produtos, a fim de se afastar das avaliações típicas de 1 a 5 estrelas e, em vez disso, focar nos detalhes específicos de cada revisão. Esses projetos normalmente incluem o uso de conjuntos de dados ou web scraping, mas também padrões de extração, NLP e estruturas de dados são métodos que você pode explorar.
Aqui estão dois projetos que eu gosto, especialmente porque eles explicaram bem o básico e o desenvolveram.
@ betinacosta 's Hands-on Sentiment Analysis Tutorial é um projeto incrível que lhe dá a experiência prática de obter os dados de um aplicativo do mundo real (Twitter) e realizar análises enquanto você aprende.
4. Classificação de imagens
A ascensão do aprendizado de máquina trouxe consigo a capacidade da IA de detectar rostos humanos em uma imagem, classificar todos os objetos vermelhos em uma pintura e muito mais. Embora existam muitas aplicações no mundo profissional para esses tipos de projetos, também é um grande esforço pessoal a ser perseguido.
Aqui você aprenderá a treinar modelos de aprendizado profundo e, dependendo do seu projeto, poderá usar bibliotecas como TensorFlow, MATLAB ou RapidMiner para aprimorar ainda mais seus resultados e aprimorar suas habilidades.
Esta é uma área bastante vasta e a maioria dos projetos online usa GPUs. Sejamos honestos, apenas alguns de nós têm acesso a uma GPU ou querem gastar $ em VMs na nuvem. Então, farei o possível para incluir projetos fáceis de seguir e que não exijam GPU:
Este é um tutorial ou guia prático que explica a lógica em inglês quase simples:
5. Arquitetura de dados
As empresas precisam de cientistas de dados para estruturar e categorizar adequadamente as grandes quantidades de dados de seus clientes, produtos e parceiros de negócios. Todos esses dados precisam estar acessíveis 24 horas por dia, além de serem armazenados com segurança em uma arquitetura otimizada para custo e/ou desempenho otimizado.
Eu sei, parece MUITO. Mas, para um portfólio (e para sua experiência), tudo o que você precisa mostrar é seu amor por trabalhar com bancos de dados, limpar dados e formatá-los nos tipos corretos, etc.
Eu compilei uma lista dos 25 melhores conjuntos de dados públicos aqui que você pode usar para encontrar um conjunto de dados que seria perfeito para um projeto de arquitetura de dados.
Bônus: mais 5 projetos incríveis!
Leva tempo para trazer um bom conteúdo para você! Então, siga-me para a próxima parcela de mais 5 projetos incríveis que cobrem:
- Detecção e Prevenção de Fraudes
- Previsão de preferência do cliente
- Coleta de dados (Web Scraping e mais)
- Análise de Condições Médicas
- Como enlouquecer e combinar alguns projetos :)
Como sempre, adoro criar conteúdo útil para profissionais de ciência de dados e adoraria ouvir de você - positivo ou negativo! Você também pode sugerir tópicos sobre os quais gostaria de ouvir.
Linkedin :https://www.linkedin.com/in/vasinha





































![O que é uma lista vinculada, afinal? [Parte 1]](https://post.nghiatu.com/assets/images/m/max/724/1*Xokk6XOjWyIGCBujkJsCzQ.jpeg)