Big Data Analytics - Cientista de dados

A função de um cientista de dados normalmente está associada a tarefas como modelagem preditiva, desenvolvimento de algoritmos de segmentação, sistemas de recomendação, estruturas de teste A / B e, muitas vezes, trabalho com dados não estruturados brutos.

A natureza do seu trabalho exige um conhecimento profundo de matemática, estatística aplicada e programação. Existem algumas habilidades comuns entre um analista de dados e um cientista de dados, por exemplo, a capacidade de consultar bancos de dados. Ambos analisam dados, mas a decisão de um cientista de dados pode ter um impacto maior em uma organização.

Aqui está um conjunto de habilidades que um cientista de dados normalmente precisa ter -

  • Programação em um pacote estatístico como: R, Python, SAS, SPSS ou Julia
  • Capaz de limpar, extrair e explorar dados de diferentes fontes
  • Pesquisa, projeto e implementação de modelos estatísticos
  • Conhecimento profundo de estatística, matemática e ciência da computação

Na análise de big data, as pessoas normalmente confundem a função de um cientista de dados com a de um arquiteto de dados. Na realidade, a diferença é bastante simples. Um arquiteto de dados define as ferramentas e a arquitetura em que os dados seriam armazenados, enquanto um cientista de dados usa essa arquitetura. Obviamente, um cientista de dados deve ser capaz de configurar novas ferramentas se necessário para projetos ad-hoc, mas a definição e o design da infraestrutura não devem fazer parte de sua tarefa.