Ciência de dados: história antiga e moderna

Nov 28 2022
Antes de começar, vamos definir vagamente Data Science por conveniência. O que é Ciência de Dados? Data Science é ● um conceito interdisciplinar, ● que usa qualquer método científico, ● combina-o com a computação, ● para produzir insights, ● a partir de dados.

Antes de começar, vamos definir vagamente Data Science por conveniência.

O que é Ciência de Dados?

Ciência de dados é

● um conceito interdisciplinar,

● que usa quaisquer métodos científicos,

● combina com computação,

● para produzir insights,

● de dados.

Mas por que 'Ciência de Dados' ? Quem usou esse termo primeiro? Onde tudo começou? Bem, vamos descobrir.

“A tentação de formar teorias prematuras sobre dados insuficientes é a ruína de nossa profissão.”

— Sherlock Holmes (do Vale do Medo, de Sir Arthur Conan Doyle)

História antiga

Prever um resultado a partir de dados anteriores sempre foi crucial em guerras, expedições comerciais ou diagnósticos médicos; feito primeiro por instinto, depois por experiência e cada vez mais pelo campo da Estatística. Mas foi apenas em 1962 que John Tukey descreveu o que chamou de “Análise de Dados”. E em 12 curtos anos, em 1974, Peter Naur propôs o termo “Data Science” como alternativa à ciência da computação, posteriormente utilizado por CF Jeff Wu em uma palestra como alternativa à estatística.

E assim começou o surgimento de uma das disciplinas mais influentes da ciência da computação!

● Em 1992, a Universidade de Montpellier II reconheceu a Ciência de Dados como uma nova disciplina em um simpósio de estatística, que combinou os conceitos e princípios de estatística e análise de dados com computação.

● E em 1996, a Federação Internacional de Sociedades de Classificação apresentou a Ciência de Dados como um tópico independente.

“Toda empresa tem Big Data em seu futuro e, eventualmente, toda empresa estará no negócio de dados.”

—Thomas Hayes Davenport

Agora, a maioria de nós pensaria que é isso para a história, Data Science foi definida e todos concordaram e entenderam o que era, certo? Mas com algo tão complexo e interdisciplinar como Data Science, a discussão raramente termina!

Em 1997, CF Jeff Wu novamente sugeriu renomear Estatística como Ciência de Dados, raciocinando que um novo título apagaria estereótipos. Mas em 1998, Hayashi Chikio defendeu a Data Science como um novo conceito interdisciplinar com três aspectos: design, coleta e análise de dados. Existem muitos outros aspectos modernos na fascinante história da ciência de dados, e vamos abordá-los nos artigos posteriores.

História moderna

A história moderna de nossa disciplina favorita é tão vívida quanto a história primitiva, às vezes até mais do que a última!

Nossa história começa com um dos grandes nomes da Ciência de Dados, William Swain Cleveland II, professor de Estatística e Ciência da Computação na Purdue University.

O professor Cleveland é creditado por definir e nomear Data Science em uma publicação de 2001. Defende o avanço da Estatística além dos domínios da teoria e nos aspectos técnicos do mundo real!

Assim, o nome “ Data Science” tornou-se amplamente utilizado, e muitas coisas notáveis ​​aconteceram nos próximos anos, como

  • 2002 — Data Science Journal lançado pelo Comitê de Ciência e Tecnologia de Dados
  • 2003 — The Journal of Data Science estabelecido pela Universidade de Columbia
  • 2014 — Seção de Aprendizagem Estatística e Mineração de Dados da American Statistical Association renomeada como Seção de Aprendizagem Estatística e Ciência de Dados

Embora em 2008, o título de “Data Scientist” como profissional tenha sido atribuído a DJ Patil e Jeff Hammerbacher. Em 2005, “Data Scientist” foi um título usado pelo National Science Board no relatório “Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century”. No relatório, “Cientista de Dados” era um termo mais amplo para qualquer pessoa com uma função na coleta de dados digitais.

Trabalho mais sexy do século 21!

Era 2012 e uma frase de efeito foi dada à nossa disciplina favorita e se tornou uma sensação. Os tecnólogos DJ Patil e Thomas H. Davenport declararam “ Cientista de dados: o trabalho mais sexy do século XXI”.

Mesmo jornais como o New York Times e o Boston Globe usaram o termo. E uma década depois, eles reafirmaram que o trabalho é mais popular do que nunca entre os empregadores!

O papel do Cientista de Dados é usar os dados para encontrar soluções e ajudar a tomar as melhores decisões.

Bem, tem sido uma jornada fascinante, a definição de Data Science ainda é um tema de debate entre os estudiosos e, por enquanto, é apenas uma palavra da moda e um pouco mais.

Espero poder fazer você enxergar que o escopo e o domínio do Data Science são extensos, e ainda acontecem disputas para defini-lo.

Data Science se sobrepõe a vários campos da Estatística, Inteligência Artificial e muitas outras ciências aplicadas, e as linhas podem ficar embaçadas às vezes, tornando a exploração ainda mais emocionante!

Escrito por,

Ajinkya Deokate de SIAM VIT Bhopal