Ciencia de datos: historia temprana y moderna
Antes de comenzar, definamos vagamente la ciencia de datos por conveniencia.
¿Qué es la ciencia de datos?
La ciencia de datos es
● un concepto interdisciplinario,
● que utiliza cualquier método científico,
● lo combina con la informática,
● para producir ideas,
● de los datos.
Pero, ¿por qué 'Ciencia de datos' ? ¿Quién usó ese término primero? ¿Dónde comenzó todo? Bueno, averigüémoslo.
“La tentación de formar teorías prematuras sobre datos insuficientes es la ruina de nuestra profesión”.
— Sherlock Holmes (del Valle del Miedo, de Sir Arthur Conan Doyle)
Historia temprana
Predecir un resultado a partir de datos previos siempre ha sido crucial en la guerra, las expediciones comerciales o el diagnóstico médico; primero por instinto, luego por experiencia y cada vez más por el campo de la Estadística. Pero fue solo en 1962 que John Tukey describió lo que llamó "Análisis de datos". Y en 12 cortos años, en 1974, Peter Naur propuso el término "Ciencia de datos" como una alternativa a la informática, más tarde utilizado por CF Jeff Wu en una conferencia como una alternativa a la estadística.
¡Y así comenzó el surgimiento de una de las disciplinas más influyentes en la informática!
● En 1992, la Universidad de Montpellier II reconoció la ciencia de datos como una nueva disciplina en un simposio de estadística, que combinó los conceptos y principios de la estadística y el análisis de datos con la informática.
● Y en 1996, la Federación Internacional de Sociedades de Clasificación presentó la ciencia de datos como un tema independiente.
“Todas las empresas tienen Big Data en su futuro, y eventualmente todas las empresas estarán en el negocio de los datos”.
—Thomas Hayes Davenport
Ahora, la mayoría de nosotros pensaría que eso es todo, la ciencia de datos se definió y todos estuvieron de acuerdo y entendieron lo que era, ¿verdad? Pero con algo tan complejo e interdisciplinario como la ciencia de datos, ¡la discusión rara vez termina!
En 1997, CF Jeff Wu sugirió nuevamente cambiar el nombre de Estadísticas a Ciencia de datos, razonando que un nuevo título borraría los estereotipos. Pero en 1998, Hayashi Chikio abogó por la ciencia de datos como un nuevo concepto interdisciplinario con tres aspectos: diseño, recopilación y análisis de datos. Hay muchos más aspectos modernos en la fascinante historia de la ciencia de datos, y los cubriremos en los artículos posteriores.
Historia moderna
La historia moderna de nuestra disciplina favorita es tan vívida como la historia temprana, ¡a veces incluso más que la última!
Nuestra historia comienza con uno de los grandes nombres de la ciencia de datos, William Swain Cleveland II, profesor de Estadística y Ciencias de la Computación en la Universidad de Purdue.
Al profesor Cleveland se le atribuye la definición y el nombre de Data Science en una publicación de 2001. ¡Aboga por el avance de la estadística más allá de los dominios de la teoría y hacia los aspectos técnicos del mundo real!
Por lo tanto, el nombre " Ciencia de datos" se volvió ampliamente utilizado y muchas cosas notables sucedieron en los próximos años, como
- 2002 — Data Science Journal lanzada por el Comité de Ciencia y Tecnología de Datos
- 2003 — The Journal of Data Science establecida por la Universidad de Columbia
- 2014: la sección Aprendizaje estadístico y minería de datos de la Asociación Estadounidense de Estadística se renombró como Sección sobre aprendizaje estadístico y ciencia de datos
Aunque en 2008, el título de “Científico de datos” como profesional se lo han atribuido a DJ Patil y Jeff Hammerbacher. En 2005, "Científico de datos" fue un título utilizado por la Junta Nacional de Ciencias en el informe "Recopilaciones de datos digitales de larga duración: Habilitación de la investigación y la educación en el siglo XXI". En el informe, "Científico de datos" era un término más amplio para cualquier persona con un rol en la recopilación de datos digitales.
¡El trabajo más sexy del siglo XXI!
Era 2012, y se le dio un eslogan a nuestra disciplina favorita y se convirtió en una sensación. Los tecnólogos DJ Patil y Thomas H. Davenport declararon " Científico de datos: el trabajo más sexy del siglo XXI".
Incluso periódicos como el New York Times y el Boston Globe utilizaron el término. ¡Y una década después, reafirmaron que el trabajo es tan popular como siempre entre los empleadores!
El papel del científico de datos es utilizar los datos para encontrar soluciones y ayudar a tomar las mejores decisiones.
Bueno, ha sido un viaje apasionante, la definición de ciencia de datos sigue siendo un tema de debate entre los académicos y, por ahora, es solo una palabra de moda y un poco más.
Espero poder hacerle ver que el alcance y el dominio de la ciencia de datos son extensos, y aún existen disputas para definirlo.
La ciencia de datos se superpone con varios campos de la estadística, la inteligencia artificial y muchas más ciencias aplicadas, y las líneas pueden volverse borrosas a veces, ¡lo que hace que la exploración sea aún más emocionante!

Escrito por,
Ajinkya Deokate de SIAM VIT Bhopal