Nauka o danych: wczesna i współczesna historia
Zanim zaczniemy, dla wygody zdefiniujmy luźno Data Science.
Czym jest nauka o danych?
Nauka o danych jest
● koncepcja interdyscyplinarna,
● która wykorzystuje jakiekolwiek metody naukowe,
● łączy to z informatyką,
● do tworzenia spostrzeżeń,
● z danych.
Ale dlaczego „nauka o danych” ? Kto pierwszy użył tego określenia? Gdzie to wszystko się zaczęło? Cóż, dowiedzmy się.
„Pokusa formułowania przedwczesnych teorii na podstawie niewystarczających danych jest zmorą naszego zawodu”.
— Sherlock Holmes (z Doliny strachu, autorstwa Sir Arthura Conan Doyle'a)
Wczesna historia
Przewidywanie wyniku na podstawie poprzednich danych zawsze było kluczowe w przypadku wojny, wypraw handlowych lub diagnozy medycznej; najpierw przez instynkt, potem przez doświadczenie i coraz częściej poprzez dziedzinę statystyki. Ale dopiero w 1962 roku John Tukey opisał to, co nazwał „analizą danych”. W ciągu 12 krótkich lat, w 1974 roku, Peter Naur zaproponował termin „Data Science” jako alternatywę dla informatyki, później użyty przez CF Jeffa Wu w wykładzie jako alternatywa dla statystyki.
I tak zaczęło się narodziny jednej z najbardziej wpływowych dyscyplin w informatyce!
● W 1992 roku Uniwersytet Montpellier II uznał Data Science za nową dyscyplinę na sympozjum statystycznym, które połączyło koncepcje i zasady statystyki i analizy danych z informatyką.
● W 1996 roku Międzynarodowa Federacja Towarzystw Klasyfikacyjnych przedstawiła Data Science jako niezależny temat.
„Każda firma ma w swojej przyszłości Big Data i każda firma ostatecznie będzie działać w branży danych”.
— Thomasa Hayesa Davenporta
Większość z nas pomyślałaby, że to wszystko, zdefiniowano Data Science i wszyscy zgodzili się i zrozumieli, o co chodzi, prawda? Ale w przypadku czegoś tak złożonego i interdyscyplinarnego jak Data Science dyskusja rzadko się kończy!
W 1997 roku CF Jeff Wu ponownie zasugerował zmianę nazwy Statistics na Data Science, argumentując, że nowy tytuł wymaza stereotypy. Ale w 1998 roku Hayashi Chikio opowiadał się za nauką o danych jako nową, interdyscyplinarną koncepcją obejmującą trzy aspekty: projektowanie, gromadzenie i analizę danych. Istnieje wiele innych nowoczesnych aspektów fascynującej historii nauki o danych, które omówimy w kolejnych artykułach.
Współczesna historia
Nowożytna historia naszej ulubionej dyscypliny jest tak samo żywa jak wczesna historia, czasem nawet bardziej niż ta druga!
Nasza historia zaczyna się od jednego z wielkich nazwisk w Data Science, Williama Swaina Clevelanda II, profesora statystyki i informatyki na Purdue University.
Prof Cleveland jest uznawany za zdefiniowanie i nazwanie Data Science w publikacji z 2001 roku. Opowiada się za postępem statystyki poza domenami teorii i do technicznych aspektów świata rzeczywistego!
W ten sposób nazwa „ Data Science” stała się powszechnie używana, aw nadchodzących latach wydarzyło się wiele godnych uwagi rzeczy, jak np
- 2002 — Data Science Journal uruchomiony przez Komitet ds. Nauki o Danych i Technologii
- 2003 — The Journal of Data Science założony przez Columbia University
- 2014 — Sekcja nauki statystycznej i eksploracji danych Amerykańskiego Towarzystwa Statystycznego przemianowana na sekcję nauki statystycznej i nauki o danych
Chociaż w 2008 roku tytuł „Data Scientist” jako profesjonalisty przypisali DJ Patil i Jeffowi Hammerbacherowi. W 2005 roku „Data Scientist” był tytułem użytym przez National Science Board w raporcie „Long-Life Digital Data Collections: Enabling Research and Education in the 21st Century”. W raporcie „Data Scientist” był szerszym terminem dla każdego, kto pełni rolę w gromadzeniu danych cyfrowych.
Najseksowniejsza praca XXI wieku!
Był rok 2012, a nasza ulubiona dyscyplina otrzymała takie hasło i stała się sensacją. Technolodzy DJ Patil i Thomas H. Davenport ogłosili „ Naukowiec danych: najseksowniejsza praca XXI wieku”.
Nawet gazety takie jak New York Times i Boston Globe używały tego terminu. Dziesięć lat później potwierdzili, że praca ta jest tak samo popularna jak zawsze wśród pracodawców!
Rolą Data Scientist jest wykorzystanie danych do znalezienia rozwiązań i pomoc w podjęciu najlepszych decyzji.
Cóż, to była fascynująca podróż, definicja nauki o danych jest nadal przedmiotem debaty wśród naukowców, a na razie jest to tylko modne hasło i trochę więcej.
Mam nadzieję, że uda mi się pokazać, że zakres i domena Data Science jest rozległa, a spory wciąż ją definiują.
Nauka o danych pokrywa się z kilkoma dziedzinami statystyki, sztucznej inteligencji i wieloma innymi naukami stosowanymi, a granice mogą się czasami zacierać, dzięki czemu odkrywanie jest jeszcze bardziej ekscytujące!

Scenariusz,
Ajinkya Deokate z SIAM VIT Bhopal