Nauka o danych: wczesna i współczesna historia

Nov 28 2022
Zanim zaczniemy, dla wygody zdefiniujmy luźno Data Science. Czym jest nauka o danych? Data Science jest ● koncepcją interdyscyplinarną, ● wykorzystującą dowolne metody naukowe, ● łączącą ją z informatyką, ● uzyskiwaniem wglądu, ● z danych.

Zanim zaczniemy, dla wygody zdefiniujmy luźno Data Science.

Czym jest nauka o danych?

Nauka o danych jest

● koncepcja interdyscyplinarna,

● która wykorzystuje jakiekolwiek metody naukowe,

● łączy to z informatyką,

● do tworzenia spostrzeżeń,

● z danych.

Ale dlaczego „nauka o danych” ? Kto pierwszy użył tego określenia? Gdzie to wszystko się zaczęło? Cóż, dowiedzmy się.

„Pokusa formułowania przedwczesnych teorii na podstawie niewystarczających danych jest zmorą naszego zawodu”.

— Sherlock Holmes (z Doliny strachu, autorstwa Sir Arthura Conan Doyle'a)

Wczesna historia

Przewidywanie wyniku na podstawie poprzednich danych zawsze było kluczowe w przypadku wojny, wypraw handlowych lub diagnozy medycznej; najpierw przez instynkt, potem przez doświadczenie i coraz częściej poprzez dziedzinę statystyki. Ale dopiero w 1962 roku John Tukey opisał to, co nazwał „analizą danych”. W ciągu 12 krótkich lat, w 1974 roku, Peter Naur zaproponował termin „Data Science” jako alternatywę dla informatyki, później użyty przez CF Jeffa Wu w wykładzie jako alternatywa dla statystyki.

I tak zaczęło się narodziny jednej z najbardziej wpływowych dyscyplin w informatyce!

● W 1992 roku Uniwersytet Montpellier II uznał Data Science za nową dyscyplinę na sympozjum statystycznym, które połączyło koncepcje i zasady statystyki i analizy danych z informatyką.

● W 1996 roku Międzynarodowa Federacja Towarzystw Klasyfikacyjnych przedstawiła Data Science jako niezależny temat.

„Każda firma ma w swojej przyszłości Big Data i każda firma ostatecznie będzie działać w branży danych”.

— Thomasa Hayesa Davenporta

Większość z nas pomyślałaby, że to wszystko, zdefiniowano Data Science i wszyscy zgodzili się i zrozumieli, o co chodzi, prawda? Ale w przypadku czegoś tak złożonego i interdyscyplinarnego jak Data Science dyskusja rzadko się kończy!

W 1997 roku CF Jeff Wu ponownie zasugerował zmianę nazwy Statistics na Data Science, argumentując, że nowy tytuł wymaza stereotypy. Ale w 1998 roku Hayashi Chikio opowiadał się za nauką o danych jako nową, interdyscyplinarną koncepcją obejmującą trzy aspekty: projektowanie, gromadzenie i analizę danych. Istnieje wiele innych nowoczesnych aspektów fascynującej historii nauki o danych, które omówimy w kolejnych artykułach.

Współczesna historia

Nowożytna historia naszej ulubionej dyscypliny jest tak samo żywa jak wczesna historia, czasem nawet bardziej niż ta druga!

Nasza historia zaczyna się od jednego z wielkich nazwisk w Data Science, Williama Swaina Clevelanda II, profesora statystyki i informatyki na Purdue University.

Prof Cleveland jest uznawany za zdefiniowanie i nazwanie Data Science w publikacji z 2001 roku. Opowiada się za postępem statystyki poza domenami teorii i do technicznych aspektów świata rzeczywistego!

W ten sposób nazwa „ Data Science” stała się powszechnie używana, aw nadchodzących latach wydarzyło się wiele godnych uwagi rzeczy, jak np

  • 2002 — Data Science Journal uruchomiony przez Komitet ds. Nauki o Danych i Technologii
  • 2003 — The Journal of Data Science założony przez Columbia University
  • 2014 — Sekcja nauki statystycznej i eksploracji danych Amerykańskiego Towarzystwa Statystycznego przemianowana na sekcję nauki statystycznej i nauki o danych

Chociaż w 2008 roku tytuł „Data Scientist” jako profesjonalisty przypisali DJ Patil i Jeffowi Hammerbacherowi. W 2005 roku „Data Scientist” był tytułem użytym przez National Science Board w raporcie „Long-Life Digital Data Collections: Enabling Research and Education in the 21st Century”. W raporcie „Data Scientist” był szerszym terminem dla każdego, kto pełni rolę w gromadzeniu danych cyfrowych.

Najseksowniejsza praca XXI wieku!

Był rok 2012, a nasza ulubiona dyscyplina otrzymała takie hasło i stała się sensacją. Technolodzy DJ Patil i Thomas H. Davenport ogłosili „ Naukowiec danych: najseksowniejsza praca XXI wieku”.

Nawet gazety takie jak New York Times i Boston Globe używały tego terminu. Dziesięć lat później potwierdzili, że praca ta jest tak samo popularna jak zawsze wśród pracodawców!

Rolą Data Scientist jest wykorzystanie danych do znalezienia rozwiązań i pomoc w podjęciu najlepszych decyzji.

Cóż, to była fascynująca podróż, definicja nauki o danych jest nadal przedmiotem debaty wśród naukowców, a na razie jest to tylko modne hasło i trochę więcej.

Mam nadzieję, że uda mi się pokazać, że zakres i domena Data Science jest rozległa, a spory wciąż ją definiują.

Nauka o danych pokrywa się z kilkoma dziedzinami statystyki, sztucznej inteligencji i wieloma innymi naukami stosowanymi, a granice mogą się czasami zacierać, dzięki czemu odkrywanie jest jeszcze bardziej ekscytujące!

Scenariusz,

Ajinkya Deokate z SIAM VIT Bhopal