Data Science: Früh- und Neuzeitgeschichte

Nov 28 2022
Bevor wir beginnen, wollen wir Data Science der Einfachheit halber grob definieren. Was ist Datenwissenschaft? Data Science ist ● ein interdisziplinäres Konzept, ● das beliebige wissenschaftliche Methoden nutzt, ● mit Computing kombiniert, ● Erkenntnisse gewinnt, ● aus Daten.

Bevor wir beginnen, wollen wir Data Science der Einfachheit halber grob definieren.

Was ist Datenwissenschaft?

Datenwissenschaft ist

● ein interdisziplinäres Konzept,

● die irgendwelche wissenschaftlichen Methoden verwendet,

● kombiniert es mit Computern,

● um Erkenntnisse zu gewinnen,

● aus Daten.

Aber warum „Data Science“ ? Wer hat diesen Begriff zuerst verwendet? Wo hat alles angefangen? Finden wir es heraus.

„Die Versuchung, voreilige Theorien auf der Grundlage unzureichender Daten zu bilden, ist der Fluch unseres Berufs.“

— Sherlock Holmes (aus dem Tal der Angst, von Sir Arthur Conan Doyle)

Frühe Geschichte

Die Vorhersage eines Ergebnisses aus früheren Daten war schon immer von entscheidender Bedeutung für Kriege, Handelsexpeditionen oder medizinische Diagnosen. zuerst aus Instinkt, dann aus Erfahrung und immer mehr durch das Gebiet der Statistik. Aber erst 1962 beschrieb John Tukey, was er „Datenanalyse“ nannte. Und in 12 kurzen Jahren, im Jahr 1974, schlug Peter Naur den Begriff „Data Science“ als Alternative zur Informatik vor, der später von CF Jeff Wu in einem Vortrag als Alternative zur Statistik verwendet wurde.

Und damit begann die Entstehung einer der einflussreichsten Disziplinen der Informatik!

● 1992 würdigte die Universität Montpellier II Data Science als neue Disziplin auf einem Statistik-Symposium, das die Konzepte und Prinzipien der Statistik und Datenanalyse mit Computing verband.

● Und 1996 stellte die International Federation of Classification Societies Data Science als eigenständiges Thema vor.

„Jedes Unternehmen hat Big Data in seiner Zukunft, und jedes Unternehmen wird irgendwann im Datengeschäft tätig sein.“

—Thomas Hayes Davenport

Nun, die meisten von uns würden denken, dass das die Geschichte war, Data Science wurde definiert, und alle waren sich einig und verstanden, was es war, oder? Aber bei etwas so Komplexem und Interdisziplinärem wie Data Science endet die Diskussion selten!

1997 schlug CF Jeff Wu erneut vor, Statistics in Data Science umzubenennen, mit der Begründung, dass ein neuer Titel Stereotypen auslöschen würde. Doch 1998 plädierte Hayashi Chikio für Data Science als neues, interdisziplinäres Konzept mit drei Aspekten: Datendesign, -sammlung und -analyse. Es gibt viele weitere moderne Aspekte in der faszinierenden Geschichte der Datenwissenschaft, und wir werden diese in den folgenden Artikeln behandeln.

Die morderne Geschichte

Die Neuzeit unserer Lieblingsdisziplin ist ebenso lebendig wie die Frühgeschichte, manchmal sogar noch lebendiger!

Unsere Geschichte beginnt mit einem der großen Namen der Datenwissenschaft, William Swain Cleveland II, Professor für Statistik und Informatik an der Purdue University.

Prof. Cleveland wird die Definition und Benennung von Data Science in einer Veröffentlichung aus dem Jahr 2001 zugeschrieben. Es befürwortet den Fortschritt der Statistik über die Domänen der Theorie hinaus in die technischen Aspekte der realen Welt!

So wurde der Name „ Data Science“ weit verbreitet, und in den kommenden Jahren geschahen viele bemerkenswerte Dinge, wie z

  • 2002 – Data Science Journal, herausgegeben vom Committee for Data Science and Technology
  • 2003 — Das von der Columbia University gegründete Journal of Data Science
  • 2014 — Statistical Learning and Data Mining section of the American Statistical Association umbenannt in Section on Statistical Learning and Data Science

Obwohl im Jahr 2008 DJ Patil und Jeff Hammerbacher der Titel „Data Scientist“ als Profi zugeschrieben wurde. 2005 war „Data Scientist“ ein Titel, der vom National Science Board im Bericht „Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century“ verwendet wurde. In dem Bericht war „Data Scientist“ ein weiter gefasster Begriff für jeden, der an der digitalen Datenerfassung beteiligt ist.

Sexiest Job des 21. Jahrhunderts!

Es war 2012, und unsere Lieblingsdisziplin bekam ein Schlagwort und wurde zur Sensation. Die Technologen DJ Patil und Thomas H. Davenport erklärten „ Data Scientist: The Sexiest job of the 21st Century“.

Auch Zeitungen wie die New York Times und Boston Globe verwendeten den Begriff. Und ein Jahrzehnt später bestätigten sie erneut, dass der Job bei Arbeitgebern so beliebt ist wie eh und je!

Die Rolle des Data Scientist besteht darin, anhand der Daten Lösungen zu finden und dabei zu helfen, die besten Entscheidungen zu treffen.

Nun, es war eine spannende Reise, die Definition von Data Science ist immer noch ein Diskussionsthema unter Wissenschaftlern, und im Moment ist es nur ein Schlagwort und ein bisschen mehr.

Ich hoffe, ich kann Ihnen zeigen, dass der Umfang und die Domäne von Data Science umfangreich sind und es immer noch zu Streitigkeiten kommt, um sie zu definieren.

Data Science überschneidet sich mit mehreren Bereichen der Statistik, künstlichen Intelligenz und vielen weiteren angewandten Wissenschaften, und die Grenzen können manchmal verschwimmen, was das Erkunden noch spannender macht!

Geschrieben von,

Ajinkya Deokate von SIAM VIT Bhopal