Наука о данных: ранняя и современная история

Nov 28 2022
Прежде чем мы начнем, давайте для удобства в общих чертах определим науку о данных. Что такое наука о данных? Наука о данных — это ● междисциплинарная концепция, ● которая использует любые научные методы, ● сочетает их с вычислениями, ● для получения информации, ● из данных.

Прежде чем мы начнем, давайте для удобства в общих чертах определим науку о данных.

Что такое наука о данных?

Наука о данных

● междисциплинарная концепция,

● который использует любые научные методы,

● сочетает это с вычислениями,

● для получения информации,

● из данных.

Но почему «Наука о данных» ? Кто первым употребил этот термин? С чего все началось? Что ж, давайте узнаем.

«Искушение формировать преждевременные теории на основе недостаточных данных — бич нашей профессии».

— Шерлок Холмс (из «Долины страха» сэра Артура Конан Дойля)

История ранних веков

Предсказать результат на основе предыдущих данных всегда было крайне важно на войне, в торговых экспедициях или в медицинской диагностике; сначала инстинктивно, затем опытным путем и всегда в области статистики. Но только в 1962 году Джон Тьюки описал то, что он назвал «анализом данных». А через 12 коротких лет, в 1974 году, Питер Наур предложил термин «наука о данных» в качестве альтернативы информатике, позже использованный CF Джеффом Ву в лекции как альтернатива статистике.

Так и началось зарождение одной из самых влиятельных дисциплин в информатике!

● В 1992 г. Университет Монпелье II признал Data Science новой дисциплиной на симпозиуме по статистике, которая объединила концепции и принципы статистики и анализа данных с вычислениями.

● А в 1996 г. Международная федерация классификационных обществ выделила науку о данных в качестве независимой темы.

«У каждой компании есть большие данные в будущем, и каждая компания в конечном итоге будет заниматься бизнесом данных».

— Томас Хейс Дэвенпорт

Теперь большинство из нас могло бы подумать, что на этом история закончилась, наука о данных была определена, и все согласились и поняли, что это такое, верно? Но с чем-то столь сложным и междисциплинарным, как наука о данных, дискуссия редко заканчивается!

В 1997 году CF Джефф Ву снова предложил переименовать статистику в науку о данных, мотивируя это тем, что новое название сотрет стереотипы. Но в 1998 году Хаяси Тикио выступил за науку о данных как новую междисциплинарную концепцию с тремя аспектами: проектирование данных, сбор и анализ. В увлекательной истории науки о данных есть еще много современных аспектов, и мы рассмотрим их в следующих статьях.

Современная история

Современная история нашей любимой дисциплины столь же ярка, как и Древняя история, а иногда даже более яркой, чем последняя!

Наша история начинается с одного из самых громких имен в науке о данных, Уильяма Суэйна Кливленда II, профессора статистики и компьютерных наук в Университете Пердью.

Профессору Кливленду приписывают определение и название науки о данных в публикации 2001 года. Он выступает за продвижение статистики за пределы области теории и в технические аспекты реального мира!

Таким образом, название « Наука о данных» стало широко использоваться, и в последующие годы произошло много примечательных событий, таких как

  • 2002 — Журнал Data Science Journal запущен Комитетом по науке о данных и технологиям.
  • 2003 — Журнал науки о данных, учрежденный Колумбийским университетом.
  • 2014 - Секция статистического обучения и интеллектуального анализа данных Американской статистической ассоциации переименована в Секцию статистического обучения и науки о данных.

Хотя в 2008 году звание Data Scientist как профессионалу присвоили DJ Patil и Jeff Hammerbacher. В 2005 году «Ученый по данным» был титулом, использованным Национальным советом по науке в отчете «Долгоживущие коллекции цифровых данных: содействие исследованиям и образованию в 21 веке». В отчете «специалист по данным» — это более широкий термин для любого, кто занимается сбором цифровых данных.

Самая сексуальная работа 21 века!

Это был 2012 год, и наша любимая дисциплина получила крылатую фразу и стала сенсацией. Технологи DJ Patil и Thomas H. Davenport объявили « Ученый по данным: самая сексуальная работа 21 века».

Даже такие газеты, как New York Times и Boston Globe, использовали этот термин. А десять лет спустя они подтвердили, что эта работа как никогда популярна среди работодателей!

Роль Data Scientist заключается в использовании данных для поиска решений и помощи в принятии наилучших решений.

Что ж, это было увлекательное путешествие, определение науки о данных до сих пор является предметом споров среди ученых, и на данный момент это просто модное словечко и не более того.

Я надеюсь, что смогу показать вам, что сфера и область науки о данных обширны, и споры по поводу ее определения все еще случаются.

Наука о данных пересекается с несколькими областями статистики, искусственного интеллекта и многими другими прикладными науками, и иногда границы могут быть размытыми, что делает исследование еще более захватывающим!

Написано,

Аджинкья Деокате из SIAM VIT Bhopal