데이터 과학: 초기 및 현대사

Nov 28 2022
시작하기 전에 편의를 위해 데이터 과학을 느슨하게 정의해 보겠습니다. 데이터 과학이란 무엇입니까? 데이터 과학은 ● 학제 간 개념입니다. ● 모든 과학적 방법을 사용합니다. ● 이를 컴퓨팅과 결합합니다. ● 데이터에서 통찰력을 생성합니다.

시작하기 전에 편의를 위해 데이터 과학을 느슨하게 정의해 보겠습니다.

데이터 과학이란 무엇입니까?

데이터 과학은

● 학제 간 개념,

● 과학적인 방법을 사용하는 것,

● 컴퓨팅과 결합

● 통찰력을 얻기 위해

● 데이터에서.

그런데 왜 '데이터 사이언스' 인가? 누가 그 용어를 처음 사용했는가? 모든 것이 어디서 시작되었습니까? 글쎄, 알아 보자.

"불충분한 데이터에 대해 시기상조의 이론을 형성하려는 유혹은 우리 직업의 골칫거리입니다."

— 셜록 홈즈(공포의 계곡, 아서 코난 도일 경)

초기 역사

이전 데이터에서 결과를 예측하는 것은 전쟁, 무역 원정 또는 의료 진단에서 항상 중요했습니다. 처음에는 본능에 의해, 그 다음에는 경험에 의해, 그리고 통계 분야를 통해 계속됩니다. 그러나 John Tukey가 "데이터 분석"이라고 부르는 것을 기술한 것은 1962년이었습니다. 그리고 12년이라는 짧은 기간인 1974년에 Peter Naur는 컴퓨터 과학의 대안으로 "데이터 과학"이라는 용어를 제안했으며 나중에 CF Jeff Wu가 강의에서 통계의 대안으로 사용했습니다.

따라서 컴퓨터 과학에서 가장 영향력 있는 분야 중 하나의 출현이 시작되었습니다!

● 1992년 University of Montpellier II는 통계 및 데이터 분석의 개념과 원리를 컴퓨팅과 결합한 통계 심포지엄에서 데이터 과학을 새로운 학문 분야로 인정했습니다.

● 그리고 1996년에 국제분류협회연맹(International Federation of Classification Societies)은 데이터 과학을 독립 주제로 다루었습니다.

"모든 회사는 미래에 빅 데이터를 가지고 있으며 모든 회사는 결국 데이터 비즈니스에 있게 될 것입니다."

— 토마스 헤이즈 데이븐포트

이제 우리 대부분은 그것이 이야기의 전부라고 생각할 것입니다. 데이터 과학이 정의되었고 모든 사람들이 그것이 무엇인지 동의하고 이해했습니다. 맞습니까? 그러나 데이터 사이언스처럼 복잡하고 학제적인 것에서는 토론이 거의 끝나지 않습니다!

1997년 CF Jeff Wu는 새로운 제목이 고정관념을 지울 것이라고 추론하면서 Statistics를 데이터 과학으로 이름을 바꿀 것을 다시 제안했습니다. 그러나 1998년에 Hayashi Chikio는 데이터 설계, 수집 및 분석이라는 세 가지 측면을 가진 새로운 학제 간 개념으로 데이터 과학을 옹호했습니다. 데이터 과학의 매혹적인 역사에는 더 많은 현대적 측면이 있으며 이후 기사에서 다룰 것입니다.

현대사

우리가 가장 좋아하는 분야의 현대사는 초기 역사만큼 생생하며 때로는 후자보다 훨씬 더 생생합니다!

우리의 이야기는 데이터 과학의 거물 중 한 명인 Purdue University의 통계 및 컴퓨터 과학 교수인 William Swain Cleveland II로 시작됩니다.

Cleveland 교수는 2001년 간행물에서 데이터 과학을 정의하고 명명한 공로를 인정받습니다. 그것은 이론의 영역을 넘어 실제 세계의 기술적 측면으로의 통계의 발전을 옹호합니다!

따라서 " 데이터 사이언스" 라는 이름 이 널리 사용되었고 앞으로 몇 년 동안 주목할 만한 많은 일들이 일어났습니다.

  • 2002 — 데이터 과학 및 기술 위원회에서 데이터 과학 저널 발간
  • 2003 — 컬럼비아 대학교에서 창간한 Journal of Data Science
  • 2014 — 미국 통계 협회의 통계 학습 및 데이터 마이닝 섹션이 통계 학습 및 데이터 과학 섹션으로 명칭 변경됨

2008년에는 DJ Patil과 Jeff Hammerbacher가 전문가로서 "데이터 과학자"라는 칭호를 얻었습니다. 2005년에 "Data Scientist"는 National Science Board가 "Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century" 보고서에서 사용한 제목이었습니다 . 보고서에서 "데이터 과학자" 는 디지털 데이터 수집 역할을 하는 모든 사람을 가리키는 더 넓은 의미의 용어였습니다.

21세기 가장 섹시한 직업!

2012년, 우리가 가장 좋아하는 분야에 캐치프레이즈가 주어져 센세이션을 일으켰습니다. 기술자 DJ Patil과 Thomas H. Davenport는 " 데이터 과학자: 21세기 가장 섹시한 직업"이라고 선언했습니다.

New York Times 및 Boston Globe와 같은 신문에서도 이 용어를 사용했습니다. 그리고 10년 후, 그들은 그 직업이 고용주들에게 그 어느 때보다 인기가 있다는 것을 재확인했습니다!

데이터 과학자의 역할은 데이터를 사용하여 솔루션을 찾고 최선의 결정을 내리는 데 도움을 주는 것입니다.

글쎄요, 그것은 흥미진진한 여정이었습니다. 데이터 과학의 정의는 여전히 학자들 사이에서 논쟁의 주제이며 현재로서는 유행어일 뿐이고 조금 더 있습니다.

데이터 과학의 범위와 영역이 광범위하고 이를 정의하기 위해 여전히 분쟁이 발생하고 있음을 알 수 있기를 바랍니다.

데이터 사이언스는 통계학, 인공 지능 및 더 많은 응용 과학의 여러 분야와 겹치며 때로는 선이 흐려질 수 있어 탐색이 더욱 흥미진진해집니다!

작성자,

SIAM VIT Bhopal의 Ajinkya Deokate