데이터 사이언스 부트캠프를 최대한 활용하는 데 도움이 되는 3가지

데이터 사이언스 부트캠프는 꽉 찬 커리큘럼으로 집중적으로 진행됩니다. 부트캠프가 데이터 과학을 배우는 가장 좋은 방법인지 확신이 서지 않는 사람은 여기에서 이전 기사 를 읽을 수 있습니다. 이 기사에서는 부트캠프에 가입하기로 결정한 후 부트캠프를 최대한 활용하는 방법에 대한 제 생각을 공유합니다.
Codeop 으로 부트캠프를 시작했을 때 과정 시작 시 제공된 커리큘럼을 기반으로 무엇을 배우게 될지에 대한 막연한 생각이 있었습니다. 이제 나는 그 일에 몰두하고 있기 때문에 수업 첫날 전에 했던 일에 대해 감사하고 준비의 일환으로 시간을 보냈더라면 좋았을 일도 있습니다. 따라서 내 경험을 바탕으로 수업 첫날을 예상하여 그 사이의 시간을 다음과 같이 사용하십시오.
- 선택한 프로그래밍 언어에 익숙해지기
- 통계의 기초를 배우다
- 기계 학습의 기본 용어 이해
면책 조항: 공유된 리소스는 후원 콘텐츠가 아닙니다. 그것들은 모두 나의 개인적인 사용 경험을 기반으로 합니다.
선택한 프로그래밍 언어에 익숙해지기
모든 분야에서 초보자가 되는 경우와 마찬가지로 코딩을 통한 학습 곡선은 처음에 가장 가파릅니다. 탐색하는 데 자주 걸림돌이 있을 것이며 데이터 과학자가 되기 위한 여정의 이 힘든 부분을 피할 수 없습니다. 그러나 이 시점에서 배운 기술은 얼마나 잘할 수 있는지에 대한 토대를 마련하는 디딤돌입니다. 따라서 개념을 이해하고 모든 프로그래밍 언어에서 코딩의 기본 사항을 확실하게 파악하는 것이 중요합니다.
부트캠프의 커리큘럼은 느슨해질 여지가 거의 없기 때문에 소개된 주제를 제대로 이해하는 데 뒤쳐지기 쉽습니다. 이러한 구조 내에서 이전 주제에 대한 불필요한 이해로 몇 단계를 건너뛰거나 다음 단계로 이동하는 것이 매력적일 수 있습니다. 이러한 함정에 빠지지 않으려면 코딩하려는 프로그래밍 언어의 기본 사항을 먼저 익히는 것이 매우 유용합니다. 여기에는 무엇보다도 코딩 환경, 구문 및 데이터 구조와 같은 개념이 포함될 수 있습니다.
내 추천:
무료로 학습을 시작할 수 있는 Dataquest 의 입문 과정을 수강하는 것이 좋습니다 (특정 시점 이후에 무제한으로 액세스할 수 있는 유료 구독 포함). 자체 진행되며 완전히 온라인으로 제공됩니다. 저는 특히 다른 플랫폼(예: Datacamp ) 과 다른 이 플랫폼의 과정의 '실행하여 배우기' 접근 방식이 마음에 들었습니다 . 이 접근 방식은 제가 배운 내용을 더 잘 기억하는 데 도움이 되었습니다. 이 과정은 학생들에게 문제를 통해 생각하고 문서로 안내하여 학습하는 방법을 가르치는 데 중점을 둡니다. 복잡한 문제를 분석하고 문서를 사용하여 도움을 받는 것은 데이터 과학자로서 매우 중요한 기술입니다.
통계의 기초를 배우다
데이터 과학의 핵심 구성 요소 중 하나는 통계입니다. 데이터 과학자는 통계를 사용하여 데이터를 수집, 검토, 분석 및 결론을 도출하고 데이터 모델을 구축합니다. 즉, 통계는 증거 기반 조치를 지원할 수 있는 데이터에서 의미 있는 정보를 가져오는 데 도움이 됩니다.
좋은 부트캠프는 커리큘럼의 일부로 중요한 통계 개념을 다루는 것을 목표로 합니다. 그러나 이전에 통계를 접한 적이 없는 사람에게는 기술적일 수 있습니다. 교육의 어느 시점에서 통계학 기초를 다뤘을 수도 있는 사람들에게도 기계 학습과 같은 영역에 필요한 모든 주제를 잘 이해하는 것은 식은 죽 먹기가 아닐 수 있습니다.
어디에서 학습을 시작해야 하는지 파악하기 어려울 수 있지만 데이터 과학에 필요한 통계의 기본에 대해 사용할 수 있는 무료 리소스가 많이 있습니다. 데이터 과학에 유용한 통계의 세 가지 주요 영역이 있습니다.
- 핵심 통계 개념 — 기술 통계, 분포, 가설 테스트 및 회귀.
- 베이지안 통계 — 조건부 확률, 사전 확률, 사후 확률 및 최대 우도.
- 통계적 기계 학습 — 고전적인 통계 방법과 구별되는 예측 모델링에 유용한 기본 통계적 기계 개념
- 책을 통해 배우는 것을 좋아한다면 Peter Bruce, Andrew Bruce 및 Peter Gedeck의 Practical Statistics for Data Scientists를 확인할 수 있습니다 . 이 책은 읽기 쉬운 형식으로 필수 주제를 다루며 초보자에게 적합합니다.
- 나처럼 비디오를 통한 학습을 선호하는 경우 YouTube 채널 Statquest에서 Josh Starmer 의 Statistics Fundamentals 비디오 시리즈를 추천합니다. 시각 자료를 잘 활용하면서 명료하고 간결한 교수법으로 통계 개념을 설명한다.
기계 학습(ML)은 데이터 과학 일반 분야의 하위 집합입니다. 기계 학습 은 데이터에서 숨겨진 패턴을 분석, 이해 및 찾고 예측하도록 기계를 훈련시키는 데 사용되는 일련의 방법, 도구 및 컴퓨터 알고리즘입니다. 인공 지능 영역 내의 비즈니스에서 일반적으로 사용됩니다.
기술 부트캠프는 오늘날 데이터 과학 경력에서 필요한 기술 세트이므로 커리큘럼 내에서 기계 학습 주제를 다룰 가능성이 높습니다. 부트캠프를 통해 이론적인 개념을 잘 이해하려면 시간을 내서 몇 가지 기본 용어와 개념을 살펴보는 것이 도움이 됩니다. 그러면 실제 클래스를 사용하여 이해를 명확히 하고 관심 있는 특정 주제로 더 깊이 들어가 결국 ML 모델 구축을 시작할 수 있습니다.
내 추천:
저는 Cassie Kozyrov의 비디오 Introduction to ML and AI — MFML Part 1 이 초보자가 사용할 수 있는 놀라운 리소스라는 것을 알았습니다. 기계 학습과 친구 만들기(MFML)는 이제 모든 사람이 사용할 수 있는 내부 전용 Google 과정이었습니다. 그녀는 (수학적 및 프로그래밍 세부 사항보다는) 개념적 이해에 초점을 맞추고 기계 학습의 기초를 형성하는 아이디어를 안내합니다. 대신 그것에 대해 읽는 것을 선호한다면 그녀는 그것에 대한 중간 기사 도 썼습니다 .