3 điều sẽ giúp bạn tận dụng tối đa bootcamp khoa học dữ liệu của mình

Các chương trình đào tạo về khoa học dữ liệu chuyên sâu với chương trình giảng dạy dày đặc. Nếu bạn là người không chắc liệu bootcamp có phải là cách tốt nhất để bạn tiếp thu khoa học dữ liệu hay không, bạn có thể đọc bài viết trước của tôi tại đây. Trong bài viết này, tôi chia sẻ suy nghĩ của mình về cách tận dụng tối đa bootcamp khi bạn đã quyết định tham gia.
Khi tôi bắt đầu bootcamp với Codeop , tôi có một ý tưởng mơ hồ về những gì tôi sẽ học dựa trên chương trình giảng dạy được cung cấp cho tôi khi bắt đầu khóa học. Bây giờ tôi đã hiểu rõ về nó, tôi biết ơn về một số điều tôi đã làm trước ngày đầu tiên đến lớp và một số điều tôi ước mình đã dành thời gian làm như một phần của quá trình chuẩn bị. Vì vậy, dựa trên kinh nghiệm của tôi, trước ngày đầu tiên đến lớp, hãy sử dụng thời gian ở giữa để:
- Làm quen với ngôn ngữ lập trình bạn chọn
- Tìm hiểu nền tảng của thống kê
- Hiểu các thuật ngữ cơ bản của học máy
Tuyên bố miễn trừ trách nhiệm: Các tài nguyên được chia sẻ không phải là nội dung được tài trợ. Tất cả đều dựa trên kinh nghiệm cá nhân của tôi khi sử dụng chúng.
Làm quen với ngôn ngữ lập trình bạn chọn
Đối với trường hợp là người mới bắt đầu trong bất kỳ lĩnh vực nào, đường cong học tập với mã hóa sẽ dốc nhất khi bắt đầu. Sẽ thường xuyên có những trở ngại để vượt qua và không thể thoát khỏi phần gian khổ này trong hành trình trở thành nhà khoa học dữ liệu. Tuy nhiên, những kỹ năng học được vào thời điểm này là những bước đệm đặt nền móng cho việc một người có thể trở nên tốt như thế nào. Vì vậy, điều quan trọng là phải hiểu các khái niệm và nắm vững những điều cơ bản về mã hóa trong bất kỳ ngôn ngữ lập trình nào.
Chương trình giảng dạy của bootcamp có rất ít chỗ cho sự chậm chạp và điều đó khiến bạn dễ dàng bị bỏ lại phía sau trong việc củng cố sự hiểu biết đúng đắn về các chủ đề được giới thiệu. Trong một cấu trúc như vậy, việc bỏ qua một vài bước hoặc chuyển sang bước tiếp theo với sự hiểu biết dư thừa về các chủ đề trước đó có thể rất hấp dẫn. Để tránh rơi vào cái bẫy đó, sẽ cực kỳ hữu ích nếu bạn bắt đầu nắm bắt những kiến thức cơ bản về ngôn ngữ lập trình mà người ta muốn viết mã. Chúng có thể bao gồm các khái niệm như môi trường mã hóa, cú pháp và cấu trúc dữ liệu trong số những thứ khác.
Đề nghị của tôi:
Tôi khuyên bạn nên tham gia các khóa học giới thiệu trên Dataquest , nơi người ta có thể bắt đầu học miễn phí (với đăng ký trả phí để truy cập không giới hạn sau một thời điểm nhất định). Nó là tự nhịp độ và cung cấp hoàn toàn trực tuyến. Tôi đặc biệt thích cách tiếp cận 'vừa học vừa làm' của các khóa học trên nền tảng này khác với các khóa học khác (chẳng hạn như Datacamp ). Cách tiếp cận này đã giúp tôi ghi nhớ tốt hơn những gì tôi đã học. Các khóa học tập trung vào việc dạy học sinh cách học bằng cách suy nghĩ thông qua một vấn đề và chỉ cho họ tài liệu. Chia nhỏ một vấn đề phức tạp và sử dụng tài liệu để được trợ giúp là những kỹ năng vô giá cần có với tư cách là một nhà khoa học dữ liệu.
Tìm hiểu nền tảng của thống kê
Một trong những thành phần cốt lõi của khoa học dữ liệu là thống kê. Các nhà khoa học dữ liệu sử dụng số liệu thống kê để thu thập, xem xét, phân tích và rút ra kết luận từ dữ liệu, cũng như xây dựng các mô hình dữ liệu. Nói tóm lại, số liệu thống kê giúp đưa ra thông tin có ý nghĩa từ dữ liệu có thể hỗ trợ các hành động dựa trên bằng chứng.
Một bootcamp tốt sẽ nhằm mục đích bao gồm các khái niệm thống kê quan trọng như một phần của chương trình giảng dạy. Nhưng nó có thể trở nên kỹ thuật đối với những người chưa bao giờ xem số liệu thống kê trước đây. Ngay cả đối với những người có thể đã thực hiện thống kê 101 tại một thời điểm nào đó trong quá trình học tập của họ, việc nắm bắt tốt mọi chủ đề cần thiết cho các lĩnh vực như học máy có thể không phải là một miếng bánh.
Mặc dù có thể khó khăn để tìm ra một người nên bắt đầu học từ đâu, nhưng có rất nhiều tài nguyên miễn phí có sẵn về những kiến thức cơ bản về thống kê cần thiết cho khoa học dữ liệu. Tôi thấy ba lĩnh vực thống kê chính hữu ích trong khoa học dữ liệu:
- Khái niệm thống kê cốt lõi - Thống kê mô tả, phân phối, kiểm tra giả thuyết và hồi quy.
- Thống kê Bayes - Xác suất có điều kiện, tiền đề, hậu nghiệm và khả năng tối đa.
- Học máy thống kê - các khái niệm máy thống kê cơ bản hữu ích trong mô hình dự đoán, được phân biệt với các phương pháp thống kê cổ điển
- Nếu bạn thích tìm hiểu qua sách, bạn có thể xem Thống kê thực tế cho các nhà khoa học dữ liệu của Peter Bruce, Andrew Bruce và Peter Gedeck. Cuốn sách bao gồm các chủ đề thiết yếu ở định dạng dễ đọc và phù hợp cho người mới bắt đầu.
- Nếu bạn thích học qua video (như tôi), tôi sẽ giới thiệu loạt video về Nguyên tắc cơ bản về thống kê của Josh Starmer trên kênh youtube Statquest của anh ấy. Ông giải thích các khái niệm thống kê với phong cách giảng dạy rõ ràng và ngắn gọn đồng thời tận dụng tốt hình ảnh.
Học máy (ML) là một tập hợp con của lĩnh vực Khoa học dữ liệu chung. Học máy là một tập hợp các phương pháp, công cụ và thuật toán máy tính được sử dụng để huấn luyện máy móc phân tích, hiểu và tìm các mẫu ẩn trong dữ liệu cũng như đưa ra dự đoán. Nó thường được sử dụng trong các doanh nghiệp trong lĩnh vực trí tuệ nhân tạo.
Bootcamp công nghệ có khả năng bao gồm các chủ đề học máy trong chương trình giảng dạy của nó vì đây là bộ kỹ năng được săn đón trong sự nghiệp khoa học dữ liệu ngày nay. Để hiểu rõ các khái niệm lý thuyết thông qua bootcamp, sẽ rất hữu ích nếu bạn tự mình xem qua một số thuật ngữ và khái niệm cơ bản. Sau đó, điều này sẽ cho phép sử dụng các lớp thực tế để làm rõ hiểu biết của một người và đi sâu hơn vào các chủ đề quan tâm cụ thể để cuối cùng bắt đầu xây dựng các mô hình ML.
Đề nghị của tôi:
Tôi thấy video của Cassie Kozyrov Giới thiệu về ML và AI — MFML Phần 1 là một nguồn tài nguyên tuyệt vời dành cho người mới bắt đầu. Kết bạn với Machine Learning (MFML) là khóa học chỉ dành cho nội bộ của Google hiện được cung cấp cho tất cả mọi người. Cô ấy tập trung vào sự hiểu biết về khái niệm (chứ không phải là các chi tiết toán học và lập trình) và hướng dẫn thông qua các ý tưởng hình thành nền tảng của học máy. Thay vào đó, nếu bạn muốn đọc về nó, cô ấy cũng đã viết một bài báo trung bình về nó.