Hành trình Kaggle của tôi: từ Người mới làm quen đến Bậc thầy về Notebooks

Kaggle là một phần quan trọng trong sự nghiệp của mỗi nhà khoa học dữ liệu, hoạt động tích cực trên Kaggle không chỉ giúp bạn xây dựng sự nghiệp vĩ đại mà quan trọng nhất đó là nơi mà một người có thể học hỏi từ những người giỏi nhất trong lĩnh vực này và xây dựng các kết nối cho cuộc sống. Đối với những bạn chưa biết về Kaggle, đừng lo lắng, tôi sẽ giải thích một chút về hoạt động của nền tảng này.
Tôi đã hoạt động khá tích cực trên Kaggle trong 6 tháng qua, học hỏi được nhiều điều từ công việc của người khác và giới thiệu tác phẩm của mình với thế giới bên ngoài. Có năm cấp trong Kaggle, đó là Người mới, Người đóng góp, Chuyên gia, Thạc sĩ và Người lớn và có nhiều mục tiêu khác nhau mà bạn cần phải hoàn thành trước khi chuyển từ cấp độ này sang cấp độ khác. Tôi đã trở thành Chuyên gia về Sổ tay và Thảo luận Kaggle vào ngày 27 tháng 1 năm 2021 và thành thật mà nói, tôi nghĩ đó là cấp độ tối đa mà tôi có thể đạt được, nhưng sau khi làm việc chăm chỉ thêm một thời gian nữa, cuối cùng tôi đã trở thành Thạc sĩ Kaggle vào ngày 25 tháng 6 năm 2021. The Những cảm xúc mà tôi đã có trong ngày hôm đó không thể diễn tả thành lời. Thứ hạng hiện tại của tôi là 235 trên 176.033 trên thế giới.

Mục đích chính của bài viết này là chia sẻ hành trình Kaggle của tôi với bạn, cách tôi vượt qua nỗi sợ hãi hoặc hội chứng kẻ mạo danh, cách tôi học được những điều mới từ nền tảng và khuyến khích bạn bắt đầu hành trình Kaggle của riêng mình. Trước khi thảo luận về những điều này, chúng ta hãy thảo luận ngắn gọn về Kaggle.
Kaggle là gì?
Kaggle là một cộng đồng cho phép tất cả những người đam mê khoa học dữ liệu trên toàn cầu tập hợp và tham gia các cuộc thi khác nhau, tải lên bộ dữ liệu để những người khác thử nghiệm, chia sẻ sổ ghi chép hoặc hạt nhân và tham gia vào các cuộc thảo luận về Học máy, Học sâu hoặc bất cứ điều gì trong lĩnh vực Trí tuệ nhân tạo.
Có bốn loại khác nhau trong Kaggle:
Các cuộc thi
Bạn có thể lập nhóm hoặc tham gia cá nhân vào các cuộc thi khác nhau được đăng bởi các công ty khác nhau hoặc chính Kaggle. Các cuộc thi cho phép bạn nâng cao kỹ năng khoa học dữ liệu tổng thể của mình vì bạn sẽ phải thực hiện kỹ thuật tính năng, lựa chọn tính năng và điều chỉnh siêu tham số, v.v. để chọn mô hình tốt nhất và gửi lần cuối cùng cho cuộc thi. Các cuộc thi cho phép bạn khám phá tiềm năng thực sự của mình và khiến bạn học được nhiều cách tiếp cận mới để đối phó với một vấn đề.
Bộ dữ liệu
Nếu bất kỳ ai tìm thấy bất kỳ tập dữ liệu độc đáo hoặc thú vị nào, họ có thể tải lên Kaggle và cũng có thể đề cập đến một số nhiệm vụ như thực hiện Phân tích Dữ liệu Khám phá và tìm ra câu trả lời cho một số câu hỏi liên quan đến dữ liệu được tải lên, v.v. Nhiều lần, nếu bạn phải thực hiện một số tác vụ Học máy mà không có bộ dữ liệu nào có sẵn, bạn luôn có thể tham khảo các bộ dữ liệu có sẵn trên Kaggle.
Sổ ghi chép
Khi bạn tìm ra bất kỳ tập dữ liệu thú vị nào, bạn có thể tạo sổ ghi chép hoặc hạt nhân cho tập dữ liệu. Máy tính xách tay là công cụ đa năng có tính tương tác cao cho phép bạn viết và thực thi mã. Bạn cũng có thể khám phá sổ ghi chép của người khác, và đối với tôi, đây là phần hay nhất của Kaggle, bởi vì khi tôi không có ý tưởng hoặc có một số nghi ngờ về cách tiếp cận, tôi có thể học hỏi từ sổ tay của người khác và đưa ra những ý tưởng mới. của riêng tôi.
Thảo luận
Trong lĩnh vực Khoa học Dữ liệu, thường bạn có thể đưa ra nhiều nghi ngờ liên quan đến các khái niệm nhất định hoặc bất kỳ truy vấn nào liên quan đến thực thi, vì diễn đàn thảo luận về những nghi ngờ đó là nơi cần có. Bạn có thể đăng những nghi ngờ của mình, tìm hiểu hoặc trả lời những nghi ngờ của người khác mà bạn có thể không có. Mọi người sẽ chú ý đến bạn khi bạn đặt ra nhiều nghi ngờ hơn hoặc giải quyết những nghi ngờ theo thời gian.
Bất cứ khi nào bạn thực hiện một số hoạt động trong bất kỳ danh mục nào trong bốn danh mục, những người khác có thể ủng hộ (hoặc thích) công việc của bạn. Bạn nhận được huy chương bất cứ khi nào tác phẩm của bạn vượt qua một số Lượt ủng hộ nhất định. Có ba loại huy chương khác nhau: Đồng, Bạc và Vàng.
Ví dụ: nếu bạn đã tạo một sổ ghi chép mới, những người khác có thể xem sổ ghi chép của bạn và tán thành nếu họ thấy nó hữu ích. Đối với tập vở, điều kiện để được huy chương đồng là phải có 5 lượt bình chọn, 20 lượt bình chọn cho hạng bạc và 50 lượt bình chọn cho hạng vàng, và con số này khác nhau đối với từng hạng mục. Khi bạn nhận được nhiều huy chương hơn, bạn thăng tiến từ cấp này sang cấp khác. Bạn có thể tham khảo hệ thống tính lũy tiến tại đây .
Bất cứ khi nào bạn đăng ký Kaggle, bạn được coi là Người mới cho cả bốn loại. Có một số nhiệm vụ và thông tin mà bạn cần hoàn thành để trở thành cộng tác viên. Sau đó, cuộc vui thực sự bắt đầu. Bạn chỉ nhận được thứ hạng trong các hạng mục tương ứng khi bạn trở thành một chuyên gia. Giả sử bạn muốn đạt được cấp bậc thầy cho Máy tính xách tay, trước tiên, bạn cần ít nhất 5 huy chương để trở thành chuyên gia (ở giai đoạn này, bạn sẽ được xếp hạng cho hạng mục máy tính xách tay), sau đó nếu bạn đạt được tổng cộng 10 huy chương bạc, bạn sẽ trở thành Bậc thầy về Notebooks! Càng nhiều phiếu bầu bạn nhận được tốt hơn sẽ là thứ hạng của bạn. Tương tự như vậy, có các tiêu chí khác nhau cho mỗi danh mục.
Không sao để trở nên choáng ngợp
Tất cả những điều này có thể trông quá choáng ngợp, và thành thật mà nói, tôi không thể bắt đầu hành trình Kaggle của mình sau khi đọc về Kaggle. Tôi tự hỏi liệu mình có đủ tốt với nền tảng này hay không, liệu mọi người có thích công việc của tôi không, và điều gì không!
Nhưng tin tôi đi, đó chỉ là việc tạo ra cuốn sổ ghi chép đầu tiên đó, hỏi hoặc có thể giải quyết một nghi ngờ trong diễn đàn thảo luận. Sau đó, bạn sẽ sớm nhận ra sự chào đón của mọi người trên Kaggle, bạn sẽ khám phá ra các cách tiếp cận mới để xử lý tập dữ liệu hoặc có thể học một thuật toán ML mới! Khả năng là vô tận.
Điểm để thành công
Sau đây là một số yếu tố mà bạn có thể ghi nhớ trong hành trình Kaggle của mình:
Đừng chỉ làm bất cứ điều gì vì lợi ích của việc nhận được huy chương
Rất nhiều người làm sổ tay chỉ vì mục đích lấy huy chương mà không quan tâm đến chất lượng bài làm của mình. Hãy nhớ rằng bất kỳ sổ ghi chép nào bạn làm trên Kaggle đều có thể được sử dụng để thể hiện kỹ năng của bạn trong một cuộc phỏng vấn kỹ thuật, nếu chất lượng của bạn xuất sắc và thể hiện được tiềm năng thực sự của bạn, nhà tuyển dụng cũng có thể bị ấn tượng. Cộng với chất lượng công việc tốt hơn, cơ hội nhận được sự ủng hộ sẽ tăng lên.
Kiên nhẫn
Nhiều khi bạn công khai sổ ghi chép của mình, bạn có thể không nhận được lượt bình chọn ngay lập tức, điều này không có nghĩa là công việc của bạn không tốt nên đừng mất tự tin. Cuối cùng bạn sẽ nhận được sự ủng hộ khi kết thúc nếu công việc của bạn tốt. Bạn cũng có thể quảng cáo sổ ghi chép của mình trên các Nền tảng truyền thông xã hội như Linkedin, Twitter để nhiều người có thể xem tác phẩm của bạn.
Đánh dấu các tác phẩm thú vị và tuyệt vời
Bất cứ khi nào bạn bắt gặp một cuốn sổ ghi chép tuyệt vời hoặc một cuộc thảo luận thú vị, hãy đánh dấu chúng để sử dụng khái niệm đó trong công việc sau này của bạn (đừng quên ghi công cho người sáng tạo ban đầu). Ví dụ: tôi bắt gặp một đoạn mã nhúng ảnh của các cầu thủ bóng đá vào biểu đồ thanh cốt truyện cho mục đích hình dung, tôi chưa bao giờ tưởng tượng điều đó cũng có thể xảy ra, vì vậy tôi ngay lập tức đánh dấu nó và sẽ sử dụng nó bất cứ khi nào có cơ hội.
Tương tác nhiều nhất có thể
Bất cứ khi nào bạn đang đọc một cuốn sổ ghi chép nào đó hoặc tham gia bất kỳ cuộc thi nào, hãy tương tác với các Kaggler khác, có một số lợi ích cho điều này: thứ nhất, mọi người có thể xem hồ sơ của bạn nếu bạn thể hiện sự đánh giá cao đối với công việc của họ, thứ hai, bạn sẽ rất tốt. được biết đến trong cộng đồng (điều này không xảy ra trong ngày). Bất cứ khi nào bạn xem hồ sơ Kaggle của một người, hãy đảm bảo kết nối với họ trên Linkedin hoặc Github hoặc Twitter, vì họ có thể giúp bạn trong lúc cần thiết.
Giải thích công việc của bạn
Việc viết ra các nhận xét cho từng bước bạn đang thực hiện hoặc lý do thực hiện bước đó luôn luôn tốt. Giả sử rằng bạn đã vẽ một biểu đồ phân tán cho mục đích hình dung, bạn có thể viết ra suy luận từ biểu đồ đó để những người khác cũng có thể hiểu được quá trình suy nghĩ của bạn. Viết vở hay không kém gì viết chân dung một câu chuyện.
Thành công ở Kaggle không phải là công việc của một ngày là xong, nó phụ thuộc vào cách bạn muốn tạo ra lợi ích tối đa từ nó. Một lời khuyên mà tôi đưa ra là hãy thiết lập các mục tiêu ngắn hạn, ví dụ như khi tôi bắt đầu, mục tiêu đầu tiên của tôi là trở thành một chuyên gia thảo luận, khi đã đạt được mục tiêu đó, tôi muốn trở thành một chuyên gia về máy tính xách tay. Sau khi trở thành một chuyên gia, tôi đặt mục tiêu trở thành Kaggle Notebooks Master. Mục tiêu tiếp theo của tôi là tham gia các cuộc thi. Vì vậy, tôi luôn được hưởng lợi khi đặt ra các mục tiêu ngắn hạn và không bao giờ bị choáng ngợp hay sợ hãi vì Kaggle.
Hãy kết nối với tôi trên Linkedin , Github hoặc Twitter .
Hy vọng bạn có thể lấy cảm hứng từ bài viết này và bắt đầu với hành trình Kaggle của bạn. Dưới đây là một số bộ dữ liệu hoặc cuộc thi mà bạn có thể thử làm: