จากโครงการ Kaggle สู่การฝึกงานด้านวิทยาศาสตร์ข้อมูล: ปลดล็อกโอกาสด้านวิทยาศาสตร์ข้อมูล
เขียนบทความแรกของฉันที่นี่บนสื่อกลาง และคิดหัวข้อที่เกี่ยวข้องกับการเดินทางของฉันในวิทยาศาสตร์ข้อมูล ดังนั้นฉันคิดว่าไม่มีอะไรจะดีไปกว่าการแบ่งปันประสบการณ์ของฉันในการฝึกงานด้าน Data Science ดังนั้นหากคุณสนใจด้านวิทยาศาสตร์ข้อมูลและสงสัยว่าจะก้าวเข้าสู่อุตสาหกรรมนี้ได้อย่างไร ฉันเชื่อว่าบทความนี้จะเป็นก้าวเริ่มต้นสำหรับคุณ
ดังนั้นในขณะที่เรียนรู้ NLP (การประมวลผลภาษาธรรมชาติ) ฉันเริ่มค้นหาแนวคิดโครงการและแนวคิดเรื่องการกรองสแปมในกล่องจดหมายอีเมลของเราทำให้ฉันสนใจที่จะเจาะลึกลงไป ฉันจึงสร้างเวิร์กโฟลว์โครงการ ตรวจสอบโครงการที่คล้ายกันบนแพลตฟอร์มโอเพ่นซอร์ส และเริ่มเขียนโค้ดในสมุดบันทึก jupyter ของฉัน ฉันใช้เวลา 10 วันในการทำโปรเจกต์ให้เสร็จ ซึ่งหลายครั้งฉันแค่อยากจะทิ้งโปรเจกต์นี้กลางคันหรือหลายๆ ครั้งหลังจากดิ้นรนหาปัญหากับโค้ดของฉันมาหลายชั่วโมง คนแปลกหน้าใน StackOverflow ลงเอยด้วยการเป็นผู้ช่วยชีวิตฉันและช่วยให้ฉันเข้าใจ อะไรเป็นสาเหตุของปัญหา
ฉันจะไม่พูดถึงด้านเทคนิคของโครงการของฉันมากนัก แต่จะพูดถึงวิธีการนำเสนอในการสัมภาษณ์ เนื่องจากคุณสามารถเสนอแนวคิดและรหัสโครงการบนอินเทอร์เน็ตได้ดีกว่าอันนี้มาก (ฉันจะแบ่งปันลิงก์ kaggle โครงการของฉันที่ส่วนท้ายของบทความนี้ ). ดังนั้น เริ่มจากปัจจัยแรกและสำคัญที่สุดที่ทำให้การสัมภาษณ์เป็นฝ่ายฉัน คือการสาธิตการทำงานของโปรเจกต์ของฉัน ในขณะที่อธิบายโปรเจกต์ของฉันหลังจากให้ข้อมูลสั้นๆ สั้นๆ ฉันขอให้ผู้สัมภาษณ์ให้ข้อมูลจากฝั่งของเขาสำหรับข้อความสแปม 1 ข้อความและข้อความที่ไม่ใช่สแปม 1 ข้อความ สำหรับการสาธิตสดที่เขามอบให้และโครงการของฉันแสดงผลลัพธ์ที่ถูกต้องซึ่งเขาประทับใจมาก จากนั้นฉันก็เริ่มอธิบายแรงจูงใจของฉันสำหรับโครงการ ตรรกะเบื้องหลังโค้ด ผลลัพธ์ (คะแนนความแม่นยำ 97% และคะแนนความแม่นยำ 100%) และจบลงด้วยปัญหา ฉันเผชิญในโครงการนี้และฉันจะแก้ไขได้อย่างไร

อีกปัจจัยหนึ่งที่ช่วยฉันได้คือการอธิบาย EDA (การวิเคราะห์ข้อมูลเชิงสำรวจ) ของฉันด้วยการสร้างภาพข้อมูล และความจริงแล้วฉันว่ามันง่ายกว่าการอธิบายรูปภาพมากกว่าโค้ด แบ่งปันบางส่วนที่นี่เพื่อให้คุณได้เห็น


ดังที่ฉันได้อธิบายไว้ในตอนต้นว่าการสาธิตโครงการแบบสดจะดีที่สุดเมื่อผู้สัมภาษณ์สามารถโต้ตอบกับโครงการของคุณได้ นี่คือภาพรวมของการสาธิตสดของโปรเจ็กต์ที่ฉันสร้างโดยใช้ streamlit โดยทำตามบทช่วยสอนบน youtube:
หวังว่าคุณจะชอบบทความนี้และนี่คือลิงค์โครงการ kaggle
https://www.kaggle.com/code/akshatrailaddha/sms-spam-classification-nlp-project
โหวตถ้าคุณอยู่ใน kaggle ไม่มีอะไรทางเทคนิคเพียงเล็กน้อยจากประสบการณ์การสัมภาษณ์ของฉัน แบ่งปันความคิดเห็นของคุณ
ขอบคุณ!!!