Del proyecto Kaggle a la pasantía en ciencia de datos: Desbloqueo de oportunidades en ciencia de datos
Escribo mi primer artículo aquí sobre medium y pienso en un tema relacionado con mi viaje en la ciencia de datos. Así que pensé que nada podría ser mejor que compartir mi experiencia de obtener una pasantía en ciencia de datos. Entonces, si está interesado en la ciencia de datos y se pregunta cómo ingresar a la industria, creo que este artículo puede ser un paso inicial para usted.
Entonces, mientras aprendía NLP (procesamiento del lenguaje natural), comencé a buscar ideas de proyectos y la idea de filtrar el correo no deseado de nuestra bandeja de entrada de correo electrónico realmente me intrigó para profundizar en esto. Así que creé el flujo de trabajo del proyecto, busqué proyectos similares en plataformas de código abierto y comencé a escribir código en mi cuaderno jupyter. Me tomó 10 días terminar el proyecto con la cantidad de veces que solo quería dejar este proyecto a mitad de camino o muchas veces después de luchar durante horas para identificar el problema con mi código, un extraño en StackOverflow terminó siendo mi salvador y me ayudó a entender lo que estaba causando el problema.
No hablaré mucho sobre los tecnicismos de mi proyecto, sino más sobre cómo presentarlo en una entrevista, ya que puedes proyectar ideas y códigos mucho mejores en Internet que este (compartiré el enlace de kaggle de mi proyecto al final de este artículo ). Entonces, comenzar con el primer y más importante factor que convirtió la entrevista en mi lado es la demostración de trabajo de mi proyecto. Mientras explicaba mi proyecto después de dar un breve resumen, le pedí a la entrevista que me diera su opinión sobre un mensaje de spam y uno que no es spam. para la demostración en vivo que dio y mi proyecto mostró un resultado correcto por el cual quedó realmente impresionado y luego comencé a explicar mi motivación para el proyecto, la lógica detrás del código, los resultados (puntuación_de precisión del 97% y puntuación_de precisión del 100%) y terminé con problemas a los que me enfrenté en este proyecto y cómo los resolví.

Otro factor que me ayudó es explicar mi EDA (análisis exploratorio de datos) con algunas visualizaciones y, sinceramente, es más fácil explicar las imágenes que el código. Compartimos algunos de ellos aquí para que puedas echar un vistazo.


Como expliqué al principio, también la demostración en vivo del proyecto resulta ser la mejor cuando el entrevistador puede interactuar con su proyecto. Aquí hay un vistazo de la demostración en vivo de mi proyecto que hice usando streamlit siguiendo un tutorial en youtube:
Espero que les guste este artículo y, como prometí, aquí está el enlace del proyecto kaggle.
https://www.kaggle.com/code/akshatrailaddha/sms-spam-classification-nlp-project
vota a favor si estás en kaggle. Nada técnico, solo pequeños fragmentos de mi experiencia en la entrevista. Comparta sus comentarios.
¡¡¡Gracias!!!