5 proyectos de ciencia de datos geniales
Sea el científico de datos 10x que todos buscan o simplemente tenga una cartera de ciencia de datos de gran impacto.
Hoy analizamos 5 fantásticos proyectos en los que trabajar, tanto en términos de adquirir experiencia práctica y útil para una carrera profesional, como de ampliar tu mente y horizonte, y abrir tus ojos a las nuevas tecnologías y posibilidades futuras.
Ya sea que sea un científico de datos, un desarrollador junior o simplemente un apasionado programador aficionado al que le encanta sumergirse en el análisis y la ingeniería de datos, hay un determinado conjunto de proyectos que pueden ayudarlo a diferenciar su cartera de ciencia de datos de muchos otros.
Estos proyectos son excelentes para cualquier cartera de ciencia de datos. Si se pregunta cómo puede crear una cartera de ciencia de datos increíble, desmitifico el proceso en este artículo:
El portafolio asesino de ciencia de datos que lo contrataFollow me for 5 more kick ass projects next week!
You can also hit the message icon to get notified when I publish it.
1. Detectar noticias falsas
Un tema que continúa siendo muy debatido es el efecto que tienen en nuestra sociedad las noticias falsas, los videos falsos profundos y otros contenidos manipulados de manera similar. Como concluye este artículo de Eliza Shoemaker, es imposible evitar que se creen noticias falsas, pero detectarlas es posible.
Por lo general, estos proyectos también incluyen el uso de algoritmos de árboles de decisión, NLP, Stop Word, TFIDF, PoS y VADER para detectar y reconocer diferentes formas de contenido. Esto puede ser útil en muchos otros campos, como la traducción y la generación de contenido de IA, así como el reconocimiento de voz, etc.
También debe consultar estos proyectos públicos para inspirarse sobre cómo lo han hecho.
Lo que me encanta de este proyecto es lo bien que han explicado su lógica y flujo de datos.
2. Chatbot inteligente impulsado por IA
Otro proyecto común para los nuevos científicos de datos es el llamado Chatbot. Estos proyectos suelen incluir el uso de procesamiento de lenguaje natural, pero también se pueden crear utilizando funciones de NLU y NLG, así como métodos para hacer coincidir patrones.
Al crear su propio Chatbot desde cero, puede mostrarles a los empleadores potenciales que conoce la biblioteca NLTK de Python, que se usa mucho para una multitud de propósitos en el mundo profesional. Y también tendrá la oportunidad de mostrar cómo procesa, prueba y entrena para escenarios de datos.
Aquí hay un proyecto simple, bien escrito y fácil de entender que podría intentar replicar y aprender. Mientras lo trabaja, asegúrese de agregar sus propias optimizaciones (tanto la calidad del código como la lógica).
3. Análisis de sentimiento
Este proyecto es otra opción popular para muchos estudiantes y profesionales de todo el mundo y se utiliza en muchos sectores. Si está interesado en el mercado de valores, puede enfocar su proyecto en torno a un puñado de cotizaciones bursátiles y luego raspar la web en busca de sentimientos para averiguar qué tan apreciada es una empresa determinada.
El análisis de opinión también se puede utilizar para ver reseñas de productos, a fin de alejarse de las reseñas típicas de 1 a 5 estrellas y, en cambio, centrarse en los detalles específicos de cada reseña. Estos proyectos generalmente incluyen el uso de conjuntos de datos o raspado web, pero también los patrones de extracción, el NLP y las estructuras de datos son métodos que puedes explorar.
Aquí hay dos proyectos que me gustan, especialmente por lo bien que han explicado los conceptos básicos y construido sobre ellos.
El tutorial práctico de análisis de sentimiento de @betinacosta es un proyecto increíble que le brinda experiencia práctica para obtener los datos de una aplicación del mundo real (Twitter) y realizar análisis a medida que aprende.
4. Clasificación de imágenes
El auge del aprendizaje automático ha traído consigo la capacidad de la IA para detectar rostros humanos en una imagen, clasificar todos los objetos rojos en una pintura y mucho más. Si bien hay muchas aplicaciones en el mundo profesional para este tipo de proyectos, también es un gran esfuerzo personal a seguir.
Aquí aprenderá a entrenar modelos de aprendizaje profundo y, según su proyecto, puede usar bibliotecas como TensorFlow, MATLAB o RapidMiner para mejorar aún más sus resultados y pulir sus habilidades.
Esta es un área bastante amplia y la mayoría de los proyectos en línea usan GPU. Seamos honestos, solo unos pocos de nosotros tenemos acceso a una GPU o queremos gastar $ en máquinas virtuales en la nube. Por lo tanto, haré todo lo posible para incluir proyectos que sean fáciles de seguir y que no requieran GPU:
Este es un tutorial o guía práctica que explica la lógica en un inglés casi sencillo:
5. Arquitectura de datos
Las empresas necesitan científicos de datos para estructurar y categorizar correctamente la gran cantidad de datos de sus clientes, sus productos y sus socios comerciales. Todos estos datos deben ser accesibles las 24 horas del día, al mismo tiempo que se almacenan de forma segura en una arquitectura optimizada en cuanto a costos y/o rendimiento.
Lo sé, suena como MUCHO. Pero, para una cartera (y para su experiencia), todo lo que necesita mostrar es su amor por trabajar con bases de datos, limpiar datos y formatearlos en los tipos correctos, etc.
He compilado una lista de los mejores 25 conjuntos de datos públicos aquí que puede usar para encontrar un conjunto de datos que se ajuste perfectamente a un proyecto de arquitectura de datos.
Bonificación: ¡5 proyectos increíbles más!
¡Lleva tiempo traerte buen contenido! Entonces, síganme para la próxima entrega de 5 proyectos increíbles más que cubren:
- Detección y Prevención de Fraudes
- Predicción de preferencia del cliente
- Recopilación de datos (Web Scraping y más)
- Análisis de Condiciones Médicas
- Cómo volverse loco y combinar algunos proyectos :)
Como siempre, me encanta crear contenido útil para los profesionales de la ciencia de datos y me encantaría saber de usted, ¡positivo o negativo! También puede sugerir temas sobre los que le gustaría escuchar.
LinkedIn :https://www.linkedin.com/in/vasinha

![¿Qué es una lista vinculada, de todos modos? [Parte 1]](https://post.nghiatu.com/assets/images/m/max/724/1*Xokk6XOjWyIGCBujkJsCzQ.jpeg)



































