5 progetti di data science incredibili
Sii il 10x Data Scientist che tutti cercano o semplicemente hai un portfolio di Data Science di grande impatto.
Oggi stiamo esaminando 5 fantastici progetti su cui lavorare, sia in termini di acquisizione di esperienza pratica e utile per una carriera professionale, sia per ampliare la tua mente e i tuoi orizzonti e aprire gli occhi per le nuove tecnologie e le possibilità future.
Che tu sia un data scientist, uno sviluppatore junior o solo un appassionato programmatore per hobby che ama immergersi nell'analisi e nell'ingegneria dei dati, esiste un certo insieme di progetti che possono aiutarti a distinguere il tuo portfolio di data science da molti altri.
Questi progetti sono ottimi per qualsiasi portfolio di data science. Se ti stai chiedendo come creare un fantastico portfolio di data science, demistifico il processo in questo articolo:
Il portafoglio di scienza dei dati killer che ti fa assumereFollow me for 5 more kick ass projects next week!
You can also hit the message icon to get notified when I publish it.
1. Rilevamento di notizie false
Un argomento che continua a essere molto dibattuto è l'effetto che notizie false, video deepfake e altri contenuti manipolati in modo simile hanno sulla nostra società. Come conclude questo articolo di Eliza Shoemaker, è impossibile impedire la creazione di notizie false, ma rilevarle è possibile.
Tipicamente questi progetti includono anche l'uso di alberi decisionali, NLP, Stop Word, TFIDF, PoS e algoritmi VADER per rilevare e riconoscere diverse forme di contenuto. Questo può essere utile in molti altri campi, come la traduzione e la generazione di contenuti AI, così come il riconoscimento vocale, ecc.
Dovresti anche dare un'occhiata a questi progetti pubblici per trarre ispirazione su come l'hanno fatto.
Quello che amo di questo progetto è quanto bene hanno spiegato la loro logica e il flusso di dati.
2. Chatbot intelligente basato su AI
Un altro progetto comune per i nuovi data scientist è il cosiddetto Chatbot. Questi progetti in genere includono l'uso dell'elaborazione del linguaggio naturale, ma possono anche essere costruiti utilizzando funzionalità NLU e NLG, nonché metodi per la corrispondenza dei modelli.
Creando il tuo Chatbot da zero, puoi mostrare ai potenziali datori di lavoro che conosci la libreria NLTK di Python, che è molto utilizzata per una moltitudine di scopi nel mondo professionale. E avrai anche la possibilità di mostrare come elabori, test e ti alleni per scenari di dati.
Ecco un progetto semplice, ben scritto e di facile comprensione che potresti provare a replicare e da cui imparare. Mentre ci lavori, assicurati di aggiungere le tue ottimizzazioni (sia la qualità del codice che la logica).
3. Analisi del sentimento
Questo progetto è un'altra scelta popolare per molti studenti e professionisti in tutto il mondo ed è utilizzato in molti settori. Se sei interessato al mercato azionario, puoi concentrare il tuo progetto su una manciata di ticker di borsa, quindi raschiare il web alla ricerca di sentimenti, al fine di scoprire quanto è apprezzata una determinata azienda.
L'analisi del sentiment può essere utilizzata anche per esaminare le recensioni dei prodotti, al fine di allontanarsi dalle tipiche recensioni da 1 a 5 stelle e concentrarsi invece sui dettagli specifici di ciascuna recensione. Questi progetti in genere includono l'uso di set di dati o web scraping, ma anche modelli di estrazione, PNL e strutture di dati sono metodi che puoi esplorare.
Ecco due progetti che mi piacciono, specialmente perché hanno spiegato bene le basi e ci hanno costruito sopra.
Il tutorial pratico sull'analisi del sentimento di @ betinacosta è un fantastico progetto che ti offre l'esperienza pratica di ottenere i dati da un'applicazione del mondo reale (Twitter) e di eseguire analisi mentre impari.
4. Classificazione delle immagini
L'ascesa dell'apprendimento automatico ha portato con sé la capacità dell'IA di rilevare i volti umani in un'immagine, classificare tutti gli oggetti rossi in un dipinto e molto altro. Sebbene ci siano molte applicazioni nel mondo professionale per questo tipo di progetti, è anche un grande impegno personale da perseguire.
Qui imparerai ad addestrare modelli di deep learning e, a seconda del tuo progetto, puoi utilizzare librerie come TensorFlow, MATLAB o RapidMiner per migliorare ulteriormente i tuoi risultati e perfezionare le tue abilità.
Questa è un'area piuttosto vasta e la maggior parte dei progetti online utilizza GPU. Siamo onesti, solo pochi di noi hanno accesso a una GPU o vogliono spendere $ per macchine virtuali cloud. Quindi, farò del mio meglio per includere progetti facili da seguire e che non richiedono GPU:
Questo è un tutorial o una guida pratica che spiega la logica in un inglese quasi semplice:
5. Architettura dei dati
Le aziende hanno bisogno di data scientist per strutturare e classificare correttamente le enormi quantità di dati provenienti dai loro clienti, dai loro prodotti e dai loro partner commerciali. Tutti questi dati devono essere accessibili 24 ore su 24, ma anche archiviati in modo sicuro in un'architettura ottimizzata in termini di costi e/o prestazioni.
Lo so, sembra MOLTO. Ma, per un portfolio (e per la tua esperienza) tutto ciò che devi mostrare è il tuo amore per lavorare con i database, pulire i dati e formattarli nei tipi corretti, ecc.
Ho compilato qui un elenco dei 25 migliori set di dati pubblici che puoi utilizzare per trovare un set di dati che si adatti perfettamente a un progetto di architettura dei dati.
Bonus: altri 5 progetti incredibili!
Ci vuole tempo per portarti buoni contenuti! Quindi, seguimi per la prossima puntata di altri 5 progetti di kick ass che coprono:
- Rilevamento e prevenzione delle frodi
- Previsione delle preferenze del cliente
- Raccolta dati (Web Scraping e altro)
- Analisi delle condizioni mediche
- Come scatenarsi e combinare alcuni progetti :)
Come sempre, adoro creare contenuti utili per i professionisti della scienza dei dati e mi piacerebbe avere tue notizie, positive o negative! Puoi anche suggerire argomenti di cui vorresti sentire parlare.
Linkedin :https://www.linkedin.com/in/vasinha

![Che cos'è un elenco collegato, comunque? [Parte 1]](https://post.nghiatu.com/assets/images/m/max/724/1*Xokk6XOjWyIGCBujkJsCzQ.jpeg)



































