5 projektów z zakresu Data Science
Zostań 10-krotnym Data Scientist, którego wszyscy szukają, lub po prostu posiadaj bardzo wpływowe portfolio Data Science.
Dziś przyglądamy się 5 fantastycznym projektom do pracy, zarówno pod kątem zdobycia praktycznego i przydatnego doświadczenia w karierze zawodowej, jak i poszerzenia umysłu i horyzontów oraz otwarcia oczu na najnowsze technologie i przyszłe możliwości.
Niezależnie od tego, czy jesteś naukowcem zajmującym się danymi, młodszym programistą, czy po prostu zapalonym programistą-hobbystą, który uwielbia zagłębiać się w analizę i inżynierię danych, istnieje pewien zestaw projektów, które mogą pomóc wyróżnić Twoje portfolio nauki o danych na tle wielu innych.
Te projekty doskonale nadają się do każdego portfolio nauki o danych. Jeśli zastanawiasz się, w jaki sposób możesz zbudować niesamowite portfolio analityki danych, wyjaśniam ten proces w tym artykule:
Portfolio Killer Data Science, które zapewni Ci zatrudnienieFollow me for 5 more kick ass projects next week!
You can also hit the message icon to get notified when I publish it.
1. Wykrywanie fałszywych wiadomości
Jednym z tematów, który nadal jest szeroko dyskutowany, jest wpływ fałszywych wiadomości, filmów deepfake i innych podobnie zmanipulowanych treści na nasze społeczeństwo. Jak podsumowuje ten artykuł Elizy Shoemaker, niemożliwe jest powstrzymanie tworzenia fałszywych wiadomości, ale ich wykrycie jest możliwe.
Zazwyczaj projekty te obejmują również wykorzystanie algorytmów drzew decyzyjnych, NLP, Stop Word, TFIDF, PoS i VADER do wykrywania i rozpoznawania różnych form treści. Może to być przydatne w wielu innych dziedzinach, takich jak tłumaczenie i generowanie treści AI, a także rozpoznawanie głosu itp.
Powinieneś również sprawdzić te publiczne projekty, aby uzyskać inspirację, jak to zrobili.
W tym projekcie podoba mi się to, jak dobrze wyjaśnili swoją logikę i przepływ danych.
2. Inteligentny chatbot oparty na sztucznej inteligencji
Innym częstym projektem dla nowych analityków danych jest tzw. Chatbot. Projekty te zwykle wykorzystują przetwarzanie języka naturalnego, ale można je również budować przy użyciu funkcji NLU i NLG, a także metod dopasowywania wzorców.
Budując od podstaw własnego Chatbota, możesz pokazać potencjalnym pracodawcom, że znasz się na bibliotece NLTK Pythona, która jest często wykorzystywana do wielu celów w świecie zawodowym. Otrzymasz również szansę zaprezentowania, w jaki sposób przetwarzasz, testujesz i trenujesz scenariusze danych.
Oto prosty, dobrze napisany i łatwy do zrozumienia projekt, który możesz spróbować powielić i uczyć się z niego. Pracując nad tym, pamiętaj o dodaniu własnych optymalizacji (zarówno jakości kodu, jak i logiki).
3. Analiza nastrojów
Ten projekt jest kolejnym popularnym wyborem dla wielu studentów i profesjonalistów na całym świecie i jest używany w wielu sektorach. Jeśli interesujesz się giełdą, możesz skoncentrować swój projekt wokół kilku pasków giełdowych, a następnie zeskrobać sieć w poszukiwaniu nastrojów, aby dowiedzieć się, jak bardzo dana firma jest lubiana.
Analizę nastrojów można również wykorzystać do przyjrzenia się recenzjom produktów, aby odejść od typowych recenzji z 1–5 gwiazdkami i zamiast tego skupić się na konkretnych szczegółach każdej recenzji. Projekty te zazwyczaj obejmują wykorzystanie zestawów danych lub skrobanie sieci, ale także wzorce ekstrakcji, NLP i struktury danych to metody, które możesz zbadać.
Oto dwa projekty, które lubię, szczególnie dlatego, że dobrze wyjaśniły podstawy i na nich zbudowały.
@ betinacosta 's Hands-on Sentiment Analysis Tutorial to niesamowity projekt, który zapewnia praktyczne doświadczenie w uzyskiwaniu danych z rzeczywistej aplikacji (Twitter) i przeprowadzaniu analiz w trakcie nauki.
4. Klasyfikacja obrazu
Rozwój uczenia maszynowego przyniósł ze sztuczną inteligencją możliwość wykrywania ludzkich twarzy na obrazie, klasyfikowania wszystkich czerwonych obiektów na obrazie i nie tylko. Chociaż w świecie zawodowym istnieje wiele zastosowań tego typu projektów, jest to również wielkie osobiste przedsięwzięcie.
Tutaj nauczysz się trenować modele głębokiego uczenia się i, w zależności od projektu, możesz korzystać z bibliotek takich jak TensorFlow, MATLAB lub RapidMiner, aby jeszcze bardziej poprawić swoje wyniki i doskonalić swoje umiejętności.
Jest to dość rozległy obszar, a większość projektów online korzysta z procesorów graficznych. Bądźmy szczerzy, tylko nieliczni z nas mają dostęp do GPU lub chcą wydać $ na maszyny wirtualne w chmurze. Zrobię więc co w mojej mocy, aby uwzględnić projekty, które są łatwe do naśladowania i nie wymagają GPU:
Ten jest samouczkiem lub praktycznym przewodnikiem, który wyjaśnia logikę w prawie prostym języku angielskim:
5. Architektura danych
Firmy potrzebują analityków danych, aby odpowiednio ustrukturyzować i sklasyfikować ogromne ilości danych od swoich klientów, ich produktów i partnerów biznesowych. Wszystkie te dane muszą być dostępne przez całą dobę, a jednocześnie bezpiecznie przechowywane w zoptymalizowanej pod względem kosztów i/lub wydajności architekturze.
Wiem, to brzmi jak DUŻO. Ale jeśli chodzi o portfolio (i doświadczenie), wszystko, co musisz pokazać, to zamiłowanie do pracy z bazami danych, czyszczenia danych i formatowania ich do odpowiednich typów itp.
Przygotowałem tutaj listę 25 najlepszych publicznych zestawów danych , których możesz użyć do znalezienia zestawu danych, który idealnie pasowałby do projektu architektury danych.
Bonus: 5 kolejnych zajebistych projektów!
Dostarczenie dobrych treści wymaga czasu! Więc śledź mnie w następnej odsłonie 5 kolejnych niesamowitych projektów, które obejmują:
- Wykrywanie oszustw i zapobieganie im
- Przewidywanie preferencji klienta
- Gromadzenie danych (Web Scraping i więcej)
- Analiza Uwarunkowań Medycznych
- Jak zaszaleć i połączyć kilka projektów :)
Jak zawsze uwielbiam tworzyć przydatne treści dla praktyków data science i chciałbym usłyszeć od ciebie — pozytywne lub negatywne! Możesz również zaproponować tematy, o których chciałbyś usłyszeć.
LinkedIn :https://www.linkedin.com/in/vasinha

![Czym w ogóle jest lista połączona? [Część 1]](https://post.nghiatu.com/assets/images/m/max/724/1*Xokk6XOjWyIGCBujkJsCzQ.jpeg)



































