5 Kick-Ass-Data-Science-Projekte

Dec 13 2022
Seien Sie der 10x Data Scientist, nach dem alle suchen, oder haben Sie einfach ein äußerst wirkungsvolles Data Science-Portfolio. Heute sehen wir uns 5 fantastische Projekte an, an denen Sie arbeiten können, sowohl im Hinblick darauf, praktische und nützliche Erfahrungen für eine berufliche Karriere zu sammeln, als auch Ihren Geist und Horizont zu erweitern und Ihre Augen für die neuesten Technologien und zukünftigen Möglichkeiten zu öffnen.

Seien Sie der 10x Data Scientist, nach dem alle suchen, oder haben Sie einfach ein äußerst wirkungsvolles Data Science-Portfolio.

Heute sehen wir uns 5 fantastische Projekte an, an denen Sie arbeiten können, sowohl im Hinblick darauf, praktische und nützliche Erfahrungen für eine berufliche Karriere zu sammeln, als auch Ihren Geist und Horizont zu erweitern und Ihre Augen für die neuesten Technologien und zukünftigen Möglichkeiten zu öffnen.

Egal, ob Sie Data Scientist, Junior-Entwickler oder einfach nur ein leidenschaftlicher Hobby-Programmierer sind, der gerne in Datenanalyse und Engineering eintaucht, es gibt eine Reihe von Projekten, die dazu beitragen können, Ihr Data-Science-Portfolio von den vielen anderen abzuheben.

Diese Projekte eignen sich hervorragend für jedes Data-Science-Portfolio. Wenn Sie sich fragen, wie Sie ein großartiges Data-Science-Portfolio aufbauen können, entmystifiziere ich den Prozess in diesem Artikel:

Das Killer-Data-Science-Portfolio, mit dem Sie eingestellt werden

Follow me for 5 more kick ass projects next week! 
You can also hit the message icon to get notified when I publish it.

1. Fake News erkennen

Ein nach wie vor stark diskutiertes Thema ist die Wirkung von Fake News, Deepfake-Videos und anderen ähnlich manipulierten Inhalten auf unsere Gesellschaft. Wie dieser Artikel von Eliza Shoemaker zu dem Schluss kommt, ist es unmöglich, die Erstellung gefälschter Nachrichten zu verhindern, aber es ist möglich, sie zu entdecken.

Typischerweise umfassen diese Projekte auch die Verwendung von Entscheidungsbäumen, NLP-, Stoppwort-, TFIDF-, PoS- und VADER-Algorithmen zum Erkennen und Erkennen verschiedener Formen von Inhalten. Dies kann in vielen anderen Bereichen nützlich sein, z. B. bei der Übersetzung und Generierung von KI-Inhalten sowie bei der Spracherkennung usw.

Sie sollten sich auch diese öffentlichen Projekte ansehen, um sich inspirieren zu lassen, wie sie es gemacht haben.

Was ich an diesem Projekt liebe, ist, wie gut sie ihre Logik und ihren Datenfluss erklärt haben.

2. KI-gestützter intelligenter Chatbot

Ein weiteres gemeinsames Projekt für neue Data Scientists ist der sogenannte Chatbot. Diese Projekte beinhalten normalerweise die Verwendung der Verarbeitung natürlicher Sprache, können aber auch unter Verwendung von NLU- und NLG-Funktionen sowie Methoden zum Abgleichen von Mustern erstellt werden.

Indem Sie Ihren eigenen Chatbot von Grund auf neu erstellen, können Sie potenziellen Arbeitgebern zeigen, dass Sie sich mit der NLTK-Bibliothek von Python auskennen, die in der Berufswelt für eine Vielzahl von Zwecken verwendet wird. Außerdem haben Sie die Möglichkeit zu zeigen, wie Sie Datenszenarien verarbeiten, testen und trainieren.

Hier ist ein einfaches, gut geschriebenes und leicht verständliches Projekt, das Sie nachahmen und daraus lernen könnten. Stellen Sie beim Durcharbeiten sicher, dass Sie Ihre eigenen Optimierungen hinzufügen (sowohl Codequalität als auch Logik).

3. Stimmungsanalyse

Dieses Projekt ist eine weitere beliebte Wahl für viele Studenten und Fachleute auf der ganzen Welt und wird in vielen Branchen eingesetzt. Wenn Sie sich für die Börse interessieren, können Sie Ihr Projekt auf eine Handvoll Börsenticker konzentrieren und dann das Internet nach Stimmungen durchsuchen, um herauszufinden, wie beliebt ein bestimmtes Unternehmen ist.

Die Stimmungsanalyse kann auch verwendet werden, um sich Produktbewertungen anzusehen, um sich von den typischen 1- bis 5-Sterne-Bewertungen zu entfernen und sich stattdessen auf die spezifischen Details jeder Bewertung zu konzentrieren. Diese Projekte beinhalten typischerweise die Verwendung von Datensätzen oder Web Scraping, aber auch Extraktionsmuster, NLP und Datenstrukturen sind Methoden, die Sie erkunden können.

Hier sind zwei Projekte, die mir gefallen, besonders weil sie die Grundlagen so gut erklärt und darauf aufgebaut haben.

@ betinacosta 's Hands-on Sentiment Analysis Tutorial ist ein großartiges Projekt, das Ihnen praktische Erfahrungen mit dem Abrufen der Daten aus einer realen Anwendung (Twitter) und der Durchführung von Analysen vermittelt, während Sie lernen.

4. Bildklassifizierung

Der Aufstieg des maschinellen Lernens hat der KI die Fähigkeit gebracht, menschliche Gesichter in einem Bild zu erkennen, alle roten Objekte in einem Gemälde zu klassifizieren und vieles mehr. Während es in der Berufswelt viele Bewerbungen für diese Art von Projekten gibt, ist es auch ein großes persönliches Unterfangen.

Hier lernen Sie, Deep-Learning-Modelle zu trainieren, und können je nach Projekt Bibliotheken wie TensorFlow, MATLAB oder RapidMiner verwenden, um Ihre Ergebnisse weiter zu verbessern und Ihre Fähigkeiten zu verbessern.

Dies ist ein ziemlich weitläufiges Gebiet und die meisten Online-Projekte verwenden GPUs. Seien wir ehrlich, nur wenige von uns haben Zugriff auf eine GPU oder wollen $ für Cloud-VMs ausgeben. Daher werde ich mein Bestes tun, um Projekte einzubeziehen, die einfach zu verfolgen sind und keine GPU erfordern:

Dies ist ein Tutorial oder eine praktische Anleitung, die die Logik in fast einfachem Englisch erklärt:

5. Datenarchitektur

Unternehmen brauchen Data Scientists, um die riesigen Datenmengen ihrer Kunden, ihrer Produkte und ihrer Geschäftspartner richtig zu strukturieren und zu kategorisieren. All diese Daten müssen rund um die Uhr zugänglich sein und gleichzeitig sicher in einer kostenoptimierten und/oder leistungsoptimierten Architektur gespeichert werden.

Ich weiß, es klingt nach VIEL. Aber für ein Portfolio (und für Ihre Erfahrung) müssen Sie nur zeigen, dass Sie gerne mit Datenbanken arbeiten, Daten bereinigen und sie in die richtigen Typen formatieren usw.

Ich habe hier eine Liste der besten 25 öffentlichen Datensätze zusammengestellt , die Sie verwenden können, um einen Datensatz zu finden, der perfekt zu einem Datenarchitekturprojekt passt.

Bonus: 5 weitere Kick-Ass-Projekte!

Es braucht Zeit, um Ihnen gute Inhalte zu liefern! Folgen Sie mir also für die nächste Folge von 5 weiteren Kick-Ass-Projekten, die Folgendes abdecken:

  • Betrugserkennung und -prävention
  • Vorhersage der Kundenpräferenzen
  • Datenerfassung (Web Scraping & mehr)
  • Analyse von Erkrankungen
  • Wie man wild wird und ein paar Projekte kombiniert :)

Wie immer liebe ich es, hilfreiche Inhalte für Praktiker der Datenwissenschaft zu erstellen, und würde mich freuen, von Ihnen zu hören – positiv oder negativ! Sie können auch Themen vorschlagen, über die Sie gerne etwas hören möchten.

LinkedIn :https://www.linkedin.com/in/vasinha