5 Proyek Ilmu Data Kick Ass

Dec 13 2022
Jadilah 10x Ilmuwan Data yang dicari semua orang atau sekadar memiliki portofolio Ilmu Data yang berdampak besar. Hari ini kami melihat 5 proyek fantastis untuk dikerjakan, baik dalam hal mendapatkan pengalaman praktis dan berguna untuk karir profesional, serta memperluas pikiran dan wawasan Anda, serta membuka mata Anda untuk teknologi terbaru dan kemungkinan masa depan.

Jadilah 10x Ilmuwan Data yang dicari semua orang atau sekadar memiliki portofolio Ilmu Data yang berdampak besar.

Hari ini kami melihat 5 proyek fantastis untuk dikerjakan, baik dalam hal mendapatkan pengalaman praktis dan berguna untuk karir profesional, serta memperluas pikiran dan wawasan Anda, serta membuka mata Anda untuk teknologi terbaru dan kemungkinan masa depan.

Apakah Anda seorang ilmuwan data, pengembang junior, atau hanya pemrogram hobi yang bersemangat yang suka mendalami analisis dan rekayasa data, ada serangkaian proyek tertentu yang dapat membantu membedakan portofolio ilmu data Anda dari banyak proyek lainnya.

Proyek ini bagus untuk portofolio ilmu data apa pun. Jika Anda bertanya-tanya bagaimana Anda bisa membangun portofolio ilmu data yang mengagumkan, saya jelaskan prosesnya dalam artikel ini:

Portofolio Ilmu Data Pembunuh yang Membuat Anda Dipekerjakan

Follow me for 5 more kick ass projects next week! 
You can also hit the message icon to get notified when I publish it.

1. Mendeteksi Berita Palsu

Salah satu topik yang terus diperdebatkan adalah efek berita palsu, video deepfake, dan konten manipulasi serupa lainnya terhadap masyarakat kita. Seperti yang disimpulkan oleh makalah oleh Eliza Shoemaker ini, tidak mungkin untuk menghentikan pembuatan berita palsu, tetapi mendeteksinya adalah mungkin.

Biasanya proyek-proyek ini juga mencakup penggunaan algoritma pohon keputusan, NLP, Stop Word, TFIDF, PoS dan VADER untuk mendeteksi dan mengenali berbagai bentuk konten. Ini dapat berguna di banyak bidang lain, seperti terjemahan dan pembuatan konten AI, serta pengenalan suara, dll.

Anda juga harus melihat proyek publik ini untuk mendapatkan inspirasi tentang bagaimana mereka melakukannya.

Yang saya sukai dari proyek ini adalah seberapa baik mereka menjelaskan logika dan aliran data mereka.

2. Chatbot Cerdas Bertenaga AI

Proyek umum lainnya untuk ilmuwan data baru adalah apa yang disebut Chatbot. Proyek-proyek ini biasanya mencakup penggunaan pemrosesan bahasa alami, tetapi juga dapat dibangun menggunakan fitur NLU dan NLG, serta metode untuk mencocokkan pola.

Dengan membangun Chatbot Anda sendiri dari awal, Anda dapat menunjukkan kepada calon pemberi kerja bahwa Anda mengetahui cara menggunakan pustaka NLTK Python, yang sangat digunakan untuk banyak tujuan di dunia profesional. Dan Anda juga akan mendapatkan kesempatan untuk menunjukkan bagaimana Anda memproses, menguji, dan melatih skenario data.

Ini adalah proyek sederhana, ditulis dengan baik, dan mudah dipahami yang dapat Anda coba tiru dan pelajari. Saat Anda mengerjakannya, pastikan untuk menambahkan pengoptimalan Anda sendiri (kualitas kode dan logika).

3. Analisis Sentimen

Proyek ini adalah pilihan populer lainnya bagi banyak pelajar dan profesional di seluruh dunia, dan digunakan di banyak sektor. Jika Anda tertarik dengan pasar saham, Anda dapat memfokuskan proyek Anda di sekitar beberapa ticker saham, lalu mengorek web untuk mencari sentimen, untuk mengetahui seberapa disukai perusahaan tertentu.

Analisis sentimen juga dapat digunakan untuk melihat ulasan produk, untuk menjauh dari ulasan tipikal 1–5 bintang, dan sebagai gantinya fokus pada detail spesifik dari setiap ulasan. Proyek-proyek ini biasanya mencakup penggunaan kumpulan data atau pengikisan web, tetapi juga pola ekstraksi, NLP, dan struktur data adalah metode yang dapat Anda jelajahi.

Berikut adalah dua proyek yang saya sukai, khususnya karena seberapa baik mereka menjelaskan dasar-dasarnya dan membangunnya.

Tutorial Analisis Sentimen Praktis @ betinacosta adalah proyek luar biasa yang memberi Anda pengalaman langsung mendapatkan data dari aplikasi dunia nyata (Twitter) dan melakukan analisis saat Anda belajar.

4. Klasifikasi gambar

Munculnya pembelajaran mesin telah membawa serta kemampuan AI untuk mendeteksi wajah manusia dalam sebuah gambar, mengklasifikasikan semua objek merah dalam sebuah lukisan dan banyak lagi. Meskipun ada banyak aplikasi di dunia profesional untuk jenis proyek ini, ini juga merupakan upaya pribadi yang hebat untuk dikejar.

Di sini Anda akan belajar melatih model pembelajaran mendalam, dan bergantung pada proyek Anda, Anda dapat menggunakan pustaka seperti TensorFlow, MATLAB, atau RapidMiner untuk lebih menyempurnakan hasil dan mengasah keterampilan Anda.

Ini adalah area yang cukup luas dan sebagian besar proyek online menggunakan GPU. Jujur saja, hanya sedikit dari kita yang memiliki akses ke GPU atau ingin membelanjakan $ untuk VM cloud. Jadi, saya akan melakukan yang terbaik untuk menyertakan proyek yang mudah diikuti dan tidak memerlukan GPU:

Yang ini adalah tutorial atau panduan langsung yang menjelaskan logika dalam bahasa Inggris yang hampir sederhana:

5. Arsitektur Data

Bisnis membutuhkan ilmuwan data untuk menyusun dan mengkategorikan sejumlah besar data dengan benar dari pelanggan, produk, dan mitra bisnis mereka. Semua data ini harus dapat diakses sepanjang waktu, sementara juga disimpan dengan aman dalam arsitektur yang dioptimalkan dengan biaya dan/atau dengan kinerja yang dioptimalkan.

Aku tahu, kedengarannya seperti BANYAK. Namun, untuk portofolio (dan untuk pengalaman Anda), yang perlu Anda tunjukkan hanyalah kecintaan Anda untuk bekerja dengan basis data, membersihkan data, dan memformatnya menjadi jenis yang benar, dll.

Saya telah menyusun daftar 25 Kumpulan Data Publik Terbaik di sini yang dapat Anda gunakan untuk menemukan kumpulan data yang sangat cocok untuk proyek arsitektur data.

Bonus: 5 proyek keren lainnya!

Butuh waktu untuk membawakan Anda konten yang bagus! Jadi, ikuti saya untuk angsuran berikutnya dari 5 proyek kick ass lainnya yang mencakup:

  • Deteksi dan Pencegahan Penipuan
  • Prediksi Preferensi Pelanggan
  • Pengumpulan Data (Web Scraping & lainnya)
  • Analisis Kondisi Medis
  • Bagaimana menjadi liar dan menggabungkan beberapa proyek :)

Seperti biasa, saya suka membuat konten yang bermanfaat untuk praktisi ilmu data dan ingin mendengar pendapat Anda — positif atau negatif! Anda juga dapat menyarankan topik yang ingin Anda dengar.

LinkedIn :https://www.linkedin.com/in/vasinha