Agile Data Science - Pendahuluan
Agile data science adalah pendekatan penggunaan ilmu data dengan metodologi agile untuk pengembangan aplikasi web. Ini berfokus pada keluaran dari proses ilmu data yang sesuai untuk mempengaruhi perubahan bagi organisasi. Ilmu data mencakup aplikasi bangunan yang mendeskripsikan proses penelitian dengan analisis, visualisasi interaktif, dan juga pembelajaran mesin yang sekarang diterapkan.
Tujuan utama dari ilmu data tangkas adalah untuk -
mendokumentasikan dan memandu analisis data penjelasan untuk menemukan dan mengikuti jalur penting menuju produk yang menarik.
Ilmu data tangkas diatur dengan serangkaian prinsip berikut -
Iterasi Berkelanjutan
Proses ini melibatkan iterasi berkelanjutan dengan pembuatan tabel, bagan, laporan, dan prediksi. Membangun model prediksi akan membutuhkan banyak iterasi dari rekayasa fitur dengan ekstraksi dan produksi wawasan.
Output Menengah
Ini adalah daftar track dari keluaran yang dihasilkan. Bahkan dikatakan bahwa percobaan yang gagal juga memiliki keluaran. Melacak keluaran dari setiap iterasi akan membantu menciptakan keluaran yang lebih baik di iterasi berikutnya.
Eksperimen Prototipe
Percobaan prototipe melibatkan penetapan tugas dan menghasilkan keluaran sesuai percobaan. Dalam tugas tertentu, kita harus mengulang untuk mencapai wawasan dan iterasi ini dapat dijelaskan dengan sangat baik sebagai eksperimen.
Integrasi data
Siklus hidup pengembangan perangkat lunak mencakup berbagai fase dengan data penting untuk -
customers
pengembang, dan
bisnis
Integrasi data membuka jalan untuk prospek dan keluaran yang lebih baik.
Nilai data piramida
Nilai piramida di atas menggambarkan lapisan yang dibutuhkan untuk pengembangan "Agile data science". Ini dimulai dengan pengumpulan catatan berdasarkan persyaratan dan catatan individu pipa ledeng. Grafik dibuat setelah pembersihan dan agregasi data. Data agregat dapat digunakan untuk visualisasi data. Laporan dibuat dengan struktur, metadata, dan tag data yang tepat. Lapisan kedua dari piramida dari atas mencakup analisis prediksi. Lapisan prediksi adalah tempat lebih banyak nilai dibuat, tetapi membantu dalam membuat prediksi bagus yang berfokus pada rekayasa fitur.
Lapisan paling atas melibatkan tindakan di mana nilai data didorong secara efektif. Ilustrasi terbaik dari implementasi ini adalah "Artificial Intelligence".