Khoa học dữ liệu Agile - Giới thiệu
Khoa học dữ liệu linh hoạt là một cách tiếp cận sử dụng khoa học dữ liệu với phương pháp luận nhanh nhẹn để phát triển ứng dụng web. Nó tập trung vào đầu ra của quy trình khoa học dữ liệu phù hợp để tạo ra sự thay đổi cho một tổ chức. Khoa học dữ liệu bao gồm việc xây dựng các ứng dụng mô tả quá trình nghiên cứu với phân tích, trực quan hóa tương tác và cả học máy được ứng dụng.
Mục tiêu chính của khoa học dữ liệu nhanh là -
lập tài liệu và hướng dẫn phân tích dữ liệu giải thích để khám phá và đi theo con đường quan trọng dẫn đến một sản phẩm hấp dẫn.
Khoa học dữ liệu Agile được tổ chức với bộ nguyên tắc sau:
Lặp lại liên tục
Quá trình này bao gồm việc lặp đi lặp lại liên tục với việc tạo bảng, biểu đồ, báo cáo và dự đoán. Việc xây dựng các mô hình dự đoán sẽ yêu cầu nhiều lần lặp lại kỹ thuật tính năng với việc trích xuất và tạo ra thông tin chi tiết.
Đầu ra trung gian
Đây là danh sách theo dõi các kết quả đầu ra được tạo. Thậm chí, người ta nói rằng những thí nghiệm thất bại cũng có đầu ra. Theo dõi đầu ra của mỗi lần lặp sẽ giúp tạo ra đầu ra tốt hơn trong lần lặp tiếp theo.
Thử nghiệm nguyên mẫu
Thử nghiệm nguyên mẫu liên quan đến việc phân công nhiệm vụ và tạo đầu ra theo thử nghiệm. Trong một nhiệm vụ nhất định, chúng ta phải lặp lại để đạt được cái nhìn sâu sắc và những lần lặp này có thể được giải thích tốt nhất là thử nghiệm.
Tích hợp dữ liệu
Vòng đời phát triển phần mềm bao gồm các giai đoạn khác nhau với dữ liệu cần thiết cho -
customers
nhà phát triển và
việc kinh doanh
Việc tích hợp dữ liệu mở đường cho các triển vọng và đầu ra tốt hơn.
Giá trị dữ liệu kim tự tháp
Giá trị kim tự tháp ở trên mô tả các lớp cần thiết để phát triển “Khoa học dữ liệu Agile”. Nó bắt đầu với một bộ sưu tập các bản ghi dựa trên các yêu cầu và hồ sơ cá nhân về hệ thống ống nước. Các biểu đồ được tạo sau khi làm sạch và tổng hợp dữ liệu. Dữ liệu tổng hợp có thể được sử dụng để trực quan hóa dữ liệu. Các báo cáo được tạo với cấu trúc, siêu dữ liệu và thẻ dữ liệu phù hợp. Lớp thứ hai của kim tự tháp từ trên xuống bao gồm phân tích dự đoán. Lớp dự đoán là nơi tạo ra nhiều giá trị hơn nhưng giúp tạo ra các dự đoán tốt tập trung vào kỹ thuật tính năng.
Lớp trên cùng liên quan đến các hành động trong đó giá trị của dữ liệu được định hướng một cách hiệu quả. Minh họa tốt nhất cho việc triển khai này là “Trí tuệ nhân tạo”.