Khai thác dữ liệu - Khám phá tri thức
Khám phá tri thức là gì?
Một số người không phân biệt khai thác dữ liệu với khám phá tri thức trong khi những người khác xem khai thác dữ liệu là một bước thiết yếu trong quá trình khám phá tri thức. Đây là danh sách các bước liên quan đến quá trình khám phá kiến thức -
Data Cleaning - Trong bước này, dữ liệu nhiễu và không nhất quán được loại bỏ.
Data Integration - Trong bước này, nhiều nguồn dữ liệu được kết hợp.
Data Selection - Trong bước này, dữ liệu liên quan đến nhiệm vụ phân tích được truy xuất từ cơ sở dữ liệu.
Data Transformation - Trong bước này, dữ liệu được chuyển đổi hoặc hợp nhất thành các dạng thích hợp để khai thác bằng cách thực hiện các phép toán tổng hợp hoặc tóm tắt.
Data Mining - Trong bước này, các phương pháp thông minh được áp dụng để trích xuất các mẫu dữ liệu.
Pattern Evaluation - Trong bước này, các mẫu dữ liệu được đánh giá.
Knowledge Presentation - Ở bước này, kiến thức được biểu diễn.
Sơ đồ sau đây cho thấy quá trình khám phá kiến thức -