데이터 마이닝-용어
데이터 수집
데이터 마이닝은 방대한 데이터 집합에서 정보를 추출하는 것으로 정의됩니다. 즉, 데이터 마이닝은 데이터에서 지식을 마이닝한다고 말할 수 있습니다. 이 정보는 다음 응용 프로그램에 사용할 수 있습니다.
- 시장 분석
- 사기 감지
- 고객 유지
- 생산 관리
- 과학 탐험
데이터 마이닝 엔진
데이터 마이닝 엔진은 데이터 마이닝 시스템에 매우 중요합니다. 다음 기능을 수행하는 기능 모듈 세트로 구성됩니다.
- Characterization
- 연관성 및 상관 관계 분석
- Classification
- Prediction
- 클러스터 분석
- 이상치 분석
- 진화 분석
지식베이스
이것이 도메인 지식입니다. 이 지식은 검색을 안내하거나 결과 패턴의 흥미를 평가하는 데 사용됩니다.
지식 발견
어떤 사람들은 데이터 마이닝을 지식 발견과 동일하게 취급하는 반면 다른 사람들은 데이터 마이닝을 지식 발견 프로세스의 필수 단계로 간주합니다. 다음은 지식 발견 프로세스에 관련된 단계 목록입니다.
- 데이터 정리
- 데이터 통합
- 데이터 선택
- 데이터 변환
- 데이터 수집
- 패턴 평가
- 지식 프레젠테이션
사용자 인터페이스
사용자 인터페이스는 사용자와 데이터 마이닝 시스템 간의 통신을 돕는 데이터 마이닝 시스템의 모듈입니다. 사용자 인터페이스는 다음 기능을 허용합니다-
- 데이터 마이닝 쿼리 작업을 지정하여 시스템과 상호 작용합니다.
- 검색에 집중하는 데 도움이되는 정보를 제공합니다.
- 중간 데이터 마이닝 결과를 기반으로하는 마이닝.
- 데이터베이스 및 데이터웨어 하우스 스키마 또는 데이터 구조를 찾아보십시오.
- 채굴 된 패턴을 평가합니다.
- 다양한 형태로 패턴을 시각화합니다.
데이터 통합
데이터 통합은 여러 이기종 데이터 소스의 데이터를 일관된 데이터 저장소로 병합하는 데이터 사전 처리 기술입니다. 데이터 통합에는 일관성없는 데이터가 포함될 수 있으므로 데이터 정리가 필요합니다.
데이터 정리
데이터 정리는 노이즈가 많은 데이터를 제거하고 데이터의 불일치를 수정하는 데 적용되는 기술입니다. 데이터 정리에는 잘못된 데이터를 수정하기위한 변환이 포함됩니다. 데이터 정리는 데이터웨어 하우스에 대한 데이터를 준비하는 동안 데이터 전처리 단계로 수행됩니다.
데이터 선택
데이터 선택은 분석 작업과 관련된 데이터를 데이터베이스에서 검색하는 프로세스입니다. 때로는 데이터 선택 프로세스 전에 데이터 변환 및 통합이 수행됩니다.
클러스터
클러스터는 유사한 종류의 개체 그룹을 나타냅니다. 군집 분석은 서로 매우 유사하지만 다른 군집의 객체와는 매우 다른 객체 그룹을 형성하는 것을 말합니다.
데이터 변환
이 단계에서는 요약 또는 집계 작업을 수행하여 데이터를 마이닝에 적합한 형식으로 변환하거나 통합합니다.