데이터 분석을위한 머신 러닝
기계 학습은 패턴 인식, 컴퓨터 비전, 음성 인식, 텍스트 분석과 같은 작업을 처리하는 컴퓨터 과학의 하위 분야이며 통계 및 수학적 최적화와 밀접한 관련이 있습니다. 응용 프로그램에는 검색 엔진, 스팸 필터링, 광학 문자 인식 (OCR) 개발이 포함됩니다. 데이터 마이닝, 패턴 인식 및 통계 학습 분야 간의 경계는 명확하지 않으며 기본적으로 모두 유사한 문제를 나타냅니다.
기계 학습은 두 가지 유형의 작업으로 나눌 수 있습니다.
- 지도 학습
- 비지도 학습
지도 학습
지도 학습은 행렬 X 로 정의 된 입력 데이터 가 있고 응답 y 예측에 관심 이있는 문제 유형을 나타냅니다 . 여기서 X = {x 1 , x 2 ,…, x n } 에는 n 개의 예측 변수가 있고 두 개의 값 y = {c 1 , c 2 }가 있습니다.
예제 응용 프로그램은 인구 통계 학적 기능을 예측 변수로 사용하여 웹 사용자가 광고를 클릭 할 확률을 예측하는 것입니다. 클릭률 (CTR)을 예측하기 위해 종종 호출됩니다. 그런 다음 y = {클릭, 안 함 − 클릭} 및 예측 변수는 사용 된 IP 주소, 사이트에 들어간 날짜, 사용자의 도시, 사용 가능한 다른 기능 중 국가가 될 수 있습니다.
비지도 학습
비지도 학습은 학습 할 수업없이 서로 비슷한 그룹을 찾는 문제를 다룹니다. 예측 변수에서 매핑을 학습하여 각 그룹에서 유사한 인스턴스를 공유하고 서로 다른 그룹을 찾는 작업에는 여러 가지 접근 방식이 있습니다.
비지도 학습의 예제 응용 프로그램은 고객 세분화입니다. 예를 들어, 통신 산업에서 일반적인 작업은 사용자가 전화기에 제공하는 사용량에 따라 사용자를 분류하는 것입니다. 이를 통해 마케팅 부서는 다른 제품으로 각 그룹을 타겟팅 할 수 있습니다.