KNIME-퀵 가이드

기계 학습 모델을 개발하는 것은 그 비밀스런 특성으로 인해 항상 매우 어려운 것으로 간주됩니다. 일반적으로 기계 학습 애플리케이션을 개발하려면 명령 기반 개발에 대한 전문성을 갖춘 훌륭한 개발자 여야합니다. KNIME의 도입은 일반인의 관점에서 기계 학습 모델의 발전을 가져 왔습니다.

KNIME는 전체 개발을위한 그래픽 인터페이스 (사용자 친화적 인 GUI)를 제공합니다. KNIME에서는 저장소에 제공된 사전 정의 된 다양한 노드 간의 워크 플로를 정의하기 만하면됩니다. KNIME은 데이터 읽기, 다양한 ML 알고리즘 적용, 다양한 형식의 데이터 시각화와 같은 다양한 작업을 위해 노드라는 사전 정의 된 여러 구성 요소를 제공합니다. 따라서 KNIME 작업을 위해 프로그래밍 지식이 필요하지 않습니다. 흥미롭지 않나요?

이 자습서의 다음 장에서는 잘 테스트 된 여러 ML 알고리즘을 사용하여 데이터 분석을 마스터하는 방법을 알려줍니다.

KNIME Analytics Platform은 Windows, Linux 및 MacOS에서 사용할 수 있습니다. 이 장에서는 Mac에 플랫폼을 설치하는 단계를 살펴 보겠습니다. Windows 또는 Linux를 사용하는 경우 KNIME 다운로드 페이지에 제공된 설치 지침을 따르십시오. 세 가지 플랫폼 모두에 대한 바이너리 설치는 KNIME 페이지 에서 사용할 수 있습니다 .

Mac 설치

KNIME 공식 사이트에서 바이너리 설치를 다운로드하십시오. 다운로드 한 파일을 두 번 클릭합니다.dmg파일을 선택하여 설치를 시작하십시오. 설치가 완료되면 KNIME 아이콘을 응용 프로그램 폴더로 드래그하십시오.

KNIME 아이콘을 두 번 클릭하여 KNIME 분석 플랫폼을 시작하십시오. 처음에는 작업을 저장할 작업 공간 폴더를 설정하라는 메시지가 표시됩니다. 화면은 다음과 같습니다.

선택한 폴더를 기본값으로 설정할 수 있으며 다음에 KNIME을 시작할 때

이 대화 상자를 다시 표시합니다.

잠시 후 KNIME 플랫폼이 데스크탑에서 시작됩니다. 이것은 분석 작업을 수행하는 워크 벤치입니다. 이제 워크 벤치의 다양한 부분을 살펴 보겠습니다.

KNIME이 시작되면 다음 화면이 표시됩니다.

스크린 샷에 표시된대로 워크 벤치는 여러보기로 구성됩니다. 우리에게 즉시 사용되는보기는 스크린 샷에 표시되고 아래에 나열됩니다.

  • Workspace

  • Outline

  • 노드 저장소

  • KNIME 탐색기

  • Console

  • Description

이 장에서 계속 진행하면서 이러한 뷰를 각각 자세히 알아 보겠습니다.

작업 공간보기

우리에게 가장 중요한 견해는 Workspace전망. 여기에서 기계 학습 모델을 만들 수 있습니다. 작업 공간보기는 아래 스크린 샷에서 강조 표시됩니다.

스크린 샷은 열린 작업 공간을 보여줍니다. 곧 기존 작업 공간을 여는 방법을 배우게됩니다.

각 작업 공간에는 하나 이상의 노드가 있습니다. 자습서의 뒷부분에서 이러한 노드의 중요성을 배웁니다. 노드는 화살표를 사용하여 연결됩니다. 일반적으로 프로그램 흐름은 필수 사항은 아니지만 왼쪽에서 오른쪽으로 정의됩니다. 작업 공간의 어느 위치로든 각 노드를 자유롭게 이동할 수 있습니다. 둘 사이의 연결선은 노드 사이의 연결을 유지하기 위해 적절하게 움직입니다. 언제든지 노드 간의 연결을 추가 / 제거 할 수 있습니다. 각 노드에 대해 작은 설명이 선택적으로 추가 될 수 있습니다.

개요보기

작업 공간보기는 한 번에 전체 워크 플로우를 표시하지 못할 수 있습니다. 이것이 아웃 라인 뷰가 제공되는 이유입니다.

개요보기는 전체 작업 공간의 축소보기를 표시합니다. 이보기 안에는 슬라이드하여 워크 플로의 다른 부분을 볼 수있는 확대 / 축소 창이 있습니다.Workspace 전망.

노드 저장소

이것은 워크 벤치에서 다음으로 중요한보기입니다. 노드 저장소에는 분석에 사용할 수있는 다양한 노드가 나열됩니다. 전체 저장소는 노드 기능에 따라 잘 분류됩니다. 같은 카테고리를 찾을 수 있습니다-

  • IO

  • Views

  • Analytics

각 카테고리에서 몇 가지 옵션을 찾을 수 있습니다. 각 카테고리보기를 확장하여 거기에 무엇이 있는지 확인하십시오. 아래의IO 범주, ARFF, CSV, PMML, XLS 등과 같은 다양한 파일 형식으로 데이터를 읽을 수있는 노드를 찾을 수 있습니다.

입력 소스 데이터 형식에 따라 데이터 세트를 읽기위한 적절한 노드를 선택합니다.

이때 쯤이면 노드의 목적을 이해했을 것입니다. 노드는 워크 플로에 시각적으로 포함 할 수있는 특정 종류의 기능을 정의합니다.

Analytics 노드는 Bayes, Clustering, Decision Tree, Ensemble Learning 등과 같은 다양한 기계 학습 알고리즘을 정의합니다.

이러한 다양한 ML 알고리즘의 구현이 이러한 노드에서 제공됩니다. 분석에 알고리즘을 적용하려면 저장소에서 원하는 노드를 선택하여 작업 공간에 추가하면됩니다. 데이터 리더 노드의 출력을이 ML 노드의 입력에 연결하면 워크 플로가 생성됩니다.

저장소에서 사용할 수있는 다양한 노드를 탐색하는 것이 좋습니다.

KNIME 탐색기

워크 벤치에서 다음으로 중요한보기는 Explorer 아래 스크린 샷과 같이보기-

처음 두 범주는 KNIME 서버에 정의 된 작업 공간을 나열합니다. 세 번째 옵션 LOCAL은 로컬 머신에 생성 한 모든 작업 공간을 저장하는 데 사용됩니다. 사전 정의 된 다양한 작업 공간을 보려면이 탭을 확장 해보십시오. 특히 EXAMPLES 탭을 확장합니다.

KNIME은 플랫폼을 시작하는 데 도움이되는 몇 가지 예를 제공합니다. 다음 장에서는 이러한 예제 중 하나를 사용하여 플랫폼에 익숙해 질 것입니다.

콘솔보기

이름에서 알 수 있듯이 Console 보기는 워크 플로를 실행하는 동안 다양한 콘솔 메시지의보기를 제공합니다.

그만큼 Console 보기는 워크 플로를 진단하고 분석 결과를 검토하는 데 유용합니다.

설명보기

우리와 직접적인 관련이있는 마지막 중요한 견해는 Description전망. 이보기는 작업 공간에서 선택한 항목에 대한 설명을 제공합니다. 일반적인보기는 아래 스크린 샷에 나와 있습니다.

위의보기는 File Reader마디. 선택하면File Reader작업 공간에서 노드에 대한 설명이이보기에 표시됩니다. 다른 노드를 클릭하면 선택한 노드에 대한 설명이 표시됩니다. 따라서이보기는 작업 공간 및 / 또는 노드 저장소에있는 다양한 노드의 목적을 정확히 알지 못하는 학습 초기 단계에서 매우 유용합니다.

툴바

위에서 설명한보기 외에도 워크 벤치에는 도구 모음과 같은 다른보기가 있습니다. 도구 모음에는 빠른 작업을 용이하게하는 다양한 아이콘이 있습니다. 아이콘은 상황에 따라 활성화 / 비활성화됩니다. 마우스를 가져 가면 각 아이콘이 수행하는 동작을 볼 수 있습니다. 다음 화면은Configure 상.

보기 활성화 / 비활성화

지금까지 본 다양한보기를 쉽게 켜고 끌 수 있습니다. 보기에서 닫기 아이콘을 클릭하면close보기. 보기를 복원하려면 다음으로 이동하십시오.View메뉴 옵션을 클릭하고 원하는보기를 선택합니다. 선택한보기가 워크 벤치에 추가됩니다.

이제 워크 벤치에 익숙해 졌으므로 워크 플로를 실행하고 워크 벤치에서 수행하는 분석을 연구하는 방법을 보여 드리겠습니다.

KNIME은 쉽게 배울 수 있도록 몇 가지 좋은 워크 플로를 제공했습니다. 이 장에서는 설치시 제공되는 워크 플로 중 하나를 선택하여 분석 플랫폼의 다양한 기능과 성능을 설명합니다. 우리는 다음을 기반으로 간단한 분류기를 사용할 것입니다.Decision Tree 우리 연구를 위해.

의사 결정 트리 분류기로드

KNIME 탐색기에서 다음 워크 플로를 찾습니다-

LOCAL / Example Workflows / Basic Examples / Building a Simple Classifier

이것은 또한 빠른 참조를 위해 아래 스크린 샷에 표시됩니다.

선택한 항목을 두 번 클릭하여 워크 플로를 엽니 다. 작업 공간보기를 관찰하십시오. 여러 노드가 포함 된 워크 플로가 표시됩니다. 이 워크 플로의 목적은 UCI Machine Learning Repository에서 가져온 성인 데이터 세트의 민주적 속성에서 소득 그룹을 예측하는 것입니다. 이 ML 모델의 임무는 특정 지역의 사람들을 소득이 50K보다 크거나 작은 것으로 분류하는 것입니다.

그만큼 Workspace 개요와 함께보기는 아래 스크린 샷에 표시됩니다.

여러 노드가 Nodes화살표로 워크 플로에 연결됩니다. 연결은 한 노드의 출력이 다음 노드의 입력에 공급됨을 나타냅니다. 워크 플로에있는 각 노드의 기능을 배우기 전에 먼저 전체 워크 플로를 실행 해 보겠습니다.

워크 플로 실행

워크 플로우 실행을 살펴보기 전에 각 노드의 상태 보고서를 이해하는 것이 중요합니다. 워크 플로우의 노드를 검사하십시오. 각 노드의 하단에는 세 개의 원이 포함 된 상태 표시기가 있습니다. 의사 결정 트리 학습자 노드는 아래 스크린 샷에 나와 있습니다.

상태 표시기는 빨간색으로이 노드가 지금까지 실행되지 않았 음을 나타냅니다. 실행 중에 노란색 중앙 원이 켜집니다. 성공적으로 실행되면 마지막 원이 녹색으로 바뀝니다. 오류 발생시 상태 정보를 제공하는 더 많은 표시기가 있습니다. 처리 중 오류가 발생하면 학습합니다.

현재 모든 노드의 표시기가 빨간색으로 표시되어 지금까지 실행 된 노드가 없음을 나타냅니다. 모든 노드를 실행하려면 다음 메뉴 항목을 클릭하십시오.

Node → Execute All

잠시 후 각 노드 상태 표시기가 녹색으로 바뀌어 오류가 없음을 나타냅니다.

다음 장에서는 워크 플로에있는 다양한 노드의 기능을 살펴 보겠습니다.

워크 플로우에서 노드를 확인하면 다음이 포함되어 있음을 알 수 있습니다.

  • 파일 리더,

  • 색상 관리자

  • Partitioning

  • 의사 결정 나무 학습자

  • 의사 결정 트리 예측 자

  • Score

  • 인터랙티브 테이블

  • 산포도

  • Statistics

이들은 쉽게 볼 수 있습니다 Outline 여기에 표시된대로보기-

각 노드는 워크 플로에서 특정 기능을 제공합니다. 이제 원하는 기능을 충족하도록 이러한 노드를 구성하는 방법을 살펴 보겠습니다. 워크 플로 탐색의 현재 컨텍스트에서 우리와 관련된 노드 만 논의 할 것입니다.

파일 리더

파일 리더 노드는 아래 스크린 샷에 묘사되어 있습니다.

창 상단에는 워크 플로 작성자가 제공 한 몇 가지 설명이 있습니다. 이 노드가 성인 데이터 세트를 읽음을 알려줍니다. 파일 이름은adult.csv노드 기호 아래의 설명에서 볼 수 있습니다. 그만큼File Reader 두 개의 출력이 있습니다-하나는 Color Manager 노드와 다른 하나는 Statistics 마디.

오른쪽 클릭하면 File Manager, 팝업 메뉴는 다음과 같이 표시됩니다.

그만큼 Configure메뉴 옵션은 노드 구성을 허용합니다. 그만큼Execute메뉴는 노드를 실행합니다. 노드가 이미 실행되었으며 녹색 상태이면이 메뉴가 비활성화됩니다. 또한Edit Note Description메뉴 옵션. 이를 통해 노드에 대한 설명을 작성할 수 있습니다.

이제 Configure 메뉴 옵션을 선택하면 여기 스크린 샷과 같이 adult.csv 파일의 데이터가 포함 된 화면이 표시됩니다.

이 노드를 실행하면 데이터가 메모리에로드됩니다. 전체 데이터 로딩 프로그램 코드는 사용자에게 표시되지 않습니다. 이제 코딩이 필요없는 이러한 노드의 유용성을 인식 할 수 있습니다.

다음 노드는 Color Manager.

색상 관리자

선택 Color Manager노드를 마우스 오른쪽 버튼으로 클릭하여 구성으로 이동합니다. 색상 설정 대화 상자가 나타납니다. 선택income 드롭 다운 목록에서 열.

화면은 다음과 같습니다.

두 가지 제약 조건이 있습니다. 수입이 50K 미만이면 데이터 포인트가 녹색을 얻고 더 많으면 빨간색이됩니다. 이 장의 뒷부분에서 산점도를 볼 때 데이터 포인트 매핑을 볼 수 있습니다.

파티셔닝

기계 학습에서는 일반적으로 사용 가능한 전체 데이터를 두 부분으로 나눕니다. 큰 부분은 모델 학습에 사용되는 반면 작은 부분은 테스트에 사용됩니다. 데이터를 분할하는 데 사용되는 다양한 전략이 있습니다.

원하는 파티셔닝을 정의하려면 Partitioning 노드를 선택하고 Configure선택권. 다음 화면이 표시됩니다.

이 경우 시스템 모델러는 Relative(%) 모드와 데이터는 80:20 비율로 분할됩니다. 분할을 수행하는 동안 데이터 포인트가 무작위로 선택됩니다. 이렇게하면 테스트 데이터가 편향되지 않을 수 있습니다. 선형 샘플링의 경우 테스트에 사용 된 나머지 20 % 데이터는 수집 중에 완전히 편향 될 수 있으므로 훈련 데이터를 올바르게 나타내지 않을 수 있습니다.

데이터 수집 중에 임의성이 보장된다는 확신이 들면 선형 샘플링을 선택할 수 있습니다. 데이터가 모델을 학습 할 준비가되면 데이터를 다음 노드에 공급합니다.Decision Tree Learner.

의사 결정 나무 학습자

그만큼 Decision Tree Learner이름에서 알 수 있듯이 노드는 훈련 데이터를 사용하고 모델을 구축합니다. 아래 스크린 샷에 묘사 된이 노드의 구성 설정을 확인하십시오.

보시다시피 Class 이다 income. 따라서 나무는 소득 열을 기반으로하여 우리가이 모델에서 달성하고자하는 것입니다. 우리는 소득이 50K보다 크거나 작은 사람들의 분리를 원합니다.

이 노드가 성공적으로 실행되면 모델을 테스트 할 준비가됩니다.

의사 결정 트리 예측 자

Decision Tree Predictor 노드는 개발 된 모델을 테스트 데이터 세트에 적용하고 모델 예측을 추가합니다.

예측 변수의 출력은 두 개의 다른 노드에 제공됩니다. ScorerScatter Plot. 다음으로 예측 결과를 살펴 보겠습니다.

득점자

이 노드는 confusion matrix. 그것을 보려면 노드를 마우스 오른쪽 버튼으로 클릭하십시오. 다음과 같은 팝업 메뉴가 나타납니다.

클릭 View: Confusion Matrix 메뉴 옵션과 매트릭스는 여기 스크린 샷과 같이 별도의 창에 팝업됩니다.

우리가 개발 한 모델의 정확도가 83.71 %임을 나타냅니다. 이것에 만족하지 않으면 모델 구축에서 다른 매개 변수를 가지고 놀 수 있습니다. 특히 데이터를 다시 방문하고 정리하는 것이 좋습니다.

산포도

데이터 분포의 산점도를 보려면 Scatter Plot 노드를 선택하고 메뉴 옵션을 선택하십시오. Interactive View: Scatter Plot. 다음 플롯이 표시됩니다.

플롯은 빨간색과 파란색의 두 가지 색상 점으로 50K의 임계 값을 기준으로 여러 소득 그룹 사람들의 분포를 제공합니다. 이것들은 우리의Color Manager마디. 분포는 x 축에 표시된 나이를 기준으로합니다. 노드의 구성을 변경하여 x 축에 대해 다른 기능을 선택할 수 있습니다.

여기에 구성 대화 상자가 표시됩니다. marital-status x 축의 기능으로.

이것으로 KNIME에서 제공하는 사전 정의 된 모델에 대한 논의가 완료되었습니다. 자습을 위해 모델에서 다른 두 노드 (통계 및 대화 형 테이블)를 선택하는 것이 좋습니다.

이제 튜토리얼의 가장 중요한 부분 인 자신 만의 모델을 만들어 보겠습니다.

이 장에서는 몇 가지 관찰 된 기능을 기반으로 식물을 분류하는 자체 기계 학습 모델을 빌드합니다. 우리는 잘 알려진iris 데이터 세트 UCI Machine Learning Repository이 목적을 위해. 데이터 세트에는 세 가지 종류의 식물이 포함됩니다. 알려지지 않은 식물을이 세 가지 클래스 중 하나로 분류하도록 모델을 훈련시킬 것입니다.

기계 학습 모델을 만들기 위해 KNIME에서 새 워크 플로를 만드는 것으로 시작합니다.

워크 플로우 생성

새 워크 플로우를 작성하려면 KNIME 워크 벤치에서 다음 메뉴 옵션을 선택하십시오.

File → New

다음 화면이 표시됩니다-

선택 New KNIME Workflow 옵션을 클릭하고 Next단추. 다음 화면에서 워크 플로의 원하는 이름과 저장할 대상 폴더를 묻는 메시지가 표시됩니다. 이 정보를 원하는대로 입력하고Finish 새 작업 공간을 만듭니다.

지정된 이름의 새 작업 공간이 Workspace 여기에서 본보기-

이제이 작업 공간에 다양한 노드를 추가하여 모델을 생성합니다. 노드를 추가하기 전에 먼저 다운로드하여 준비해야합니다.iris 우리가 사용할 데이터 세트.

데이터 세트 준비

UCI Machine Learning Repository 사이트에서 홍채 데이터 세트를 다운로드합니다 . Download Iris Dataset . 다운로드 한 iris.data 파일은 CSV 형식입니다. 열 이름을 추가하기 위해 일부를 변경합니다.

즐겨 사용하는 텍스트 편집기에서 다운로드 한 파일을 열고 시작 부분에 다음 줄을 추가합니다.

sepal length, petal length, sepal width, petal width, class

때 우리 File Reader 노드는이 파일을 읽고 위의 필드를 열 이름으로 자동으로 사용합니다.

이제 다양한 노드를 추가하기 시작합니다.

파일 리더 추가

다음으로 이동 Node Repository 보기, 검색 상자에 "파일"을 입력하여 File Reader마디. 이것은 아래 스크린 샷에서 볼 수 있습니다.

선택하고 두 번 클릭 File Reader작업 공간에 노드를 추가합니다. 또는 끌어서 놓기 기능을 사용하여 작업 공간에 노드를 추가 할 수 있습니다. 노드를 추가 한 후 구성해야합니다. 노드를 마우스 오른쪽 버튼으로 클릭하고Configure메뉴 옵션. 이전 단원에서이 작업을 수행했습니다.

데이터 파일이로드 된 후 설정 화면은 다음과 같습니다.

데이터 세트를로드하려면 Browse버튼을 클릭하고 iris.data 파일의 위치를 ​​선택하십시오. 노드는 구성 상자의 하단에 표시되는 파일의 내용을로드합니다. 데이터 파일의 위치가 적절하고로드 된 것이 만족 스러우면OK 버튼을 눌러 구성 대화 상자를 닫습니다.

이제이 노드에 몇 가지 주석을 추가합니다. 노드를 마우스 오른쪽 버튼으로 클릭하고New Workflow Annotation메뉴 옵션. 여기 스크린 샷과 같이 주석 상자가 화면에 나타납니다.

상자 내부를 클릭하고 다음 주석을 추가하십시오-

Reads iris.data

편집 모드를 종료하려면 상자 외부의 아무 곳이나 클릭하십시오. 크기를 조정하고 원하는대로 노드 주위에 상자를 배치합니다. 마지막으로Node 1 이 문자열을 다음으로 변경하려면 노드 아래의 텍스트-

Loads data

이 시점에서 화면은 다음과 같습니다.

이제로드 된 데이터 세트를 훈련 및 테스트로 분할하기위한 새 노드를 추가합니다.

분할 노드 추가

에서 Node Repository 검색 창에서 몇 개의 문자를 입력하여 Partitioning 아래 스크린 샷에서 볼 수 있듯이 노드-

작업 공간에 노드를 추가하십시오. 다음과 같이 구성을 설정하십시오-

Relative (%) : 95
Draw Randomly

다음 스크린 샷은 구성 매개 변수를 보여줍니다.

다음으로 두 노드를 연결합니다. 이렇게하려면 출력을 클릭하십시오.File Reader 노드에서 마우스 버튼을 계속 클릭하면 고무줄이 나타납니다. Partitioning노드에서 마우스 버튼을 놓습니다. 이제 두 노드간에 연결이 설정됩니다.

주석을 추가하고, 설명을 변경하고, 노드와 주석보기를 원하는대로 배치합니다. 이 단계에서 화면은 다음과 같아야합니다.

다음으로 k-Means 마디.

k- 평균 노드 추가

선택 k-Means저장소에서 노드를 제거하고 작업 공간에 추가합니다. k- 평균 알고리즘에 대한 지식을 새로 고치려면 워크 벤치의 설명보기에서 설명을 찾아보십시오. 이것은 아래 스크린 샷에 나와 있습니다.

참고로, 사용할 알고리즘에 대한 최종 결정을 내리기 전에 설명 창에서 다른 알고리즘에 대한 설명을 찾아 볼 수 있습니다.

노드에 대한 구성 대화 상자를 엽니 다. 여기에 표시된대로 모든 필드에 기본값을 사용합니다.

딸깍 하는 소리 OK 기본값을 적용하고 대화 상자를 닫습니다.

주석과 설명을 다음과 같이 설정하십시오-

  • 주석 : 클러스터 분류

  • 설명 : 클러스터링 수행

상단 출력을 연결 Partitioning 노드의 입력 k-Means마디. 항목을 재배치하면 화면이 다음과 같이 보일 것입니다.

다음으로 Cluster Assigner 마디.

클러스터 할당 자 추가

그만큼 Cluster Assigner기존 프로토 타입 세트에 새 데이터를 할당합니다. 프로토 타입 모델과 입력 데이터를 포함하는 데이터 테이블의 두 가지 입력이 필요합니다. 아래 스크린 샷에 묘사 된 설명 창에서 노드의 설명을 찾습니다.

따라서이 노드에 대해 두 개의 연결을 만들어야합니다.

  • PMML 클러스터 모델 출력 Partitioning 노드 → 프로토 타입 입력 Cluster Assigner

  • 두 번째 파티션 출력 Partitioning 노드 → 입력 데이터 Cluster Assigner

이 두 연결은 아래 스크린 샷에 나와 있습니다.

그만큼 Cluster Assigner특별한 구성이 필요하지 않습니다. 기본값을 그대로 사용하십시오.

이제이 노드에 주석과 설명을 추가합니다. 노드를 재정렬하십시오. 화면은 다음과 같아야합니다.

이 시점에서 클러스터링이 완료되었습니다. 출력을 그래픽으로 시각화해야합니다. 이를 위해 산점도를 추가합니다. 산점도에서 세 가지 클래스의 색상과 모양을 다르게 설정합니다. 따라서 우리는k-Means 먼저 노드를 통해 Color Manager 노드를 통해 Shape Manager 마디.

색상 관리자 추가

찾기 Color Manager저장소의 노드. 작업 공간에 추가하십시오. 구성을 기본값으로 둡니다. 구성 대화 상자를 열고OK기본값을 수락합니다. 노드에 대한 설명 텍스트를 설정합니다.

출력에서 연결합니다. k-Means 의 입력에 Color Manager. 이 단계에서 화면은 다음과 같습니다.

모양 관리자 추가

찾기 Shape Manager저장소에서 작업 공간에 추가하십시오. 구성을 기본값으로 둡니다. 이전과 마찬가지로 구성 대화 상자를 열고OK기본값을 설정합니다. 출력에서 연결 설정Color Manager 의 입력에 Shape Manager. 노드에 대한 설명을 설정합니다.

화면은 다음과 같아야합니다.

이제 모델에 마지막 노드를 추가 할 것이며 이것이 산점도입니다.

산점도 추가

위치하고 있다 Scatter Plot저장소에 노드를 추가하고 작업 공간에 추가하십시오. 출력 연결Shape Manager 의 입력에 Scatter Plot. 구성을 기본값으로 둡니다. 설명을 설정합니다.

마지막으로 최근 추가 된 3 개의 노드에 그룹 주석을 추가합니다.

주석 : 시각화

원하는대로 노드를 재배치합니다. 이 단계에서 화면은 다음과 같아야합니다.

이것으로 모델 구축 작업이 완료되었습니다.

모델을 테스트하려면 다음 메뉴 옵션을 실행하십시오. NodeExecute All

모든 것이 올바르게 진행되면 각 노드 하단의 상태 신호가 녹색으로 바뀝니다. 그렇지 않은 경우에는Console 오류를 확인하고 수정 한 다음 워크 플로를 다시 실행합니다.

이제 모델의 예측 출력을 시각화 할 준비가되었습니다. 이를 위해Scatter Plot 노드를 선택하고 다음 메뉴 옵션을 선택하십시오. Interactive View: Scatter Plot

이것은 아래 스크린 샷에 나와 있습니다.

여기에 표시된 것처럼 화면에 산점도가 표시됩니다.

x 축과 y 축을 변경하여 다양한 시각화를 실행할 수 있습니다. 이렇게하려면 산점도의 오른쪽 상단에있는 설정 메뉴를 클릭합니다. 아래 스크린 샷과 같이 팝업 메뉴가 나타납니다.

이 화면에서 플롯에 대한 다양한 매개 변수를 설정하여 여러 측면에서 데이터를 시각화 할 수 있습니다.

이것으로 모델 구축 작업이 완료되었습니다.

KNIME은 기계 학습 모델을 구축하기위한 그래픽 도구를 제공합니다. 이 자습서에서는 컴퓨터에 KNIME을 다운로드하고 설치하는 방법을 배웠습니다.

요약

KNIME 워크 벤치에서 제공하는 다양한보기를 배웠습니다. KNIME은 학습을 위해 미리 정의 된 몇 가지 워크 플로를 제공합니다. 우리는 KNIME의 기능을 배우기 위해 이러한 워크 플로를 사용했습니다. KNIME은 다양한 형식의 데이터를 읽고, 여러 ML 알고리즘을 사용하여 데이터를 분석하고, 마지막으로 다양한 방식으로 데이터를 시각화하기 위해 사전 프로그래밍 된 여러 노드를 제공합니다. 튜토리얼이 끝날 무렵 처음부터 자신 만의 모델을 만들었습니다. k-Means 알고리즘을 사용하여 식물을 분류하기 위해 잘 알려진 홍채 데이터 세트를 사용했습니다.

이제 이러한 기술을 자신의 분석에 사용할 준비가되었습니다.

향후 작업

개발자이고 프로그래밍 응용 프로그램에서 KNIME 구성 요소를 사용하려는 경우 KNIME이 기본적으로 Java, R, Python 등과 같은 다양한 프로그래밍 언어와 통합된다는 사실에 기뻐할 것입니다.