Python을 사용한 AI – 퀵 가이드
컴퓨터 나 기계가 발명 된 이래로 다양한 작업을 수행 할 수있는 능력은 기하 급수적으로 증가했습니다. 인간은 다양한 작업 영역, 증가하는 속도 및 시간에 따른 크기 감소 측면에서 컴퓨터 시스템의 힘을 개발했습니다.
인공 지능이라는 컴퓨터 과학의 한 분야는 인간만큼 지능적인 컴퓨터 또는 기계를 만드는 것을 추구합니다.
인공 지능 (AI)의 기본 개념
인공 지능의 아버지 인 John McCarthy에 따르면 이것은 "지능형 기계, 특히 지능적인 컴퓨터 프로그램을 만드는 과학과 공학"입니다.
인공 지능은 지능적인 인간이 생각하는 것과 유사한 방식으로 컴퓨터, 컴퓨터 제어 로봇 또는 소프트웨어가 지능적으로 생각하게 만드는 방법입니다. 인공 지능은 인간의 뇌가 어떻게 생각하고 인간이 문제를 해결하려고 노력하면서 학습, 결정, 일하는 방식을 연구 한 다음이 연구의 결과를 지능형 소프트웨어 및 시스템 개발의 기초로 사용함으로써 달성됩니다.
인간의 호기심 인 컴퓨터 시스템의 힘을 이용하면서 그는“기계가 인간처럼 생각하고 행동 할 수 있는가?”라고 궁금해하게 만듭니다.
따라서 AI의 개발은 우리가 인간에게서 발견하고 높이 평가하는 기계에서 유사한 지능을 생성하려는 의도에서 시작되었습니다.
AI 학습의 필요성
우리가 알고 있듯이 AI는 인간처럼 지능적인 기계를 만드는 것을 추구합니다. 우리가 AI를 연구해야하는 이유는 많습니다. 그 이유는 다음과 같습니다.
AI는 데이터를 통해 학습 할 수 있습니다.
일상 생활에서 우리는 엄청난 양의 데이터를 다루고 있으며 인간의 두뇌는 그렇게 많은 데이터를 추적 할 수 없습니다. 이것이 우리가 일을 자동화해야하는 이유입니다. 자동화를 위해서는 AI가 데이터에서 학습 할 수 있고 반복적 인 작업을 정확하고 피곤하지 않고 수행 할 수 있기 때문에 AI를 연구해야합니다.
AI는 스스로 가르 칠 수 있습니다
데이터 자체가 계속 변경되고 이러한 데이터에서 파생 된 지식이 지속적으로 업데이트되어야하기 때문에 시스템이 스스로 학습하는 것이 매우 필요합니다. AI 지원 시스템은 스스로 학습 할 수 있기 때문에 AI를 사용하여이 목적을 달성 할 수 있습니다.
AI는 실시간으로 대응할 수 있습니다
신경망의 도움으로 인공 지능은 데이터를 더 깊이 분석 할 수 있습니다. 이 기능으로 인해 AI는 상황에 따라 상황을 실시간으로 생각하고 대응할 수 있습니다.
AI는 정확성을 달성합니다
심층 신경망의 도움으로 AI는 엄청난 정확도를 달성 할 수 있습니다. AI는 환자의 MRI에서 암과 같은 질병을 진단하기 위해 의학 분야에서 도움을줍니다.
AI는 데이터를 최대한 활용하기 위해 데이터를 구성 할 수 있습니다.
데이터는자가 학습 알고리즘을 사용하는 시스템의 지적 재산입니다. 항상 최상의 결과를 제공하는 방식으로 데이터를 색인화하고 구성하려면 AI가 필요합니다.
지능 이해
AI를 통해 스마트 시스템을 구축 할 수 있습니다. 우리의 두뇌가 다른 지능 시스템을 구축 할 수 있도록 지능의 개념을 이해해야합니다.
지능이란 무엇입니까?
계산, 추론, 관계 및 비유를 인식하고, 경험을 통해 배우고, 기억에서 정보를 저장 및 검색하고, 문제를 해결하고, 복잡한 아이디어를 이해하고, 자연어를 유창하게 사용하고, 새로운 상황을 분류, 일반화 및 적응하는 시스템의 능력.
지능의 유형
미국의 발달 심리학자 인 하워드 가드너 (Howard Gardner)가 설명했듯이 지능은 여러 가지로 나옵니다.
Sr. 아니요 | 정보 및 설명 | 예 |
---|---|---|
1 | Linguistic intelligence 음운 (음성), 구문 (문법) 및 의미 (의미)의 메커니즘을 말하고 인식하고 사용하는 능력. |
내레이터, 연설자 |
2 | Musical intelligence 소리로 이루어진 의미를 만들고, 소통하고, 이해하는 능력, 음조, 리듬에 대한 이해. |
음악가, 가수, 작곡가 |
삼 | Logical-mathematical intelligence 행동이나 물건이 없을 때 관계를 사용하고 이해하는 능력. 또한 복잡하고 추상적 인 아이디어를 이해하는 능력이기도합니다. |
수학자, 과학자 |
4 | Spatial intelligence 시각적 또는 공간적 정보를 인식하고,이를 변경하고, 객체를 참조하지 않고 시각적 이미지를 재생성하고, 3D 이미지를 구성하고, 이동 및 회전하는 기능. |
지도 판독기, 우주 비행사, 물리학 자 |
5 | Bodily-Kinesthetic intelligence 신체의 전체 또는 일부를 사용하여 문제 또는 패션 제품을 해결하고, 미세하고 거친 운동 기술을 제어하고, 물체를 조작하는 능력. |
플레이어, 댄서 |
6 | Intra-personal intelligence 자신의 감정, 의도 및 동기를 구별하는 능력. |
가우 탐 불교 |
7 | Interpersonal intelligence 다른 사람의 감정, 신념 및 의도를 인식하고 구별하는 능력. |
매스 커뮤니케이터, 인터뷰어 |
기계 나 시스템이 적어도 하나 또는 모든 지능을 갖추고있을 때 인공적으로 지능적이라고 말할 수 있습니다.
인텔리전스는 무엇으로 구성됩니까?
지능은 무형입니다. 구성은-
- Reasoning
- Learning
- 문제 해결
- Perception
- 언어 지능
모든 구성 요소를 간략하게 살펴 보겠습니다.
추리
판단, 결정 및 예측을위한 기반을 제공 할 수있는 일련의 프로세스입니다. 크게 두 가지 유형이 있습니다-
귀납적 추론 | 연역적 추리 |
---|---|
광범위한 일반 진술을하기 위해 특정 관찰을 수행합니다. | 일반적인 진술로 시작하여 구체적이고 논리적 결론에 도달 할 수있는 가능성을 조사합니다. |
성명서에서 모든 전제가 사실이더라도 귀납적 추론은 결론이 거짓이 될 수 있습니다. | 일반적으로 사물의 클래스에 해당하는 것이 있으면 해당 클래스의 모든 구성원에게도 해당됩니다. |
Example − "Nita는 선생님입니다. Nita는 공부를 잘하고 있습니다. 그러므로 모든 선생님은 공부를 잘하고 있습니다." | Example − "60 세 이상의 모든 여성은 할머니입니다. Shalini는 65 세입니다. 따라서 Shalini는 할머니입니다." |
학습 − l
학습 능력은 인간, 특정 동물 종 및 AI 지원 시스템이 소유합니다. 학습은 다음과 같이 분류됩니다-
청각 학습
듣고 듣고 배우는 것입니다. 예를 들어, 녹음 된 오디오 강의를 듣는 학생들.
에피소드 학습
목격했거나 경험 한 일련의 사건을 기억하여 배우는 것. 이것은 선형적이고 질서 정연합니다.
운동 학습
근육의 정확한 움직임으로 배우는 것입니다. 예를 들어, 물건 따기, 쓰기 등
관찰 학습
다른 사람을보고 모방하여 배우기. 예를 들어, 아이는 부모를 모방하여 배우려고합니다.
지각 학습
이전에 본 적이있는 자극을 인식하는 법을 배우는 것입니다. 예를 들어 대상과 상황을 식별하고 분류합니다.
관계형 학습
그것은 절대적 속성보다는 관계 적 속성을 기반으로 다양한 자극을 구별하는 것을 배우는 것을 포함합니다. 예를 들어, 지난번에 짠 감자를 요리 할 때 '조금 덜'소금을 추가하고, 소금 한 스푼을 추가하여 요리 할 때.
Spatial Learning − 이미지, 색상,지도 등의 시각적 자극을 통해 학습하는 것입니다. 예를 들어 실제로 길을 따라 가기 전에 마음에 로드맵을 만들 수 있습니다.
Stimulus-Response Learning− 특정 자극이있을 때 특정 행동을 수행하는 방법을 배우는 것입니다. 예를 들어, 개는 초인종을 들으면서 귀를 들어 올립니다.
문제 해결
알려 지거나 알려지지 않은 장애물에 의해 막혀있는 어떤 길을 택하여 현재 상황에서 원하는 해결책에 도달하려고 시도하는 과정입니다.
문제 해결에는 다음이 포함됩니다. decision making, 이는 원하는 목표에 도달하기 위해 여러 대안 중에서 가장 적합한 대안을 선택하는 프로세스입니다.
지각
감각 정보를 획득하고, 해석하고, 선택하고, 구성하는 과정입니다.
지각 추정 sensing. 인간의 경우 지각은 감각 기관의 도움을받습니다. AI 영역에서 인식 메커니즘은 센서에서 수집 한 데이터를 의미있는 방식으로 결합합니다.
언어 지능
언어와 문어를 사용하고, 이해하고, 말하고, 쓰는 능력입니다. 대인 커뮤니케이션에서 중요합니다.
AI에 관련된 것
인공 지능은 방대한 연구 분야입니다. 이 연구 분야는 실제 문제에 대한 해결책을 찾는 데 도움이됩니다.
이제 AI 내에서 다양한 연구 분야를 살펴 보겠습니다.
기계 학습
AI에서 가장 인기있는 분야 중 하나입니다. 이 파일의 기본 개념은 인간이 자신의 경험에서 배울 수 있으므로 데이터에서 기계 학습을 만드는 것입니다. 여기에는 알 수없는 데이터에 대한 예측을 할 수있는 학습 모델이 포함되어 있습니다.
논리
컴퓨터 프로그램을 실행하기 위해 수학적 논리가 사용되는 또 다른 중요한 연구 분야입니다. 패턴 매칭, 의미 분석 등을 수행하기위한 규칙과 사실을 포함합니다.
수색
이 연구 분야는 기본적으로 체스, 틱택 토와 같은 게임에서 사용됩니다. 검색 알고리즘은 전체 검색 공간을 검색 한 후 최적의 솔루션을 제공합니다.
인공 신경망
이것은 생물학적 신경망의 비유에서 빌린 중심 주제 인 효율적인 컴퓨팅 시스템의 네트워크입니다. ANN은 로봇 공학, 음성 인식, 음성 처리 등에 사용할 수 있습니다.
유전 알고리즘
유전 알고리즘은 둘 이상의 프로그램을 통해 문제를 해결하는 데 도움이됩니다. 결과는 적자 선택을 기반으로합니다.
지식 표현
기계가 이해할 수있는 방식으로 사실을 표현할 수있는 연구 분야입니다. 보다 효율적인 지식이 표현됩니다. 더 많은 시스템이 지능적입니다.
AI 적용
이 섹션에서는 AI가 지원하는 다양한 필드를 볼 수 있습니다.
노름
인공 지능은 체스, 포커, 틱택 토 등과 같은 전략 게임에서 중요한 역할을합니다. 여기서 기계는 휴리스틱 지식을 기반으로 많은 수의 가능한 위치를 생각할 수 있습니다.
자연어 처리
인간이 말하는 자연어를 이해하는 컴퓨터와 상호 작용할 수 있습니다.
전문가 시스템
추론과 조언을 전달하기 위해 기계, 소프트웨어 및 특수 정보를 통합하는 일부 응용 프로그램이 있습니다. 사용자에게 설명과 조언을 제공합니다.
비전 시스템
이러한 시스템은 컴퓨터의 시각적 입력을 이해, 해석 및 이해합니다. 예를 들면
스파이 비행기는 사진을 찍어 공간 정보 또는 해당 지역의지도를 파악하는 데 사용됩니다.
의사는 임상 전문가 시스템을 사용하여 환자를 진단합니다.
경찰은 법의학자가 만든 초상화를 저장하여 범죄자의 얼굴을 인식 할 수있는 컴퓨터 소프트웨어를 사용합니다.
음성 인식
일부 지능형 시스템은 인간이 말을하는 동안 문장과 그 의미 측면에서 언어를 듣고 이해할 수 있습니다. 다양한 악센트, 속어, 배경 소음, 추위로 인한 인간 소음 변화 등을 처리 할 수 있습니다.
필기 인식
필기 인식 소프트웨어는 펜으로 종이에 쓰여진 텍스트 나 스타일러스로 화면에 쓰여진 텍스트를 읽습니다. 글자의 모양을 인식하여 편집 가능한 텍스트로 변환 할 수 있습니다.
지능형 로봇
로봇은 인간이 부여한 작업을 수행 할 수 있습니다. 빛, 열, 온도, 움직임, 소리, 범프 및 압력과 같은 실제 데이터를 감지하는 센서가 있습니다. 그들은 지능을 보여주기 위해 효율적인 프로세서, 다중 센서 및 거대한 메모리를 가지고 있습니다. 또한 실수로부터 배울 수 있고 새로운 환경에 적응할 수 있습니다.
Cognitive Modeling: Simulating Human Thinking Procedure
Cognitive modeling is basically the field of study within computer science that deals with the study and simulating the thinking process of human beings. The main task of AI is to make machine think like human. The most important feature of human thinking process is problem solving. That is why more or less cognitive modeling tries to understand how humans can solve the problems. After that this model can be used for various AI applications such as machine learning, robotics, natural language processing, etc. Following is the diagram of different thinking levels of human brain −
Agent & Environment
In this section, we will focus on the agent and environment and how these help in Artificial Intelligence.
Agent
An agent is anything that can perceive its environment through sensors and acts upon that environment through effectors.
A human agent has sensory organs such as eyes, ears, nose, tongue and skin parallel to the sensors, and other organs such as hands, legs, mouth, for effectors.
A robotic agent replaces cameras and infrared range finders for the sensors, and various motors and actuators for effectors.
A software agent has encoded bit strings as its programs and actions.
Environment
Some programs operate in an entirely artificial environment confined to keyboard input, database, computer file systems and character output on a screen.
In contrast, some software agents (software robots or softbots) exist in rich, unlimited softbots domains. The simulator has a very detailed, complex environment. The software agent needs to choose from a long array of actions in real time. A softbot is designed to scan the online preferences of the customer and shows interesting items to the customer works in the real as well as an artificial environment.
In this chapter, we will learn how to get started with Python. We will also understand how Python helps for Artificial Intelligence.
Why Python for AI
Artificial intelligence is considered to be the trending technology of the future. Already there are a number of applications made on it. Due to this, many companies and researchers are taking interest in it. But the main question that arises here is that in which programming language can these AI applications be developed? There are various programming languages like Lisp, Prolog, C++, Java and Python, which can be used for developing applications of AI. Among them, Python programming language gains a huge popularity and the reasons are as follows −
Simple syntax & less coding
Python involves very less coding and simple syntax among other programming languages which can be used for developing AI applications. Due to this feature, the testing can be easier and we can focus more on programming.
Inbuilt libraries for AI projects
A major advantage for using Python for AI is that it comes with inbuilt libraries. Python has libraries for almost all kinds of AI projects. For example, NumPy, SciPy, matplotlib, nltk, SimpleAI are some the important inbuilt libraries of Python.
Open source − Python is an open source programming language. This makes it widely popular in the community.
Can be used for broad range of programming − Python can be used for a broad range of programming tasks like small shell script to enterprise web applications. This is another reason Python is suitable for AI projects.
Features of Python
Python is a high-level, interpreted, interactive and object-oriented scripting language. Python is designed to be highly readable. It uses English keywords frequently where as other languages use punctuation, and it has fewer syntactical constructions than other languages. Python's features include the following −
Easy-to-learn − Python has few keywords, simple structure, and a clearly defined syntax. This allows the student to pick up the language quickly.
Easy-to-read − Python code is more clearly defined and visible to the eyes.
Easy-to-maintain − Python's source code is fairly easy-to-maintain.
A broad standard library − Python's bulk of the library is very portable and cross-platform compatible on UNIX, Windows, and Macintosh.
Interactive Mode − Python has support for an interactive mode which allows interactive testing and debugging of snippets of code.
Portable − Python can run on a wide variety of hardware platforms and has the same interface on all platforms.
Extendable − We can add low-level modules to the Python interpreter. These modules enable programmers to add to or customize their tools to be more efficient.
Databases − Python provides interfaces to all major commercial databases.
GUI Programming − Python supports GUI applications that can be created and ported to many system calls, libraries and windows systems, such as Windows MFC, Macintosh, and the X Window system of Unix.
Scalable − Python provides a better structure and support for large programs than shell scripting.
Important features of Python
Let us now consider the following important features of Python −
It supports functional and structured programming methods as well as OOP.
It can be used as a scripting language or can be compiled to byte-code for building large applications.
It provides very high-level dynamic data types and supports dynamic type checking.
It supports automatic garbage collection.
It can be easily integrated with C, C++, COM, ActiveX, CORBA, and Java.
Installing Python
Python distribution is available for a large number of platforms. You need to download only the binary code applicable for your platform and install Python.
If the binary code for your platform is not available, you need a C compiler to compile the source code manually. Compiling the source code offers more flexibility in terms of choice of features that you require in your installation.
Here is a quick overview of installing Python on various platforms −
Unix and Linux Installation
Follow these steps to install Python on Unix/Linux machine.
Open a Web browser and go to https://www.python.org/downloads
Follow the link to download zipped source code available for Unix/Linux.
Download and extract files.
Editing the Modules/Setup file if you want to customize some options.
run ./configure script
make
make install
This installs Python at the standard location /usr/local/bin and its libraries at /usr/local/lib/pythonXX where XX is the version of Python.
Windows Installation
Follow these steps to install Python on Windows machine.
Open a Web browser and go to https://www.python.org/downloads
Follow the link for the Windows installer python-XYZ.msi file where XYZ is the version you need to install.
To use this installer python-XYZ.msi, the Windows system must support Microsoft Installer 2.0. Save the installer file to your local machine and then run it to find out if your machine supports MSI.
Run the downloaded file. This brings up the Python install wizard, which is really easy to use. Just accept the default settings and wait until the install is finished.
Macintosh Installation
If you are on Mac OS X, it is recommended that you use Homebrew to install Python 3. It is a great package installer for Mac OS X and it is really easy to use. If you don't have Homebrew, you can install it using the following command −
$ ruby -e "$(curl -fsSL
https://raw.githubusercontent.com/Homebrew/install/master/install)"
We can update the package manager with the command below −
$ brew update
Now run the following command to install Python3 on your system −
$ brew install python3
Setting up PATH
Programs and other executable files can be in many directories, so operating systems provide a search path that lists the directories that the OS searches for executables.
The path is stored in an environment variable, which is a named string maintained by the operating system. This variable contains information available to the command shell and other programs.
The path variable is named as PATH in Unix or Path in Windows (Unix is case-sensitive; Windows is not).
In Mac OS, the installer handles the path details. To invoke the Python interpreter from any particular directory, you must add the Python directory to your path.
Setting Path at Unix/Linux
To add the Python directory to the path for a particular session in Unix −
In the csh shell
Type setenv PATH "$PATH:/usr/local/bin/python" and press Enter.
In the bash shell (Linux)
Type export ATH = "$PATH:/usr/local/bin/python" and press Enter.
In the sh or ksh shell
Type PATH = "$PATH:/usr/local/bin/python" and press Enter.
Note − /usr/local/bin/python is the path of the Python directory.
Setting Path at Windows
To add the Python directory to the path for a particular session in Windows −
At the command prompt − type path %path%;C:\Python and press Enter.
Note − C:\Python is the path of the Python directory.
Running Python
Let us now see the different ways to run Python. The ways are described below −
Interactive Interpreter
We can start Python from Unix, DOS, or any other system that provides you a command-line interpreter or shell window.
Enter python at the command line.
Start coding right away in the interactive interpreter.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Here is the list of all the available command line options −
S.No. | Option & Description |
---|---|
1 | -d It provides debug output. |
2 | -o It generates optimized bytecode (resulting in .pyo files). |
3 | -S Do not run import site to look for Python paths on startup. |
4 | -v Verbose output (detailed trace on import statements). |
5 | -x Disables class-based built-in exceptions (just use strings); obsolete starting with version 1.6. |
6 | -c cmd Runs Python script sent in as cmd string. |
7 | File Run Python script from given file. |
Script from the Command-line
A Python script can be executed at the command line by invoking the interpreter on your application, as in the following −
$python script.py # Unix/Linux
or,
python% script.py # Unix/Linux
or,
C:> python script.py # Windows/DOS
Note − Be sure the file permission mode allows execution.
Integrated Development Environment
You can run Python from a Graphical User Interface (GUI) environment as well, if you have a GUI application on your system that supports Python.
Unix − IDLE is the very first Unix IDE for Python.
Windows − PythonWin is the first Windows interface for Python and is an IDE with a GUI.
Macintosh − The Macintosh version of Python along with the IDLE IDE is available from the main website, downloadable as either MacBinary or BinHex'd files.
If you are not able to set up the environment properly, then you can take help from your system admin. Make sure the Python environment is properly set up and working perfectly fine.
We can also use another Python platform called Anaconda. It includes hundreds of popular data science packages and the conda package and virtual environment manager for Windows, Linux and MacOS. You can download it as per your operating system from the link https://www.anaconda.com/download/.
For this tutorial we are using Python 3.6.3 version on MS Windows.
Learning means the acquisition of knowledge or skills through study or experience. Based on this, we can define machine learning (ML) as follows −
It may be defined as the field of computer science, more specifically an application of artificial intelligence, which provides computer systems the ability to learn with data and improve from experience without being explicitly programmed.
Basically, the main focus of machine learning is to allow the computers learn automatically without human intervention. Now the question arises that how such learning can be started and done? It can be started with the observations of data. The data can be some examples, instruction or some direct experiences too. Then on the basis of this input, machine makes better decision by looking for some patterns in data.
Types of Machine Learning (ML)
Machine Learning Algorithms helps computer system learn without being explicitly programmed. These algorithms are categorized into supervised or unsupervised. Let us now see a few algorithms −
Supervised machine learning algorithms
This is the most commonly used machine learning algorithm. It is called supervised because the process of algorithm learning from the training dataset can be thought of as a teacher supervising the learning process. In this kind of ML algorithm, the possible outcomes are already known and training data is also labeled with correct answers. It can be understood as follows −
Suppose we have input variables x and an output variable y and we applied an algorithm to learn the mapping function from the input to output such as −
Y = f(x)
Now, the main goal is to approximate the mapping function so well that when we have new input data (x), we can predict the output variable (Y) for that data.
Mainly supervised leaning problems can be divided into the following two kinds of problems −
Classification − A problem is called classification problem when we have the categorized output such as “black”, “teaching”, “non-teaching”, etc.
Regression − A problem is called regression problem when we have the real value output such as “distance”, “kilogram”, etc.
Decision tree, random forest, knn, logistic regression are the examples of supervised machine learning algorithms.
Unsupervised machine learning algorithms
As the name suggests, these kinds of machine learning algorithms do not have any supervisor to provide any sort of guidance. That is why unsupervised machine learning algorithms are closely aligned with what some call true artificial intelligence. It can be understood as follows −
Suppose we have input variable x, then there will be no corresponding output variables as there is in supervised learning algorithms.
In simple words, we can say that in unsupervised learning there will be no correct answer and no teacher for the guidance. Algorithms help to discover interesting patterns in data.
Unsupervised learning problems can be divided into the following two kinds of problem −
Clustering − In clustering problems, we need to discover the inherent groupings in the data. For example, grouping customers by their purchasing behavior.
Association − A problem is called association problem because such kinds of problem require discovering the rules that describe large portions of our data. For example, finding the customers who buy both x and y.
K-means for clustering, Apriori algorithm for association are the examples of unsupervised machine learning algorithms.
Reinforcement machine learning algorithms
These kinds of machine learning algorithms are used very less. These algorithms train the systems to make specific decisions. Basically, the machine is exposed to an environment where it trains itself continually using the trial and error method. These algorithms learn from past experience and tries to capture the best possible knowledge to make accurate decisions. Markov Decision Process is an example of reinforcement machine learning algorithms.
Most Common Machine Learning Algorithms
In this section, we will learn about the most common machine learning algorithms. The algorithms are described below −
Linear Regression
It is one of the most well-known algorithms in statistics and machine learning.
Basic concept − Mainly linear regression is a linear model that assumes a linear relationship between the input variables say x and the single output variable say y. In other words, we can say that y can be calculated from a linear combination of the input variables x. The relationship between variables can be established by fitting a best line.
Types of Linear Regression
Linear regression is of the following two types −
Simple linear regression − A linear regression algorithm is called simple linear regression if it is having only one independent variable.
Multiple linear regression − A linear regression algorithm is called multiple linear regression if it is having more than one independent variable.
Linear regression is mainly used to estimate the real values based on continuous variable(s). For example, the total sale of a shop in a day, based on real values, can be estimated by linear regression.
Logistic Regression
It is a classification algorithm and also known as logit regression.
Mainly logistic regression is a classification algorithm that is used to estimate the discrete values like 0 or 1, true or false, yes or no based on a given set of independent variable. Basically, it predicts the probability hence its output lies in between 0 and 1.
Decision Tree
Decision tree is a supervised learning algorithm that is mostly used for classification problems.
Basically it is a classifier expressed as recursive partition based on the independent variables. Decision tree has nodes which form the rooted tree. Rooted tree is a directed tree with a node called “root”. Root does not have any incoming edges and all the other nodes have one incoming edge. These nodes are called leaves or decision nodes. For example, consider the following decision tree to see whether a person is fit or not.
Support Vector Machine (SVM)
It is used for both classification and regression problems. But mainly it is used for classification problems. The main concept of SVM is to plot each data item as a point in n-dimensional space with the value of each feature being the value of a particular coordinate. Here n would be the features we would have. Following is a simple graphical representation to understand the concept of SVM −
In the above diagram, we have two features hence we first need to plot these two variables in two dimensional space where each point has two co-ordinates, called support vectors. The line splits the data into two different classified groups. This line would be the classifier.
Naïve Bayes
It is also a classification technique. The logic behind this classification technique is to use Bayes theorem for building classifiers. The assumption is that the predictors are independent. In simple words, it assumes that the presence of a particular feature in a class is unrelated to the presence of any other feature. Below is the equation for Bayes theorem −
$$P\left ( \frac{A}{B} \right ) = \frac{P\left ( \frac{B}{A} \right )P\left ( A \right )}{P\left ( B \right )}$$
The Naïve Bayes model is easy to build and particularly useful for large data sets.
K-Nearest Neighbors (KNN)
It is used for both classification and regression of the problems. It is widely used to solve classification problems. The main concept of this algorithm is that it used to store all the available cases and classifies new cases by majority votes of its k neighbors. The case being then assigned to the class which is the most common amongst its K-nearest neighbors, measured by a distance function. The distance function can be Euclidean, Minkowski and Hamming distance. Consider the following to use KNN −
Computationally KNN are expensive than other algorithms used for classification problems.
The normalization of variables needed otherwise higher range variables can bias it.
In KNN, we need to work on pre-processing stage like noise removal.
K-Means Clustering
As the name suggests, it is used to solve the clustering problems. It is basically a type of unsupervised learning. The main logic of K-Means clustering algorithm is to classify the data set through a number of clusters. Follow these steps to form clusters by K-means −
K-means picks k number of points for each cluster known as centroids.
Now each data point forms a cluster with the closest centroids, i.e., k clusters.
Now, it will find the centroids of each cluster based on the existing cluster members.
We need to repeat these steps until convergence occurs.
Random Forest
It is a supervised classification algorithm. The advantage of random forest algorithm is that it can be used for both classification and regression kind of problems. Basically it is the collection of decision trees (i.e., forest) or you can say ensemble of the decision trees. The basic concept of random forest is that each tree gives a classification and the forest chooses the best classifications from them. Followings are the advantages of Random Forest algorithm −
Random forest classifier can be used for both classification and regression tasks.
They can handle the missing values.
It won’t over fit the model even if we have more number of trees in the forest.
We have already studied supervised as well as unsupervised machine learning algorithms. These algorithms require formatted data to start the training process. We must prepare or format data in a certain way so that it can be supplied as an input to ML algorithms.
This chapter focuses on data preparation for machine learning algorithms.
Preprocessing the Data
In our daily life, we deal with lots of data but this data is in raw form. To provide the data as the input of machine learning algorithms, we need to convert it into a meaningful data. That is where data preprocessing comes into picture. In other simple words, we can say that before providing the data to the machine learning algorithms we need to preprocess the data.
Data preprocessing steps
Follow these steps to preprocess the data in Python −
Step 1 − Importing the useful packages − If we are using Python then this would be the first step for converting the data into a certain format, i.e., preprocessing. It can be done as follows −
import numpy as np
import sklearn.preprocessing
Here we have used the following two packages −
NumPy − Basically NumPy is a general purpose array-processing package designed to efficiently manipulate large multi-dimensional arrays of arbitrary records without sacrificing too much speed for small multi-dimensional arrays.
Sklearn.preprocessing − This package provides many common utility functions and transformer classes to change raw feature vectors into a representation that is more suitable for machine learning algorithms.
Step 2 − Defining sample data − After importing the packages, we need to define some sample data so that we can apply preprocessing techniques on that data. We will now define the following sample data −
input_data = np.array([2.1, -1.9, 5.5],
[-1.5, 2.4, 3.5],
[0.5, -7.9, 5.6],
[5.9, 2.3, -5.8])
Step3 − Applying preprocessing technique − In this step, we need to apply any of the preprocessing techniques.
The following section describes the data preprocessing techniques.
Techniques for Data Preprocessing
The techniques for data preprocessing are described below −
Binarization
This is the preprocessing technique which is used when we need to convert our numerical values into Boolean values. We can use an inbuilt method to binarize the input data say by using 0.5 as the threshold value in the following way −
data_binarized = preprocessing.Binarizer(threshold = 0.5).transform(input_data)
print("\nBinarized data:\n", data_binarized)
Now, after running the above code we will get the following output, all the values above 0.5(threshold value) would be converted to 1 and all the values below 0.5 would be converted to 0.
Binarized data
[[ 1. 0. 1.]
[ 0. 1. 1.]
[ 0. 0. 1.]
[ 1. 1. 0.]]
Mean Removal
It is another very common preprocessing technique that is used in machine learning. Basically it is used to eliminate the mean from feature vector so that every feature is centered on zero. We can also remove the bias from the features in the feature vector. For applying mean removal preprocessing technique on the sample data, we can write the Python code shown below. The code will display the Mean and Standard deviation of the input data −
print("Mean = ", input_data.mean(axis = 0))
print("Std deviation = ", input_data.std(axis = 0))
We will get the following output after running the above lines of code −
Mean = [ 1.75 -1.275 2.2]
Std deviation = [ 2.71431391 4.20022321 4.69414529]
Now, the code below will remove the Mean and Standard deviation of the input data −
data_scaled = preprocessing.scale(input_data)
print("Mean =", data_scaled.mean(axis=0))
print("Std deviation =", data_scaled.std(axis = 0))
We will get the following output after running the above lines of code −
Mean = [ 1.11022302e-16 0.00000000e+00 0.00000000e+00]
Std deviation = [ 1. 1. 1.]
Scaling
It is another data preprocessing technique that is used to scale the feature vectors. Scaling of feature vectors is needed because the values of every feature can vary between many random values. In other words we can say that scaling is important because we do not want any feature to be synthetically large or small. With the help of the following Python code, we can do the scaling of our input data, i.e., feature vector −
# Min max scaling
data_scaler_minmax = preprocessing.MinMaxScaler(feature_range=(0,1))
data_scaled_minmax = data_scaler_minmax.fit_transform(input_data)
print ("\nMin max scaled data:\n", data_scaled_minmax)
We will get the following output after running the above lines of code −
Min max scaled data
[ [ 0.48648649 0.58252427 0.99122807]
[ 0. 1. 0.81578947]
[ 0.27027027 0. 1. ]
[ 1. 0. 99029126 0. ]]
Normalization
It is another data preprocessing technique that is used to modify the feature vectors. Such kind of modification is necessary to measure the feature vectors on a common scale. Followings are two types of normalization which can be used in machine learning −
L1 Normalization
It is also referred to as Least Absolute Deviations. This kind of normalization modifies the values so that the sum of the absolute values is always up to 1 in each row. It can be implemented on the input data with the help of the following Python code −
# Normalize data
data_normalized_l1 = preprocessing.normalize(input_data, norm = 'l1')
print("\nL1 normalized data:\n", data_normalized_l1)
The above line of code generates the following output &miuns;
L1 normalized data:
[[ 0.22105263 -0.2 0.57894737]
[ -0.2027027 0.32432432 0.47297297]
[ 0.03571429 -0.56428571 0.4 ]
[ 0.42142857 0.16428571 -0.41428571]]
L2 Normalization
It is also referred to as least squares. This kind of normalization modifies the values so that the sum of the squares is always up to 1 in each row. It can be implemented on the input data with the help of the following Python code −
# Normalize data
data_normalized_l2 = preprocessing.normalize(input_data, norm = 'l2')
print("\nL2 normalized data:\n", data_normalized_l2)
The above line of code will generate the following output −
L2 normalized data:
[[ 0.33946114 -0.30713151 0.88906489]
[ -0.33325106 0.53320169 0.7775858 ]
[ 0.05156558 -0.81473612 0.57753446]
[ 0.68706914 0.26784051 -0.6754239 ]]
Labeling the Data
We already know that data in a certain format is necessary for machine learning algorithms. Another important requirement is that the data must be labelled properly before sending it as the input of machine learning algorithms. For example, if we talk about classification, there are lot of labels on the data. Those labels are in the form of words, numbers, etc. Functions related to machine learning in sklearn expect that the data must have number labels. Hence, if the data is in other form then it must be converted to numbers. This process of transforming the word labels into numerical form is called label encoding.
Label encoding steps
Follow these steps for encoding the data labels in Python −
Step1 − Importing the useful packages
If we are using Python then this would be first step for converting the data into certain format, i.e., preprocessing. It can be done as follows −
import numpy as np
from sklearn import preprocessing
Step 2 − Defining sample labels
After importing the packages, we need to define some sample labels so that we can create and train the label encoder. We will now define the following sample labels −
# Sample input labels
input_labels = ['red','black','red','green','black','yellow','white']
Step 3 − Creating & training of label encoder object
In this step, we need to create the label encoder and train it. The following Python code will help in doing this −
# Creating the label encoder
encoder = preprocessing.LabelEncoder()
encoder.fit(input_labels)
다음은 위의 Python 코드를 실행 한 후의 출력입니다.
LabelEncoder()
Step4 − Checking the performance by encoding random ordered list
이 단계는 무작위 순서 목록을 인코딩하여 성능을 확인하는 데 사용할 수 있습니다. 다음과 같은 Python 코드를 작성하여 동일한 작업을 수행 할 수 있습니다.
# encoding a set of labels
test_labels = ['green','red','black']
encoded_values = encoder.transform(test_labels)
print("\nLabels =", test_labels)
레이블은 다음과 같이 인쇄됩니다.
Labels = ['green', 'red', 'black']
이제 인코딩 된 값 목록을 얻을 수 있습니다. 즉, 다음과 같이 숫자로 변환 된 단어 레이블입니다.
print("Encoded values =", list(encoded_values))
인코딩 된 값은 다음과 같이 인쇄됩니다.
Encoded values = [1, 2, 0]
Step 5 − Checking the performance by decoding a random set of numbers −
이 단계는 임의의 숫자 집합을 디코딩하여 성능을 확인하는 데 사용할 수 있습니다. 다음과 같은 Python 코드를 작성하여 동일한 작업을 수행 할 수 있습니다.
# decoding a set of values
encoded_values = [3,0,4,1]
decoded_list = encoder.inverse_transform(encoded_values)
print("\nEncoded values =", encoded_values)
이제 인코딩 된 값은 다음과 같이 인쇄됩니다.
Encoded values = [3, 0, 4, 1]
print("\nDecoded labels =", list(decoded_list))
이제 디코딩 된 값은 다음과 같이 인쇄됩니다.
Decoded labels = ['white', 'black', 'yellow', 'green']
레이블이있는 v / s 레이블이없는 데이터
레이블이없는 데이터는 주로 세계에서 쉽게 얻을 수있는 자연 또는 인간이 만든 개체의 샘플로 구성됩니다. 여기에는 오디오, 비디오, 사진, 뉴스 기사 등이 포함됩니다.
반면에 레이블이 지정된 데이터는 레이블이 지정되지 않은 데이터 세트를 가져 와서 의미있는 태그 나 레이블 또는 클래스를 사용하여 레이블이 지정되지 않은 데이터의 각 부분을 보강합니다. 예를 들어, 사진이있는 경우 사진의 내용에 따라 라벨을 붙일 수 있습니다. 즉, 소년이나 소녀, 동물 또는 기타 사진입니다. 데이터에 레이블을 지정하려면 레이블이 지정되지 않은 특정 데이터에 대한 인간의 전문 지식이나 판단이 필요합니다.
레이블이 지정되지 않은 데이터가 풍부하고 쉽게 얻을 수있는 시나리오가 많이 있지만 레이블이 지정된 데이터에는 주석을 달려면 사람 / 전문가가 필요한 경우가 많습니다. 준지도 학습은 레이블이 지정된 데이터와 레이블이없는 데이터를 결합하여 더 나은 모델을 구축하려고합니다.
이 장에서는지도 학습 (분류) 구현에 중점을 둘 것입니다.
분류 기술 또는 모델은 관찰 된 값에서 몇 가지 결론을 얻으려고합니다. 분류 문제에는“Black”또는“white”또는“Teaching”및“Non-Teaching”과 같은 분류 된 출력이 있습니다. 분류 모델을 구축하는 동안 데이터 포인트와 해당 레이블이 포함 된 학습 데이터 세트가 필요합니다. 예를 들어 이미지가 자동차인지 여부를 확인하려는 경우입니다. 이를 확인하기 위해 "자동차"와 "자동차 없음"과 관련된 두 가지 클래스가있는 학습 데이터 세트를 작성합니다. 그런 다음 훈련 샘플을 사용하여 모델을 훈련해야합니다. 분류 모델은 주로 얼굴 인식, 스팸 식별 등에 사용됩니다.
Python에서 분류자를 빌드하는 단계
Python으로 분류기를 구축하기 위해 Python 3과 머신 러닝 도구 인 Scikit-learn을 사용할 것입니다. 다음 단계에 따라 Python으로 분류기를 작성하십시오.
1 단계-Scikit-learn 가져 오기
이것은 파이썬에서 분류자를 만드는 첫 번째 단계입니다. 이 단계에서는 Python에서 최고의 기계 학습 모듈 중 하나 인 Scikit-learn이라는 Python 패키지를 설치합니다. 다음 명령은 패키지를 가져 오는 데 도움이됩니다.
Import Sklearn
2 단계-Scikit-learn의 데이터 세트 가져 오기
이 단계에서는 기계 학습 모델에 대한 데이터 세트 작업을 시작할 수 있습니다. 여기에서 우리는the 유방암 위스콘신 진단 데이터베이스. 데이터 세트에는 유방암 종양에 대한 다양한 정보와 분류 라벨이 포함됩니다.malignant 또는 benign. 데이터 세트에는 569 개의 종양에 대한 569 개의 인스턴스 또는 데이터가 있으며 종양의 반경, 질감, 부드러움 및 면적과 같은 30 가지 속성 또는 특징에 대한 정보가 포함됩니다. 다음 명령을 사용하여 Scikit-learn의 유방암 데이터 세트를 가져올 수 있습니다.
from sklearn.datasets import load_breast_cancer
이제 다음 명령이 데이터 세트를로드합니다.
data = load_breast_cancer()
다음은 중요한 사전 키 목록입니다.
- 분류 라벨 이름 (target_names)
- 실제 라벨 (대상)
- 속성 / 기능 이름 (feature_names)
- 속성 (데이터)
이제 다음 명령을 사용하여 중요한 각 정보 집합에 대한 새 변수를 만들고 데이터를 할당 할 수 있습니다. 즉, 다음 명령으로 데이터를 구성 할 수 있습니다.
label_names = data['target_names']
labels = data['target']
feature_names = data['feature_names']
features = data['data']
이제 더 명확하게하기 위해 다음 명령을 사용하여 클래스 레이블, 첫 번째 데이터 인스턴스의 레이블, 기능 이름 및 기능 값을 인쇄 할 수 있습니다.
print(label_names)
위의 명령은 각각 악성 및 양성인 클래스 이름을 인쇄합니다. 다음과 같이 출력됩니다.
['malignant' 'benign']
이제 아래 명령은 이진 값 0과 1로 매핑되었음을 보여줍니다. 여기서 0은 악성 암을 나타내고 1은 양성 암을 나타냅니다. 다음과 같은 출력을 받게됩니다.
print(labels[0])
0
아래에 주어진 두 명령은 기능 이름과 기능 값을 생성합니다.
print(feature_names[0])
mean radius
print(features[0])
[ 1.79900000e+01 1.03800000e+01 1.22800000e+02 1.00100000e+03
1.18400000e-01 2.77600000e-01 3.00100000e-01 1.47100000e-01
2.41900000e-01 7.87100000e-02 1.09500000e+00 9.05300000e-01
8.58900000e+00 1.53400000e+02 6.39900000e-03 4.90400000e-02
5.37300000e-02 1.58700000e-02 3.00300000e-02 6.19300000e-03
2.53800000e+01 1.73300000e+01 1.84600000e+02 2.01900000e+03
1.62200000e-01 6.65600000e-01 7.11900000e-01 2.65400000e-01
4.60100000e-01 1.18900000e-01]
위의 출력에서 첫 번째 데이터 인스턴스는 반경이 1.7990000e + 01 인 악성 종양임을 알 수 있습니다.
3 단계-데이터를 세트로 구성
이 단계에서는 데이터를 훈련 세트와 테스트 세트라는 두 부분으로 나눕니다. 보이지 않는 데이터에 대해 모델을 테스트해야하기 때문에 데이터를 이러한 세트로 분할하는 것은 매우 중요합니다. 데이터를 세트로 분할하기 위해 sklearn에는train_test_split()함수. 다음 명령을 사용하여 이러한 세트의 데이터를 분할 할 수 있습니다.
from sklearn.model_selection import train_test_split
위의 명령은 train_test_splitsklearn의 함수와 아래 명령은 데이터를 훈련 및 테스트 데이터로 분할합니다. 아래 주어진 예에서는 데이터의 40 %를 테스트에 사용하고 나머지 데이터는 모델 학습에 사용합니다.
train, test, train_labels, test_labels = train_test_split(features,labels,test_size = 0.40, random_state = 42)
4 단계-모델 구축
이 단계에서는 모델을 빌드합니다. 모델을 구축하기 위해 Naïve Bayes 알고리즘을 사용할 것입니다. 다음 명령을 사용하여 모델을 구축 할 수 있습니다.
from sklearn.naive_bayes import GaussianNB
위의 명령은 GaussianNB 모듈을 가져옵니다. 이제 다음 명령을 사용하여 모델을 초기화 할 수 있습니다.
gnb = GaussianNB()
gnb.fit ()을 사용하여 모델을 데이터에 피팅하여 훈련시킬 것입니다.
model = gnb.fit(train, train_labels)
5 단계-모델 및 정확도 평가
이 단계에서는 테스트 데이터를 예측하여 모델을 평가할 것입니다. 그런 다음 그 정확성도 알아낼 것입니다. 예측을 위해 predict () 함수를 사용합니다. 다음 명령은이를 수행하는 데 도움이됩니다.
preds = gnb.predict(test)
print(preds)
[1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1
0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0
0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0 1 1 0 0 0 0
0 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0
1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 0 1 1 0 0 1 0 1 1 0
1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0
1 1 0 1 1 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1 1 0 1 1 0 1 1 1 0
1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0 0 1 1 0 1]
위의 일련의 0과 1은 종양 등급 (악성 및 양성)에 대한 예측 값입니다.
이제 두 배열을 비교하여 test_labels 과 preds, 모델의 정확성을 확인할 수 있습니다. 우리는accuracy_score()정확도를 결정하는 기능. 이에 대한 다음 명령을 고려하십시오-
from sklearn.metrics import accuracy_score
print(accuracy_score(test_labels,preds))
0.951754385965
결과는 NaïveBayes 분류 기가 95.17 % 정확하다는 것을 보여줍니다.
이런 식으로 위의 단계를 통해 Python으로 분류자를 빌드 할 수 있습니다.
파이썬으로 분류기 만들기
이 섹션에서는 Python으로 분류자를 빌드하는 방법을 배웁니다.
나이브 베이 즈 분류기
Naïve Bayes는 Bayes 정리를 사용하여 분류기를 구축하는 데 사용되는 분류 기술입니다. 예측 변수가 독립적이라는 가정이 있습니다. 간단히 말해서, 클래스에있는 특정 기능의 존재가 다른 기능의 존재와 관련이 없다고 가정합니다. Naïve Bayes 분류기를 빌드하려면 scikit learn이라는 Python 라이브러리를 사용해야합니다. Naïve Bayes 모델에는 다음과 같은 세 가지 유형이 있습니다.Gaussian, Multinomial and Bernoulli scikit 학습 패키지에서.
Naïve Bayes 기계 학습 분류기 모델을 구축하려면 다음이 필요합니다.
데이터 세트
Breast Cancer Wisconsin Diagnostic Database 라는 데이터 세트를 사용할 것 입니다. 데이터 세트에는 유방암 종양에 대한 다양한 정보와 분류 라벨이 포함됩니다.malignant 또는 benign. 데이터 세트에는 569 개의 종양에 대한 569 개의 인스턴스 또는 데이터가 있으며 종양의 반경, 질감, 부드러움 및 면적과 같은 30 가지 속성 또는 특징에 대한 정보가 포함됩니다. sklearn 패키지에서이 데이터 세트를 가져올 수 있습니다.
나이브 베이 즈 모델
Naïve Bayes 분류기를 구축하려면 Naïve Bayes 모델이 필요합니다. 앞서 말했듯이 세 가지 유형의 Naïve Bayes 모델이 있습니다.Gaussian, Multinomial 과 Bernoulliscikit 학습 패키지에서. 다음 예에서는 Gaussian Naïve Bayes 모델을 사용합니다.
위의 내용을 사용하여 종양 정보를 사용하여 종양이 악성인지 양성인지 예측하는 Naïve Bayes 기계 학습 모델을 구축 할 것입니다.
우선 sklearn 모듈을 설치해야합니다. 다음 명령을 사용하여 수행 할 수 있습니다.
Import Sklearn
이제 Breast Cancer Wisconsin Diagnostic Database라는 데이터 세트를 가져와야합니다.
from sklearn.datasets import load_breast_cancer
이제 다음 명령이 데이터 세트를로드합니다.
data = load_breast_cancer()
데이터는 다음과 같이 구성 할 수 있습니다-
label_names = data['target_names']
labels = data['target']
feature_names = data['feature_names']
features = data['data']
이제 더 명확하게하기 위해 다음 명령을 사용하여 클래스 레이블, 첫 번째 데이터 인스턴스의 레이블, 기능 이름 및 기능 값을 인쇄 할 수 있습니다.
print(label_names)
위의 명령은 각각 악성 및 양성인 클래스 이름을 인쇄합니다. 다음과 같이 출력됩니다.
['malignant' 'benign']
이제 아래의 명령은 이진 값 0과 1에 매핑되어 있음을 보여줍니다. 여기서 0은 악성 암을 나타내고 1은 양성 암을 나타냅니다. 다음과 같이 출력됩니다.
print(labels[0])
0
다음 두 명령은 기능 이름과 기능 값을 생성합니다.
print(feature_names[0])
mean radius
print(features[0])
[ 1.79900000e+01 1.03800000e+01 1.22800000e+02 1.00100000e+03
1.18400000e-01 2.77600000e-01 3.00100000e-01 1.47100000e-01
2.41900000e-01 7.87100000e-02 1.09500000e+00 9.05300000e-01
8.58900000e+00 1.53400000e+02 6.39900000e-03 4.90400000e-02
5.37300000e-02 1.58700000e-02 3.00300000e-02 6.19300000e-03
2.53800000e+01 1.73300000e+01 1.84600000e+02 2.01900000e+03
1.62200000e-01 6.65600000e-01 7.11900000e-01 2.65400000e-01
4.60100000e-01 1.18900000e-01]
위의 출력에서 첫 번째 데이터 인스턴스가 주요 반경이 1.7990000e + 01 인 악성 종양임을 알 수 있습니다.
보이지 않는 데이터에 대한 모델을 테스트하려면 데이터를 훈련 및 테스트 데이터로 분할해야합니다. 다음 코드를 사용하여 수행 할 수 있습니다.
from sklearn.model_selection import train_test_split
위의 명령은 train_test_splitsklearn의 함수와 아래 명령은 데이터를 훈련 및 테스트 데이터로 분할합니다. 아래 예에서는 데이터의 40 %를 테스트에 사용하고 리 마이닝 데이터는 모델 학습에 사용됩니다.
train, test, train_labels, test_labels =
train_test_split(features,labels,test_size = 0.40, random_state = 42)
이제 다음 명령으로 모델을 구축하고 있습니다.
from sklearn.naive_bayes import GaussianNB
위의 명령은 GaussianNB기준 치수. 이제 아래의 명령으로 모델을 초기화해야합니다.
gnb = GaussianNB()
다음을 사용하여 모델을 데이터에 피팅하여 훈련시킬 것입니다. gnb.fit().
model = gnb.fit(train, train_labels)
이제 테스트 데이터를 예측하여 모델을 평가하고 다음과 같이 할 수 있습니다.
preds = gnb.predict(test)
print(preds)
[1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1
0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0
0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0 1 1 0 0 0 0
0 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0
1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 0 1 1 0 0 1 0 1 1 0
1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0
1 1 0 1 1 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1 1 0 1 1 0 1 1 1 0
1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0 0 1 1 0 1]
위의 일련의 0과 1은 종양 클래스 즉 악성 및 양성에 대한 예측 값입니다.
이제 두 배열을 비교하여 test_labels 과 preds, 모델의 정확성을 확인할 수 있습니다. 우리는accuracy_score()정확도를 결정하는 기능. 다음 명령을 고려하십시오-
from sklearn.metrics import accuracy_score
print(accuracy_score(test_labels,preds))
0.951754385965
결과는 NaïveBayes 분류 기가 95.17 % 정확하다는 것을 보여줍니다.
그것은 Naïve Bayse Gaussian 모델을 기반으로 한 기계 학습 분류기였습니다.
서포트 벡터 머신 (SVM)
기본적으로 SVM (Support Vector Machine)은 회귀 및 분류 모두에 사용할 수있는 감독 된 기계 학습 알고리즘입니다. SVM의 주요 개념은 각 데이터 항목을 특정 좌표의 값이되는 각 특성의 값을 사용하여 n 차원 공간의 점으로 플로팅하는 것입니다. 여기서 n은 우리가 가질 수있는 기능입니다. 다음은 SVM의 개념을 이해하기위한 간단한 그래픽 표현입니다.
위의 다이어그램에는 두 가지 기능이 있습니다. 따라서 먼저이 두 변수를 2 차원 공간에 플로팅해야합니다. 여기서 각 점에는 지원 벡터라고하는 두 개의 좌표가 있습니다. 선은 데이터를 두 개의 다른 분류 그룹으로 분할합니다. 이 라인이 분류 자입니다.
여기에서는 scikit-learn 및 iris 데이터 세트를 사용하여 SVM 분류기를 구축 할 것입니다. Scikitlearn 라이브러리에는sklearn.svm모듈 및 분류를 위해 sklearn.svm.svc를 제공합니다. 다음은 4 가지 특징을 기반으로 붓꽃의 등급을 예측하는 SVM 분류기입니다.
데이터 세트
각각 50 개 인스턴스의 3 개 클래스가 포함 된 홍채 데이터 세트를 사용합니다. 여기서 각 클래스는 홍채 식물 유형을 나타냅니다. 각 인스턴스에는 꽃받침 길이, 꽃받침 너비, 꽃잎 길이 및 꽃잎 너비의 네 가지 기능이 있습니다. 다음은 4 가지 특징을 기반으로 붓꽃의 등급을 예측하는 SVM 분류기입니다.
핵심
SVM에서 사용하는 기술입니다. 기본적으로 이것들은 저 차원 입력 공간을 가져다가 고차원 공간으로 변환하는 기능입니다. 분리 할 수없는 문제를 분리 할 수있는 문제로 변환합니다. 커널 함수는 선형, 다항식, rbf 및 시그 모이 드 중 하나 일 수 있습니다. 이 예에서는 선형 커널을 사용합니다.
이제 다음 패키지를 가져 오겠습니다.
import pandas as pd
import numpy as np
from sklearn import svm, datasets
import matplotlib.pyplot as plt
이제 입력 데이터를로드합니다.
iris = datasets.load_iris()
처음 두 가지 기능을 사용합니다.
X = iris.data[:, :2]
y = iris.target
원본 데이터로 서포트 벡터 머신 경계를 플로팅합니다. 플롯 할 메시를 만들고 있습니다.
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
h = (x_max / x_min)/100
xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
np.arange(y_min, y_max, h))
X_plot = np.c_[xx.ravel(), yy.ravel()]
정규화 매개 변수의 값을 제공해야합니다.
C = 1.0
SVM 분류기 객체를 만들어야합니다.
Svc_classifier = svm_classifier.SVC(kernel='linear',
C=C, decision_function_shape = 'ovr').fit(X, y)
Z = svc_classifier.predict(X_plot)
Z = Z.reshape(xx.shape)
plt.figure(figsize = (15, 5))
plt.subplot(121)
plt.contourf(xx, yy, Z, cmap = plt.cm.tab10, alpha = 0.3)
plt.scatter(X[:, 0], X[:, 1], c = y, cmap = plt.cm.Set1)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xx.min(), xx.max())
plt.title('SVC with linear kernel')
로지스틱 회귀
기본적으로 로지스틱 회귀 모델은 감독 분류 알고리즘 제품군의 구성원 중 하나입니다. 로지스틱 회귀는 로지스틱 함수를 사용하여 확률을 추정하여 종속 변수와 독립 변수 간의 관계를 측정합니다.
여기서 종속 변수와 독립 변수에 대해 이야기하면 종속 변수는 우리가 예측할 대상 클래스 변수이고 다른 쪽에서 독립 변수는 대상 클래스를 예측하는 데 사용할 기능입니다.
로지스틱 회귀에서 확률 추정은 이벤트의 발생 가능성을 예측하는 것을 의미합니다. 예를 들어, 상점 주인은 상점에 들어간 고객이 플레이 스테이션 (예 :)을 구매할지 여부를 예측하려고합니다. 고객의 많은 특징이있을 것입니다. 성별, 나이 등 상점 주인은 가능성 발생 가능성, 즉 플레이 스테이션 구매 여부를 예측할 수 있습니다. 로지스틱 함수는 다양한 매개 변수로 함수를 생성하는 데 사용되는 시그 모이 드 곡선입니다.
전제 조건
로지스틱 회귀를 사용하여 분류기를 빌드하기 전에 시스템에 Tkinter 패키지를 설치해야합니다. 다음에서 설치할 수 있습니다.https://docs.python.org/2/library/tkinter.html.
이제 아래 주어진 코드의 도움으로 로지스틱 회귀를 사용하여 분류기를 만들 수 있습니다.
먼저 몇 가지 패키지를 가져옵니다.
import numpy as np
from sklearn import linear_model
import matplotlib.pyplot as plt
이제 다음과 같이 수행 할 수있는 샘플 데이터를 정의해야합니다.
X = np.array([[2, 4.8], [2.9, 4.7], [2.5, 5], [3.2, 5.5], [6, 5], [7.6, 4],
[3.2, 0.9], [2.9, 1.9],[2.4, 3.5], [0.5, 3.4], [1, 4], [0.9, 5.9]])
y = np.array([0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3])
다음으로 로지스틱 회귀 분류기를 생성해야합니다. 다음과 같이 수행 할 수 있습니다.
Classifier_LR = linear_model.LogisticRegression(solver = 'liblinear', C = 75)
마지막으로이 분류기를 훈련시켜야합니다.
Classifier_LR.fit(X, y)
이제 출력을 어떻게 시각화 할 수 있습니까? Logistic_visualize ()라는 함수를 생성하여 수행 할 수 있습니다.
Def Logistic_visualize(Classifier_LR, X, y):
min_x, max_x = X[:, 0].min() - 1.0, X[:, 0].max() + 1.0
min_y, max_y = X[:, 1].min() - 1.0, X[:, 1].max() + 1.0
위의 줄에서 메쉬 그리드에서 사용할 최소값과 최대 값 X와 Y를 정의했습니다. 또한 메쉬 그리드를 플로팅하기위한 단계 크기를 정의합니다.
mesh_step_size = 0.02
다음과 같이 X 및 Y 값의 메쉬 그리드를 정의하겠습니다.
x_vals, y_vals = np.meshgrid(np.arange(min_x, max_x, mesh_step_size),
np.arange(min_y, max_y, mesh_step_size))
다음 코드의 도움으로 메쉬 그리드에서 분류기를 실행할 수 있습니다.
output = classifier.predict(np.c_[x_vals.ravel(), y_vals.ravel()])
output = output.reshape(x_vals.shape)
plt.figure()
plt.pcolormesh(x_vals, y_vals, output, cmap = plt.cm.gray)
plt.scatter(X[:, 0], X[:, 1], c = y, s = 75, edgecolors = 'black',
linewidth=1, cmap = plt.cm.Paired)
다음 코드 줄은 플롯의 경계를 지정합니다.
plt.xlim(x_vals.min(), x_vals.max())
plt.ylim(y_vals.min(), y_vals.max())
plt.xticks((np.arange(int(X[:, 0].min() - 1), int(X[:, 0].max() + 1), 1.0)))
plt.yticks((np.arange(int(X[:, 1].min() - 1), int(X[:, 1].max() + 1), 1.0)))
plt.show()
이제 코드를 실행하면 다음과 같은 로지스틱 회귀 분류 기가 출력됩니다.
의사 결정 트리 분류기
의사 결정 트리는 기본적으로 각 노드가 일부 기능 변수에 따라 관측 그룹을 분할하는 이진 트리 순서도입니다.
여기에서는 남성 또는 여성을 예측하기위한 의사 결정 트리 분류기를 구축하고 있습니다. 19 개의 샘플이있는 매우 작은 데이터 세트를 가져옵니다. 이 샘플은 '높이'와 '머리카락 길이'의 두 가지 특징으로 구성됩니다.
전제 조건
다음 분류기를 구축하려면 pydotplus 과 graphviz. 기본적으로 graphviz는 도트 파일을 사용하여 그래픽을 그리는 도구입니다.pydotplusGraphviz의 Dot 언어에 대한 모듈입니다. 패키지 관리자 또는 pip로 설치할 수 있습니다.
이제 다음 Python 코드를 사용하여 결정 트리 분류기를 만들 수 있습니다.
우선 다음과 같이 중요한 라이브러리를 가져 오겠습니다.
import pydotplus
from sklearn import tree
from sklearn.datasets import load_iris
from sklearn.metrics import classification_report
from sklearn import cross_validation
import collections
이제 다음과 같이 데이터 세트를 제공해야합니다.
X = [[165,19],[175,32],[136,35],[174,65],[141,28],[176,15],[131,32],
[166,6],[128,32],[179,10],[136,34],[186,2],[126,25],[176,28],[112,38],
[169,9],[171,36],[116,25],[196,25]]
Y = ['Man','Woman','Woman','Man','Woman','Man','Woman','Man','Woman',
'Man','Woman','Man','Woman','Woman','Woman','Man','Woman','Woman','Man']
data_feature_names = ['height','length of hair']
X_train, X_test, Y_train, Y_test = cross_validation.train_test_split
(X, Y, test_size=0.40, random_state=5)
데이터 셋을 제공 한 후 다음과 같이 할 수있는 모델을 맞출 필요가 있습니다.
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X,Y)
다음 Python 코드를 사용하여 예측할 수 있습니다.
prediction = clf.predict([[133,37]])
print(prediction)
다음 Python 코드를 사용하여 의사 결정 트리를 시각화 할 수 있습니다.
dot_data = tree.export_graphviz(clf,feature_names = data_feature_names,
out_file = None,filled = True,rounded = True)
graph = pydotplus.graph_from_dot_data(dot_data)
colors = ('orange', 'yellow')
edges = collections.defaultdict(list)
for edge in graph.get_edge_list():
edges[edge.get_source()].append(int(edge.get_destination()))
for edge in edges: edges[edge].sort()
for i in range(2):dest = graph.get_node(str(edges[edge][i]))[0]
dest.set_fillcolor(colors[i])
graph.write_png('Decisiontree16.png')
위 코드에 대한 예측을 다음과 같이 제공합니다. [‘Woman’] 다음 의사 결정 트리를 만듭니다.
예측에서 특성 값을 변경하여 테스트 할 수 있습니다.
랜덤 포레스트 분류기
앙상블 방법은 기계 학습 모델을 더 강력한 기계 학습 모델로 결합하는 방법입니다. 의사 결정 트리 모음 인 Random Forest도 그중 하나입니다. 예측력을 유지하면서 결과를 평균화하여 과적 합을 줄일 수 있기 때문에 단일 의사 결정 트리보다 낫습니다. 여기서는 scikit learn cancer 데이터 셋에 랜덤 포레스트 모델을 구현할 것입니다.
필요한 패키지 가져 오기-
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
import matplotlib.pyplot as plt
import numpy as np
이제 다음과 같이 할 수있는 데이터 셋을 제공해야합니다.
cancer = load_breast_cancer()
X_train, X_test, y_train,
y_test = train_test_split(cancer.data, cancer.target, random_state = 0)
데이터 셋을 제공 한 후 다음과 같이 할 수있는 모델을 맞출 필요가 있습니다.
forest = RandomForestClassifier(n_estimators = 50, random_state = 0)
forest.fit(X_train,y_train)
이제 훈련 및 테스트 하위 집합에 대한 정확도를 얻으십시오. 추정기 수를 늘리면 테스트 하위 집합의 정확도도 높아집니다.
print('Accuracy on the training subset:(:.3f)',format(forest.score(X_train,y_train)))
print('Accuracy on the training subset:(:.3f)',format(forest.score(X_test,y_test)))
산출
Accuracy on the training subset:(:.3f) 1.0
Accuracy on the training subset:(:.3f) 0.965034965034965
이제 의사 결정 트리처럼 랜덤 포레스트는 feature_importance결정 트리보다 기능 가중치에 대한 더 나은보기를 제공하는 모듈입니다. 다음과 같이 플롯하고 시각화 할 수 있습니다.
n_features = cancer.data.shape[1]
plt.barh(range(n_features),forest.feature_importances_, align='center')
plt.yticks(np.arange(n_features),cancer.feature_names)
plt.xlabel('Feature Importance')
plt.ylabel('Feature')
plt.show()
분류기의 성능
기계 학습 알고리즘을 구현 한 후 모델이 얼마나 효과적인지 알아 내야합니다. 효과를 측정하기위한 기준은 데이터 세트와 메트릭을 기반으로 할 수 있습니다. 다른 기계 학습 알고리즘을 평가하기 위해 다른 성능 메트릭을 사용할 수 있습니다. 예를 들어 분류기를 사용하여 서로 다른 객체의 이미지를 구분한다고 가정하면 평균 정확도, AUC 등과 같은 분류 성능 메트릭을 사용할 수 있습니다. 어떤 의미에서 기계 학습 모델을 평가하기 위해 선택한 메트릭은 다음과 같습니다. 메트릭 선택이 기계 학습 알고리즘의 성능을 측정하고 비교하는 방법에 영향을 미치기 때문에 매우 중요합니다. 다음은 몇 가지 메트릭입니다.
혼동 매트릭스
기본적으로 출력이 둘 이상의 클래스 유형일 수있는 분류 문제에 사용됩니다. 분류기의 성능을 측정하는 가장 쉬운 방법입니다. 혼동 행렬은 기본적으로 "실제"및 "예측"이라는 두 차원이있는 테이블입니다. 두 차원 모두 "참 양성 (TP)", "참 음성 (TN)", "거짓 양성 (FP)", "거짓 음수 (FN)"를 갖습니다.
위의 혼동 행렬에서 1은 포지티브 클래스이고 0은 네거티브 클래스입니다.
다음은 혼동 행렬과 관련된 용어입니다.
True Positives − TP는 데이터 포인트의 실제 클래스가 1이고 예측도 1 인 경우입니다.
True Negatives − TN은 데이터 포인트의 실제 클래스가 0이고 예측도 0 인 경우입니다.
False Positives − FP는 데이터 포인트의 실제 클래스가 0이고 예측도 1 인 경우입니다.
False Negatives − FN은 데이터 포인트의 실제 클래스가 1이고 예측 값도 0 인 경우입니다.
정확성
혼동 행렬 자체는 성능 척도가 아니지만 거의 모든 성능 행렬은 혼동 행렬을 기반으로합니다. 그중 하나는 정확성입니다. 분류 문제에서는 모든 종류의 예측에 대해 모델이 만든 올바른 예측의 수로 정의 할 수 있습니다. 정확도를 계산하는 공식은 다음과 같습니다.
$$ Accuracy = \ frac {TP + TN} {TP + FP + FN + TN} $$
정도
주로 문서 검색에 사용됩니다. 반환 된 문서 중 올바른 수로 정의 할 수 있습니다. 다음은 정밀도를 계산하는 공식입니다-
$$ 정밀도 = \ frac {TP} {TP + FP} $$
회상 또는 감도
It may be defined as how many of the positives do the model return. Following is the formula for calculating the recall/sensitivity of the model −
$$Recall = \frac{TP}{TP+FN}$$
Specificity
It may be defined as how many of the negatives do the model return. It is exactly opposite to recall. Following is the formula for calculating the specificity of the model −
$$Specificity = \frac{TN}{TN+FP}$$
Class Imbalance Problem
Class imbalance is the scenario where the number of observations belonging to one class is significantly lower than those belonging to the other classes. For example, this problem is prominent in the scenario where we need to identify the rare diseases, fraudulent transactions in bank etc.
Example of imbalanced classes
Let us consider an example of fraud detection data set to understand the concept of imbalanced class −
Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%
Solution
Balancing the classes’ acts as a solution to imbalanced classes. The main objective of balancing the classes is to either increase the frequency of the minority class or decrease the frequency of the majority class. Following are the approaches to solve the issue of imbalances classes −
Re-Sampling
Re-sampling is a series of methods used to reconstruct the sample data sets − both training sets and testing sets. Re-sampling is done to improve the accuracy of model. Following are some re-sampling techniques −
Random Under-Sampling − This technique aims to balance class distribution by randomly eliminating majority class examples. This is done until the majority and minority class instances are balanced out.
Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%
In this case, we are taking 10% samples without replacement from non-fraud instances and then combine them with the fraud instances −
Non-fraudulent observations after random under sampling = 10% of 4950 = 495
Total observations after combining them with fraudulent observations = 50+495 = 545
Hence now, the event rate for new dataset after under sampling = 9%
The main advantage of this technique is that it can reduce run time and improve storage. But on the other side, it can discard useful information while reducing the number of training data samples.
Random Over-Sampling − This technique aims to balance class distribution by increasing the number of instances in the minority class by replicating them.
Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%
In case we are replicating 50 fraudulent observations 30 times then fraudulent observations after replicating the minority class observations would be 1500. And then total observations in the new data after oversampling would be 4950+1500 = 6450. Hence the event rate for the new data set would be 1500/6450 = 23%.
The main advantage of this method is that there would be no loss of useful information. But on the other hand, it has the increased chances of over-fitting because it replicates the minority class events.
Ensemble Techniques
This methodology basically is used to modify existing classification algorithms to make them appropriate for imbalanced data sets. In this approach we construct several two stage classifier from the original data and then aggregate their predictions. Random forest classifier is an example of ensemble based classifier.
Regression is one of the most important statistical and machine learning tools. We would not be wrong to say that the journey of machine learning starts from regression. It may be defined as the parametric technique that allows us to make decisions based upon data or in other words allows us to make predictions based upon data by learning the relationship between input and output variables. Here, the output variables dependent on the input variables, are continuous-valued real numbers. In regression, the relationship between input and output variables matters and it helps us in understanding how the value of the output variable changes with the change of input variable. Regression is frequently used for prediction of prices, economics, variations, and so on.
Building Regressors in Python
In this section, we will learn how to build single as well as multivariable regressor.
Linear Regressor/Single Variable Regressor
Let us important a few required packages −
import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt
Now, we need to provide the input data and we have saved our data in the file named linear.txt.
input = 'D:/ProgramData/linear.txt'
We need to load this data by using the np.loadtxt function.
input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]
The next step would be to train the model. Let us give training and testing samples.
training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training
X_train, y_train = X[:training_samples], y[:training_samples]
X_test, y_test = X[training_samples:], y[training_samples:]
Now, we need to create a linear regressor object.
reg_linear = linear_model.LinearRegression()
Train the object with the training samples.
reg_linear.fit(X_train, y_train)
We need to do the prediction with the testing data.
y_test_pred = reg_linear.predict(X_test)
Now plot and visualize the data.
plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_test, y_test_pred, color = 'black', linewidth = 2)
plt.xticks(())
plt.yticks(())
plt.show()
Output
Now, we can compute the performance of our linear regression as follows −
print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred),
2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))
Output
Performance of Linear Regressor −
Mean absolute error = 1.78
Mean squared error = 3.89
Median absolute error = 2.01
Explain variance score = -0.09
R2 score = -0.09
In the above code, we have used this small data. If you want some big dataset then you can use sklearn.dataset to import bigger dataset.
2,4.82.9,4.72.5,53.2,5.56,57.6,43.2,0.92.9,1.92.4,
3.50.5,3.41,40.9,5.91.2,2.583.2,5.65.1,1.54.5,
1.22.3,6.32.1,2.8
Multivariable Regressor
First, let us import a few required packages −
import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
Now, we need to provide the input data and we have saved our data in the file named linear.txt.
input = 'D:/ProgramData/Mul_linear.txt'
We will load this data by using the np.loadtxt function.
input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]
The next step would be to train the model; we will give training and testing samples.
training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training
X_train, y_train = X[:training_samples], y[:training_samples]
X_test, y_test = X[training_samples:], y[training_samples:]
Now, we need to create a linear regressor object.
reg_linear_mul = linear_model.LinearRegression()
Train the object with the training samples.
reg_linear_mul.fit(X_train, y_train)
Now, at last we need to do the prediction with the testing data.
y_test_pred = reg_linear_mul.predict(X_test)
print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred), 2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))
Output
Performance of Linear Regressor −
Mean absolute error = 0.6
Mean squared error = 0.65
Median absolute error = 0.41
Explain variance score = 0.34
R2 score = 0.33
Now, we will create a polynomial of degree 10 and train the regressor. We will provide the sample data point.
polynomial = PolynomialFeatures(degree = 10)
X_train_transformed = polynomial.fit_transform(X_train)
datapoint = [[2.23, 1.35, 1.12]]
poly_datapoint = polynomial.fit_transform(datapoint)
poly_linear_model = linear_model.LinearRegression()
poly_linear_model.fit(X_train_transformed, y_train)
print("\nLinear regression:\n", reg_linear_mul.predict(datapoint))
print("\nPolynomial regression:\n", poly_linear_model.predict(poly_datapoint))
Output
Linear regression −
[2.40170462]
Polynomial regression −
[1.8697225]
In the above code, we have used this small data. If you want a big dataset then, you can use sklearn.dataset to import a bigger dataset.
2,4.8,1.2,3.22.9,4.7,1.5,3.62.5,5,2.8,23.2,5.5,3.5,2.16,5,
2,3.27.6,4,1.2,3.23.2,0.9,2.3,1.42.9,1.9,2.3,1.22.4,3.5,
2.8,3.60.5,3.4,1.8,2.91,4,3,2.50.9,5.9,5.6,0.81.2,2.58,
3.45,1.233.2,5.6,2,3.25.1,1.5,1.2,1.34.5,1.2,4.1,2.32.3,
6.3,2.5,3.22.1,2.8,1.2,3.6
In this chapter, we will focus logic programming and how it helps in Artificial Intelligence.
We already know that logic is the study of principles of correct reasoning or in simple words it is the study of what comes after what. For example, if two statements are true then we can infer any third statement from it.
Concept
Logic Programming is the combination of two words, logic and programming. Logic Programming is a programming paradigm in which the problems are expressed as facts and rules by program statements but within a system of formal logic. Just like other programming paradigms like object oriented, functional, declarative, and procedural, etc., it is also a particular way to approach programming.
How to Solve Problems with Logic Programming
Logic Programming uses facts and rules for solving the problem. That is why they are called the building blocks of Logic Programming. A goal needs to be specified for every program in logic programming. To understand how a problem can be solved in logic programming, we need to know about the building blocks − Facts and Rules −
Facts
Actually, every logic program needs facts to work with so that it can achieve the given goal. Facts basically are true statements about the program and data. For example, Delhi is the capital of India.
Rules
Actually, rules are the constraints which allow us to make conclusions about the problem domain. Rules basically written as logical clauses to express various facts. For example, if we are building any game then all the rules must be defined.
Rules are very important to solve any problem in Logic Programming. Rules are basically logical conclusion which can express the facts. Following is the syntax of rule −
A∶− B1,B2,...,Bn.
Here, A is the head and B1, B2, ... Bn is the body.
For example − ancestor(X,Y) :- father(X,Y).
ancestor(X,Z) :- father(X,Y), ancestor(Y,Z).
This can be read as, for every X and Y, if X is the father of Y and Y is an ancestor of Z, X is the ancestor of Z. For every X and Y, X is the ancestor of Z, if X is the father of Y and Y is an ancestor of Z.
Installing Useful Packages
For starting logic programming in Python, we need to install the following two packages −
Kanren
It provides us a way to simplify the way we made code for business logic. It lets us express the logic in terms of rules and facts. The following command will help you install kanren −
pip install kanren
SymPy
SymPy is a Python library for symbolic mathematics. It aims to become a full-featured computer algebra system (CAS) while keeping the code as simple as possible in order to be comprehensible and easily extensible. The following command will help you install SymPy −
pip install sympy
Examples of Logic Programming
Followings are some examples which can be solved by logic programming −
Matching mathematical expressions
Actually we can find the unknown values by using logic programming in a very effective way. The following Python code will help you match a mathematical expression −
다음 패키지를 먼저 가져 오는 것을 고려하십시오.
from kanren import run, var, fact
from kanren.assoccomm import eq_assoccomm as eq
from kanren.assoccomm import commutative, associative
우리가 사용할 수학적 연산을 정의해야합니다.
add = 'add'
mul = 'mul'
덧셈과 곱셈은 모두 의사 소통 과정입니다. 따라서이를 지정해야하며 다음과 같이 수행 할 수 있습니다.
fact(commutative, mul)
fact(commutative, add)
fact(associative, mul)
fact(associative, add)
변수를 정의하는 것은 필수입니다. 이것은 다음과 같이 할 수 있습니다-
a, b = var('a'), var('b')
식을 원래 패턴과 일치시켜야합니다. 기본적으로 (5 + a) * b −
Original_pattern = (mul, (add, 5, a), b)
원래 패턴과 일치하는 다음 두 가지 표현식이 있습니다.
exp1 = (mul, 2, (add, 3, 1))
exp2 = (add,5,(mul,8,1))
출력은 다음 명령으로 인쇄 할 수 있습니다-
print(run(0, (a,b), eq(original_pattern, exp1)))
print(run(0, (a,b), eq(original_pattern, exp2)))
이 코드를 실행하면 다음과 같은 출력이 표시됩니다.
((3,2))
()
첫 번째 출력은 다음에 대한 값을 나타냅니다. a 과 b. 첫 번째 표현식은 원래 패턴과 일치하고 다음에 대한 값을 반환했습니다.a 과 b 그러나 두 번째 표현식은 원래 패턴과 일치하지 않으므로 아무것도 반환되지 않았습니다.
소수 확인
논리 프로그래밍의 도움으로 숫자 목록에서 소수를 찾을 수 있고 소수를 생성 할 수도 있습니다. 아래 주어진 Python 코드는 숫자 목록에서 소수를 찾고 처음 10 개의 소수도 생성합니다.
먼저 다음 패키지를 가져 오는 것을 고려해 보겠습니다.
from kanren import isvar, run, membero
from kanren.core import success, fail, goaleval, condeseq, eq, var
from sympy.ntheory.generate import prime, isprime
import itertools as it
이제 주어진 숫자를 데이터로 사용하여 소수를 확인하는 prime_check라는 함수를 정의합니다.
def prime_check(x):
if isvar(x):
return condeseq([(eq,x,p)] for p in map(prime, it.count(1)))
else:
return success if isprime(x) else fail
이제 사용할 변수를 선언해야합니다.
x = var()
print((set(run(0,x,(membero,x,(12,14,15,19,20,21,22,23,29,30,41,44,52,62,65,85)),
(prime_check,x)))))
print((run(10,x,prime_check(x))))
위 코드의 출력은 다음과 같습니다.
{19, 23, 29, 41}
(2, 3, 5, 7, 11, 13, 17, 19, 23, 29)
퍼즐 풀기
논리 프로그래밍은 8- 퍼즐, Zebra 퍼즐, 스도쿠, N-queen 등과 같은 많은 문제를 해결하는 데 사용할 수 있습니다. 여기에서는 다음과 같은 Zebra 퍼즐 변형의 예를 들어 보겠습니다.
There are five houses.
The English man lives in the red house.
The Swede has a dog.
The Dane drinks tea.
The green house is immediately to the left of the white house.
They drink coffee in the green house.
The man who smokes Pall Mall has birds.
In the yellow house they smoke Dunhill.
In the middle house they drink milk.
The Norwegian lives in the first house.
The man who smokes Blend lives in the house next to the house with cats.
In a house next to the house where they have a horse, they smoke Dunhill.
The man who smokes Blue Master drinks beer.
The German smokes Prince.
The Norwegian lives next to the blue house.
They drink water in a house next to the house where they smoke Blend.
우리는 문제를 해결하고 있습니다 who owns zebra Python의 도움으로.
필요한 패키지를 가져 오겠습니다.
from kanren import *
from kanren.core import lall
import time
이제 두 개의 함수를 정의해야합니다. left() 과 next() 누가 집이 남았는지 옆에 있는지 확인하려면-
def left(q, p, list):
return membero((q,p), zip(list, list[1:]))
def next(q, p, list):
return conde([left(q, p, list)], [left(p, q, list)])
이제 다음과 같이 가변 하우스를 선언합니다.
houses = var()
다음과 같이 lall 패키지의 도움으로 규칙을 정의해야합니다.
5 개의 집이 있습니다-
rules_zebraproblem = lall(
(eq, (var(), var(), var(), var(), var()), houses),
(membero,('Englishman', var(), var(), var(), 'red'), houses),
(membero,('Swede', var(), var(), 'dog', var()), houses),
(membero,('Dane', var(), 'tea', var(), var()), houses),
(left,(var(), var(), var(), var(), 'green'),
(var(), var(), var(), var(), 'white'), houses),
(membero,(var(), var(), 'coffee', var(), 'green'), houses),
(membero,(var(), 'Pall Mall', var(), 'birds', var()), houses),
(membero,(var(), 'Dunhill', var(), var(), 'yellow'), houses),
(eq,(var(), var(), (var(), var(), 'milk', var(), var()), var(), var()), houses),
(eq,(('Norwegian', var(), var(), var(), var()), var(), var(), var(), var()), houses),
(next,(var(), 'Blend', var(), var(), var()),
(var(), var(), var(), 'cats', var()), houses),
(next,(var(), 'Dunhill', var(), var(), var()),
(var(), var(), var(), 'horse', var()), houses),
(membero,(var(), 'Blue Master', 'beer', var(), var()), houses),
(membero,('German', 'Prince', var(), var(), var()), houses),
(next,('Norwegian', var(), var(), var(), var()),
(var(), var(), var(), var(), 'blue'), houses),
(next,(var(), 'Blend', var(), var(), var()),
(var(), var(), 'water', var(), var()), houses),
(membero,(var(), var(), var(), 'zebra', var()), houses)
)
이제 이전 제약 조건으로 솔버를 실행하십시오.
solutions = run(0, houses, rules_zebraproblem)
다음 코드의 도움으로 솔버에서 출력을 추출 할 수 있습니다.
output_zebra = [house for house in solutions[0] if 'zebra' in house][0][0]
다음 코드는 솔루션을 인쇄하는 데 도움이됩니다.
print ('\n'+ output_zebra + 'owns zebra.')
위 코드의 출력은 다음과 같습니다.
German owns zebra.
비지도 기계 학습 알고리즘에는 어떤 종류의 지침도 제공 할 감독자가 없습니다. 그렇기 때문에 그들은 일부 사람들이 진정한 인공 지능이라고 부르는 것과 밀접하게 연관되어 있습니다.
비지도 학습에서는 정답도없고지도를받을 교사도 없습니다. 알고리즘은 학습을 위해 데이터에서 흥미로운 패턴을 발견해야합니다.
클러스터링이란?
기본적으로 비지도 학습 방법의 한 유형이며 많은 분야에서 사용되는 통계 데이터 분석을위한 일반적인 기술입니다. 군집화는 주로 관측 값 집합을 군집이라고하는 하위 집합으로 나누는 작업으로, 동일한 군집의 관측치는 한 가지 의미에서 유사하고 다른 군집의 관측치와 유사하지 않습니다. 간단히 말해서, 클러스터링의 주요 목표는 유사성과 비 유사성을 기준으로 데이터를 그룹화하는 것입니다.
예를 들어, 다음 다이어그램은 서로 다른 클러스터에있는 유사한 종류의 데이터를 보여줍니다.
데이터 클러스터링을위한 알고리즘
다음은 데이터 클러스터링을위한 몇 가지 일반적인 알고리즘입니다.
K- 평균 알고리즘
K- 평균 클러스터링 알고리즘은 데이터를 클러스터링하는 잘 알려진 알고리즘 중 하나입니다. 클러스터의 수가 이미 알려져 있다고 가정해야합니다. 이를 플랫 클러스터링이라고도합니다. 반복적 클러스터링 알고리즘입니다. 이 알고리즘을 위해 아래 주어진 단계를 따라야합니다.
Step 1 − 원하는 K 개의 부분 군 수를 지정해야합니다.
Step 2− 클러스터 수를 수정하고 각 데이터 포인트를 클러스터에 무작위로 할당합니다. 즉, 클러스터 수에 따라 데이터를 분류해야합니다.
이 단계에서는 군집 중심을 계산해야합니다.
이것은 반복 알고리즘이므로 글로벌 최적을 찾을 때까지, 즉 중심이 최적 위치에 도달 할 때까지 매 반복마다 K 중심의 위치를 업데이트해야합니다.
다음 코드는 Python에서 K- 평균 클러스터링 알고리즘을 구현하는 데 도움이됩니다. Scikit-learn 모듈을 사용할 것입니다.
필요한 패키지를 가져 오겠습니다.
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans
다음 코드 줄은 다음을 사용하여 4 개의 blob을 포함하는 2 차원 데이터 세트를 생성하는 데 도움이됩니다. make_blob ~로부터 sklearn.dataset 꾸러미.
from sklearn.datasets.samples_generator import make_blobs
X, y_true = make_blobs(n_samples = 500, centers = 4,
cluster_std = 0.40, random_state = 0)
다음 코드를 사용하여 데이터 세트를 시각화 할 수 있습니다.
plt.scatter(X[:, 0], X[:, 1], s = 50);
plt.show()
여기에서는 클러스터 수 (n_clusters)의 필수 매개 변수를 사용하여 KMeans 알고리즘이되도록 kmeans를 초기화합니다.
kmeans = KMeans(n_clusters = 4)
입력 데이터로 K- 평균 모델을 훈련해야합니다.
kmeans.fit(X)
y_kmeans = kmeans.predict(X)
plt.scatter(X[:, 0], X[:, 1], c = y_kmeans, s = 50, cmap = 'viridis')
centers = kmeans.cluster_centers_
아래에 제공된 코드는 데이터를 기반으로 한 기계의 결과와 발견 할 클러스터 수에 따른 피팅을 플롯하고 시각화하는 데 도움이됩니다.
plt.scatter(centers[:, 0], centers[:, 1], c = 'black', s = 200, alpha = 0.5);
plt.show()
평균 이동 알고리즘
비지도 학습에 사용되는 또 다른 인기 있고 강력한 클러스터링 알고리즘입니다. 어떠한 가정도하지 않으므로 비모수 적 알고리즘입니다. 계층 적 클러스터링 또는 평균 이동 클러스터 분석이라고도합니다. 다음은이 알고리즘의 기본 단계입니다.
우선, 우리는 자체 클러스터에 할당 된 데이터 포인트로 시작해야합니다.
이제 중심을 계산하고 새 중심의 위치를 업데이트합니다.
이 과정을 반복함으로써 우리는 클러스터의 피크, 즉 밀도가 높은 영역으로 더 가깝게 이동합니다.
이 알고리즘은 중심이 더 이상 움직이지 않는 단계에서 멈 춥니 다.
다음 코드의 도움으로 Python에서 Mean Shift 클러스터링 알고리즘을 구현하고 있습니다. Scikit-learn 모듈을 사용할 것입니다.
필요한 패키지를 가져 오겠습니다.
import numpy as np
from sklearn.cluster import MeanShift
import matplotlib.pyplot as plt
from matplotlib import style
style.use("ggplot")
다음 코드는 다음을 사용하여 4 개의 Blob을 포함하는 2 차원 데이터 세트를 생성하는 데 도움이됩니다. make_blob ~로부터 sklearn.dataset 꾸러미.
from sklearn.datasets.samples_generator import make_blobs
다음 코드로 데이터 세트를 시각화 할 수 있습니다.
centers = [[2,2],[4,5],[3,10]]
X, _ = make_blobs(n_samples = 500, centers = centers, cluster_std = 1)
plt.scatter(X[:,0],X[:,1])
plt.show()
이제 입력 데이터를 사용하여 평균 이동 클러스터 모델을 훈련해야합니다.
ms = MeanShift()
ms.fit(X)
labels = ms.labels_
cluster_centers = ms.cluster_centers_
다음 코드는 입력 데이터에 따라 클러스터 센터와 예상 클러스터 수를 인쇄합니다.
print(cluster_centers)
n_clusters_ = len(np.unique(labels))
print("Estimated clusters:", n_clusters_)
[[ 3.23005036 3.84771893]
[ 3.02057451 9.88928991]]
Estimated clusters: 2
아래에 제공된 코드는 데이터를 기반으로 한 기계의 결과와 발견 할 클러스터 수에 따른 피팅을 플롯하고 시각화하는 데 도움이됩니다.
colors = 10*['r.','g.','b.','c.','k.','y.','m.']
for i in range(len(X)):
plt.plot(X[i][0], X[i][1], colors[labels[i]], markersize = 10)
plt.scatter(cluster_centers[:,0],cluster_centers[:,1],
marker = "x",color = 'k', s = 150, linewidths = 5, zorder = 10)
plt.show()
클러스터링 성능 측정
실제 데이터는 고유 한 클러스터 수로 자연스럽게 구성되지 않습니다. 이러한 이유로 추론을 시각화하고 도출하는 것은 쉽지 않습니다. 그렇기 때문에 클러스터링 성능과 품질을 측정해야합니다. 실루엣 분석의 도움으로 수행 할 수 있습니다.
실루엣 분석
이 방법은 클러스터 간의 거리를 측정하여 클러스터링의 품질을 확인하는 데 사용할 수 있습니다. 기본적으로 실루엣 점수를 제공하여 군집 수와 같은 매개 변수를 평가하는 방법을 제공합니다. 이 점수는 한 클러스터의 각 포인트가 인접 클러스터의 포인트에 얼마나 가까운지를 측정하는 메트릭입니다.
실루엣 점수 분석
점수 범위는 [-1, 1]입니다. 다음은이 점수의 분석입니다-
Score of +1 − +1에 가까운 점수는 샘플이 인접 클러스터에서 멀리 떨어져 있음을 나타냅니다.
Score of 0 − 점수 0은 샘플이 인접한 두 군집 사이의 결정 경계에 있거나 매우 가깝다는 것을 나타냅니다.
Score of -1 − 음수 점수는 샘플이 잘못된 클러스터에 할당되었음을 나타냅니다.
실루엣 점수 계산
이 섹션에서는 실루엣 점수를 계산하는 방법을 배웁니다.
실루엣 점수는 다음 공식을 사용하여 계산할 수 있습니다.
$$ 실루엣 점수 = \ frac {\ left (pq \ right)} {max \ left (p, q \ right)} $$
여기서는 데이터 포인트가 속하지 않는 가장 가까운 군집의 포인트까지의 평균 거리입니다. 그리고는 자체 군집의 모든 점에 대한 평균 군집 내 거리입니다.
최적의 클러스터 수를 찾으려면 다음을 가져 와서 클러스터링 알고리즘을 다시 실행해야합니다. metrics 모듈에서 sklearn꾸러미. 다음 예에서는 최적의 클러스터 수를 찾기 위해 K- 평균 클러스터링 알고리즘을 실행합니다.
그림과 같이 필요한 패키지를 가져옵니다.
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np
from sklearn.cluster import KMeans
다음 코드를 사용하여 다음을 사용하여 4 개의 blob을 포함하는 2 차원 데이터 세트를 생성합니다. make_blob ~로부터 sklearn.dataset 꾸러미.
from sklearn.datasets.samples_generator import make_blobs
X, y_true = make_blobs(n_samples = 500, centers = 4, cluster_std = 0.40, random_state = 0)
다음과 같이 변수를 초기화하십시오-
scores = []
values = np.arange(2, 10)
모든 값을 통해 K- 평균 모델을 반복하고 입력 데이터로 훈련해야합니다.
for num_clusters in values:
kmeans = KMeans(init = 'k-means++', n_clusters = num_clusters, n_init = 10)
kmeans.fit(X)
이제 유클리드 거리 측정법을 사용하여 현재 클러스터링 모델의 실루엣 점수를 추정합니다.
score = metrics.silhouette_score(X, kmeans.labels_,
metric = 'euclidean', sample_size = len(X))
다음 코드 줄은 클러스터 수와 실루엣 점수를 표시하는 데 도움이됩니다.
print("\nNumber of clusters =", num_clusters)
print("Silhouette score =", score)
scores.append(score)
다음과 같은 출력을 받게됩니다.
Number of clusters = 9
Silhouette score = 0.340391138371
num_clusters = np.argmax(scores) + values[0]
print('\nOptimal number of clusters =', num_clusters)
이제 최적의 클러스터 수에 대한 출력은 다음과 같습니다.
Optimal number of clusters = 2
가장 가까운 이웃 찾기
영화 추천 시스템과 같은 추천 시스템을 구축하려면 가장 가까운 이웃을 찾는 개념을 이해해야합니다. 추천 시스템이 가장 가까운 이웃의 개념을 활용하기 때문입니다.
그만큼 concept of finding nearest neighbors주어진 데이터 셋에서 입력 포인트에 가장 가까운 포인트를 찾는 과정으로 정의 될 수 있습니다. 이 KNN) K- 최근 접 이웃) 알고리즘의 주요 용도는 다양한 클래스에 대한 입력 데이터 포인트의 근접성에 대한 데이터 포인트를 분류하는 분류 시스템을 구축하는 것입니다.
아래 주어진 Python 코드는 주어진 데이터 세트의 K- 최근 접 이웃을 찾는 데 도움이됩니다.
아래와 같이 필요한 패키지를 가져옵니다. 여기에서 우리는NearestNeighbors 모듈에서 sklearn 꾸러미
import numpy as np
import matplotlib.pyplot as plt
from sklearn.neighbors import NearestNeighbors
이제 입력 데이터를 정의하겠습니다.
A = np.array([[3.1, 2.3], [2.3, 4.2], [3.9, 3.5], [3.7, 6.4], [4.8, 1.9],
[8.3, 3.1], [5.2, 7.5], [4.8, 4.7], [3.5, 5.1], [4.4, 2.9],])
이제 가장 가까운 이웃을 정의해야합니다.
k = 3
또한 가장 가까운 이웃을 찾을 수있는 테스트 데이터를 제공해야합니다.
test_data = [3.3, 2.9]
다음 코드는 우리가 정의한 입력 데이터를 시각화하고 플로팅 할 수 있습니다.
plt.figure()
plt.title('Input data')
plt.scatter(A[:,0], A[:,1], marker = 'o', s = 100, color = 'black')
이제 K Nearest Neighbor를 구축해야합니다. 개체도 훈련해야합니다.
knn_model = NearestNeighbors(n_neighbors = k, algorithm = 'auto').fit(X)
distances, indices = knn_model.kneighbors([test_data])
이제 다음과 같이 K 개의 최근 접 이웃을 인쇄 할 수 있습니다.
print("\nK Nearest Neighbors:")
for rank, index in enumerate(indices[0][:k], start = 1):
print(str(rank) + " is", A[index])
테스트 데이터 포인트와 함께 가장 가까운 이웃을 시각화 할 수 있습니다.
plt.figure()
plt.title('Nearest neighbors')
plt.scatter(A[:, 0], X[:, 1], marker = 'o', s = 100, color = 'k')
plt.scatter(A[indices][0][:][:, 0], A[indices][0][:][:, 1],
marker = 'o', s = 250, color = 'k', facecolors = 'none')
plt.scatter(test_data[0], test_data[1],
marker = 'x', s = 100, color = 'k')
plt.show()
산출
K Nearest Neighbors
1 is [ 3.1 2.3]
2 is [ 3.9 3.5]
3 is [ 4.4 2.9]
K-Nearest Neighbors 분류기
KNN (K-Nearest Neighbors) 분류기는 최근 접 이웃 알고리즘을 사용하여 주어진 데이터 포인트를 분류하는 분류 모델입니다. 마지막 섹션에서 KNN 알고리즘을 구현 했으므로 이제 해당 알고리즘을 사용하여 KNN 분류기를 구축 할 것입니다.
KNN 분류기의 개념
K- 최근 접 이웃 분류의 기본 개념은 분류되어야하는 새로운 샘플에 가장 가까운 훈련 샘플의 사전 정의 된 수, 즉 'k'를 찾는 것입니다. 새 샘플은 이웃 자체에서 라벨을받습니다. KNN 분류기에는 결정해야하는 이웃 수에 대해 고정 된 사용자 정의 상수가 있습니다. 거리의 경우 표준 유클리드 거리가 가장 일반적인 선택입니다. KNN 분류기는 학습 규칙을 만드는 대신 학습 된 샘플에서 직접 작동합니다. KNN 알고리즘은 모든 기계 학습 알고리즘 중 가장 간단한 것입니다. 문자 인식 또는 이미지 분석과 같은 수많은 분류 및 회귀 문제에서 상당히 성공적이었습니다.
Example
우리는 숫자를 인식하기 위해 KNN 분류기를 만들고 있습니다. 이를 위해 MNIST 데이터 세트를 사용합니다. 이 코드를 Jupyter Notebook에 작성합니다.
아래와 같이 필요한 패키지를 가져옵니다.
여기서 우리는 KNeighborsClassifier 모듈에서 sklearn.neighbors 패키지 −
from sklearn.datasets import *
import pandas as pd
%matplotlib inline
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
import numpy as np
다음 코드는 우리가 테스트해야 할 이미지를 확인하기 위해 숫자 이미지를 표시합니다.
def Image_display(i):
plt.imshow(digit['images'][i],cmap = 'Greys_r')
plt.show()
이제 MNIST 데이터 셋을로드해야합니다. 실제로 총 1797 개의 이미지가 있지만 처음 1600 개의 이미지를 학습 샘플로 사용하고 나머지 197 개는 테스트 목적으로 보관됩니다.
digit = load_digits()
digit_d = pd.DataFrame(digit['data'][0:1600])
이제 이미지를 표시 할 때 다음과 같이 출력을 볼 수 있습니다.
Image_display(0)
이미지 _ 디스플레이 (0)
0의 이미지는 다음과 같이 표시됩니다-
이미지 _ 디스플레이 (9)
9의 이미지는 다음과 같이 표시됩니다-
digit.keys ()
이제 훈련 및 테스트 데이터 세트를 생성하고 KNN 분류기에 테스트 데이터 세트를 제공해야합니다.
train_x = digit['data'][:1600]
train_y = digit['target'][:1600]
KNN = KNeighborsClassifier(20)
KNN.fit(train_x,train_y)
다음 출력은 K 가장 가까운 이웃 분류 자 생성자를 생성합니다-
KNeighborsClassifier(algorithm = 'auto', leaf_size = 30, metric = 'minkowski',
metric_params = None, n_jobs = 1, n_neighbors = 20, p = 2,
weights = 'uniform')
훈련 샘플 인 1600보다 큰 임의의 숫자를 제공하여 테스트 샘플을 만들어야합니다.
test = np.array(digit['data'][1725])
test1 = test.reshape(1,-1)
Image_display(1725)
이미지 _ 디스플레이 (6)
6의 이미지는 다음과 같이 표시됩니다-
이제 다음과 같이 테스트 데이터를 예측합니다.
KNN.predict(test1)
위의 코드는 다음 출력을 생성합니다.
array([6])
이제 다음을 고려하십시오.
digit['target_names']
위의 코드는 다음 출력을 생성합니다.
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
NLP (Natural Language Processing)는 영어와 같은 자연어를 사용하여 지능형 시스템과 통신하는 AI 방식을 말합니다.
자연어 처리는 로봇과 같은 지능형 시스템이 지침에 따라 수행되기를 원할 때, 대화 기반 임상 전문가 시스템의 결정을 듣고 싶을 때 필요합니다.
NLP 분야는 인간이 사용하는 자연어를 사용하여 컴퓨터가 유용한 작업을 수행하도록하는 것입니다. NLP 시스템의 입력과 출력은 다음과 같습니다.
- Speech
- 서면 텍스트
NLP의 구성 요소
이 섹션에서는 NLP의 다양한 구성 요소에 대해 알아 봅니다. NLP에는 두 가지 구성 요소가 있습니다. 구성 요소는 아래에 설명되어 있습니다.
자연어 이해 (NLU)
그것은 다음과 같은 작업을 포함합니다-
자연어로 주어진 입력을 유용한 표현으로 매핑합니다.
언어의 다양한 측면을 분석합니다.
자연어 생성 (NLG)
내부 표현에서 자연어 형태로 의미있는 구와 문장을 만드는 과정입니다. 그것은 포함합니다-
Text planning − 여기에는 지식 기반에서 관련 콘텐츠 검색이 포함됩니다.
Sentence planning − 여기에는 필요한 단어 선택, 의미있는 구문 형성, 문장 어조 설정이 포함됩니다.
Text Realization − 이것은 문장 계획을 문장 구조로 매핑하는 것입니다.
NLU의 어려움
NLU는 형태와 구조가 매우 풍부합니다. 그러나 모호합니다. 다양한 수준의 모호성이있을 수 있습니다.
어휘 모호성
그것은 단어 수준과 같은 매우 원시적 인 수준에 있습니다. 예를 들어, "보드"라는 단어를 명사 나 동사로 취급합니까?
구문 수준 모호성
문장은 다양한 방식으로 구문 분석 할 수 있습니다. 예를 들어,“빨간 모자로 딱정벌레를 들어 올렸습니다.” − 그는 딱정벌레를 들어 올리기 위해 모자를 사용 했습니까, 아니면 빨간 모자가 달린 딱정벌레를 들어 올렸습니까?
참조 모호성
대명사를 사용하는 것을 언급합니다. 예를 들어, Rima는 Gauri에 갔다. 그녀는“나는 피곤하다”고 말했다. − 정확히 누가 피곤합니까?
NLP 용어
이제 NLP 용어에서 몇 가지 중요한 용어를 살펴 보겠습니다.
Phonology − 체계적으로 소리를 정리하는 연구입니다.
Morphology − 원시 의미 단위의 단어 구성에 대한 연구입니다.
Morpheme − 언어에서 의미의 원시 단위입니다.
Syntax− 문장을 만들기 위해 단어를 배열하는 것을 말합니다. 또한 문장과 구에서 단어의 구조적 역할을 결정합니다.
Semantics − 단어의 의미와 단어를 의미있는 구문과 문장으로 결합하는 방법과 관련이 있습니다.
Pragmatics − 다양한 상황에서 문장을 사용하고 이해하며 문장의 해석에 미치는 영향을 다룹니다.
Discourse − 직전 문장이 다음 문장의 해석에 미치는 영향을 다룹니다.
World Knowledge − 여기에는 세계에 대한 일반적인 지식이 포함됩니다.
NLP의 단계
이 섹션에서는 NLP의 여러 단계를 보여줍니다.
어휘 분석
그것은 단어의 구조를 확인하고 분석하는 것을 포함합니다. 언어 사전은 언어의 단어와 구의 모음을 의미합니다. 어휘 분석은 전체 txt 청크를 단락, 문장 및 단어로 나누는 것입니다.
구문 분석 (파싱)
그것은 문법을 위해 문장의 단어를 분석하고 단어 간의 관계를 보여주는 방식으로 단어를 배열하는 것입니다. “The school goes to boy”와 같은 문장은 영어 구문 분석기에서 거부됩니다.
의미 분석
텍스트에서 정확한 의미 또는 사전 적 의미를 그립니다. 텍스트의 의미를 확인합니다. 태스크 도메인에서 구문 구조와 개체를 매핑하여 수행됩니다. 시맨틱 분석기는“hot ice-cream”과 같은 문장을 무시합니다.
담화 통합
모든 문장의 의미는 바로 앞에있는 문장의 의미에 따라 다릅니다. 또한 바로 다음 문장의 의미도 가져옵니다.
실용적 분석
이 과정에서 말한 내용은 실제로 의미하는 바를 재 해석합니다. 실제 지식이 필요한 언어의 측면을 도출하는 것이 포함됩니다.
이 장에서는 Natural Language Toolkit 패키지를 시작하는 방법을 배웁니다.
전제 조건
자연어 처리를 사용하여 애플리케이션을 빌드하려는 경우 컨텍스트의 변경으로 인해 가장 어렵습니다. 문맥 요인은 기계가 특정 문장을 이해하는 방법에 영향을줍니다. 따라서 기계가 인간이 컨텍스트를 이해할 수있는 방식을 이해할 수 있도록 기계 학습 접근 방식을 사용하여 자연어 응용 프로그램을 개발해야합니다.
이러한 애플리케이션을 구축하기 위해 NLTK (Natural Language Toolkit Package)라는 Python 패키지를 사용합니다.
NLTK 가져 오기
사용하기 전에 NLTK를 설치해야합니다. 다음 명령을 사용하여 설치할 수 있습니다.
pip install nltk
NLTK 용 conda 패키지를 빌드하려면 다음 명령을 사용하십시오.
conda install -c anaconda nltk
이제 NLTK 패키지를 설치 한 후 파이썬 명령 프롬프트를 통해 가져와야합니다. Python 명령 프롬프트에서 다음 명령을 작성하여 가져올 수 있습니다.
>>> import nltk
NLTK의 데이터 다운로드
이제 NLTK를 가져온 후 필요한 데이터를 다운로드해야합니다. Python 명령 프롬프트에서 다음 명령을 사용하여 수행 할 수 있습니다.
>>> nltk.download()
기타 필요한 패키지 설치
NLTK를 사용하여 자연어 처리 응용 프로그램을 빌드하려면 필요한 패키지를 설치해야합니다. 패키지는 다음과 같습니다-
Gensim
많은 애플리케이션에 유용한 강력한 시맨틱 모델링 라이브러리입니다. 다음 명령을 실행하여 설치할 수 있습니다.
pip install gensim
무늬
그것은 만드는 데 사용됩니다 gensim패키지가 제대로 작동합니다. 다음 명령을 실행하여 설치할 수 있습니다.
pip install pattern
토큰 화, 형태소 분석 및 기본형 화의 개념
이 섹션에서는 토큰 화, 형태소 분석 및 lemmatization이 무엇인지 이해합니다.
토큰 화
주어진 텍스트, 즉 문자 시퀀스를 토큰이라고하는 작은 단위로 나누는 프로세스로 정의 할 수 있습니다. 토큰은 단어, 숫자 또는 구두점 일 수 있습니다. 단어 분할이라고도합니다. 다음은 토큰 화의 간단한 예입니다.
Input − 망고, 바나나, 파인애플, 사과는 모두 과일입니다.
Output −
주어진 텍스트를 나누는 과정은 단어 경계를 찾는 도움으로 수행 할 수 있습니다. 단어의 끝과 새 단어의 시작을 단어 경계라고합니다. 글자 체계와 단어의 인쇄 구조가 경계에 영향을줍니다.
Python NLTK 모듈에는 요구 사항에 따라 텍스트를 토큰으로 나누는 데 사용할 수있는 토큰 화와 관련된 다양한 패키지가 있습니다. 패키지 중 일부는 다음과 같습니다-
sent_tokenize 패키지
이름에서 알 수 있듯이이 패키지는 입력 텍스트를 문장으로 나눕니다. 다음 Python 코드를 사용하여이 패키지를 가져올 수 있습니다.
from nltk.tokenize import sent_tokenize
word_tokenize 패키지
이 패키지는 입력 텍스트를 단어로 나눕니다. 다음 Python 코드를 사용하여이 패키지를 가져올 수 있습니다.
from nltk.tokenize import word_tokenize
WordPunctTokenizer 패키지
이 패키지는 입력 텍스트를 구두점과 함께 단어로 나눕니다. 다음 Python 코드를 사용하여이 패키지를 가져올 수 있습니다.
from nltk.tokenize import WordPuncttokenizer
어간
단어로 작업하는 동안 문법적인 이유로 많은 변형을 발견합니다. 여기서 변형의 개념은 우리가 같은 단어의 다른 형태를 다뤄야 함을 의미합니다.democracy, democratic, 과 democratization. 기계는 이러한 다른 단어가 동일한 기본 형식을 가지고 있음을 이해하는 것이 매우 필요합니다. 이런 식으로 텍스트를 분석하는 동안 단어의 기본 형태를 추출하는 것이 유용 할 것입니다.
형태소 분석을 통해이를 달성 할 수 있습니다. 이런 식으로 형태소 분석은 단어 끝을 잘라내어 단어의 기본 형태를 추출하는 휴리스틱 프로세스라고 말할 수 있습니다.
Python NLTK 모듈에는 형태소 분석과 관련된 다양한 패키지가 있습니다. 이러한 패키지는 단어의 기본 형식을 가져 오는 데 사용할 수 있습니다. 이 패키지는 알고리즘을 사용합니다. 패키지 중 일부는 다음과 같습니다-
PorterStemmer 패키지
이 Python 패키지는 Porter의 알고리즘을 사용하여 기본 양식을 추출합니다. 다음 Python 코드를 사용하여이 패키지를 가져올 수 있습니다.
from nltk.stem.porter import PorterStemmer
예를 들어, 우리가 ‘writing’ 이 형태소 분석기에 대한 입력으로 우리는 ‘write’ 형태소 분석 후.
LancasterStemmer 패키지
이 Python 패키지는 Lancaster의 알고리즘을 사용하여 기본 양식을 추출합니다. 다음 Python 코드를 사용하여이 패키지를 가져올 수 있습니다.
from nltk.stem.lancaster import LancasterStemmer
예를 들어, 우리가 ‘writing’ 이 형태소 분석기에 대한 입력으로 우리는 ‘write’ 형태소 분석 후.
SnowballStemmer 패키지
이 Python 패키지는 snowball의 알고리즘을 사용하여 기본 양식을 추출합니다. 다음 Python 코드를 사용하여이 패키지를 가져올 수 있습니다.
from nltk.stem.snowball import SnowballStemmer
예를 들어, 우리가 ‘writing’ 이 형태소 분석기에 대한 입력으로 우리는 ‘write’ 형태소 분석 후.
이 모든 알고리즘은 서로 다른 수준의 엄격함을 가지고 있습니다. 이 세 가지 형태소 분석기를 비교하면 Porter 형태소 분석기가 가장 덜 엄격하고 Lancaster가 가장 엄격합니다. Snowball 형태소 분석기는 속도와 엄격 성 측면에서 사용하기에 좋습니다.
주형 화
우리는 또한 lemmatization에 의해 단어의 기본 형태를 추출 할 수 있습니다. 기본적으로 어휘 및 단어의 형태 학적 분석을 사용하여이 작업을 수행하며 일반적으로 어미 만 제거하는 것을 목표로합니다. 이러한 종류의 기본 형태를 기본형이라고합니다.
형태소 분석과 lemmatization의 주요 차이점은 단어의 어휘 및 형태 학적 분석을 사용하는 것입니다. 또 다른 차이점은 형태소 분석은 가장 일반적으로 파생적으로 관련된 단어를 축소하는 반면, lemmatization은 일반적으로 보조 형의 다양한 굴절 형태 만 축소한다는 것입니다. 예를 들어, saw라는 단어를 입력 단어로 제공하면 형태소 분석은 단어 's'를 반환 할 수 있지만 lemmatization은 토큰 사용이 동사인지 명사인지에 따라 see 또는 saw라는 단어를 반환하려고 시도합니다.
Python NLTK 모듈에는 단어의 기본 형식을 가져 오는 데 사용할 수있는 lemmatization 프로세스와 관련된 다음 패키지가 있습니다.
WordNetLemmatizer 패키지
이 Python 패키지는 단어가 명사로 사용되는지 동사로 사용되는지에 따라 단어의 기본 형식을 추출합니다. 다음 Python 코드를 사용하여이 패키지를 가져올 수 있습니다.
from nltk.stem import WordNetLemmatizer
청킹 : 데이터를 청크로 나누기
자연어 처리에서 중요한 프로세스 중 하나입니다. 청킹의 주요 작업은 품사 및 명사구와 같은 짧은 구를 식별하는 것입니다. 우리는 이미 토큰 화 과정, 토큰 생성 과정을 연구했습니다. 청킹은 기본적으로 해당 토큰의 라벨링입니다. 즉, 청킹은 문장의 구조를 보여줍니다.
다음 섹션에서는 다양한 유형의 청킹에 대해 알아 봅니다.
청크 유형
청킹에는 두 가지 유형이 있습니다. 유형은 다음과 같습니다-
청킹
이 청크 과정에서 객체, 사물 등은 더 일반적으로 이동하고 언어는 더 추상적이됩니다. 더 많은 합의 가능성이 있습니다. 이 과정에서 축소합니다. 예를 들어, "자동차는 어떤 목적을 위해"라는 질문을 정리한다면? 우리는“운송”이라는 답을 얻을 수 있습니다.
아래로 청킹
이 청크 과정에서 사물, 사물 등이 더 구체적으로 이동하고 언어가 더 침투합니다. 더 깊은 구조는 chunking down에서 조사 될 것입니다. 이 과정에서 우리는 확대합니다. 예를 들어 "자동차에 대해 구체적으로 말하십시오"라는 질문을 쪼개면? 우리는 차에 대한 작은 정보를 얻을 것입니다.
Example
이 예제에서, 우리는 파이썬에서 NLTK 모듈을 사용하여 문장에서 명사구 청크를 찾을 청킹 범주 인 명사구 청킹을 수행 할 것입니다.
Follow these steps in python for implementing noun phrase chunking −
Step 1−이 단계에서는 청킹에 대한 문법을 정의해야합니다. 그것은 우리가 따라야 할 규칙들로 구성 될 것입니다.
Step 2−이 단계에서는 청크 파서를 생성해야합니다. 문법을 구문 분석하고 출력을 제공합니다.
Step 3 −이 마지막 단계에서 출력은 트리 형식으로 생성됩니다.
다음과 같이 필요한 NLTK 패키지를 가져 오겠습니다.
import nltk
이제 문장을 정의해야합니다. 여기서 DT는 행렬식, VBP는 동사, JJ는 형용사, IN은 전치사, NN은 명사를 의미합니다.
sentence=[("a","DT"),("clever","JJ"),("fox","NN"),("was","VBP"),
("jumping","VBP"),("over","IN"),("the","DT"),("wall","NN")]
이제 문법을 알려줘야합니다. 여기서는 정규 표현식의 형태로 문법을 제공합니다.
grammar = "NP:{<DT>?<JJ>*<NN>}"
문법을 파싱 할 파서를 정의해야합니다.
parser_chunking = nltk.RegexpParser(grammar)
파서는 다음과 같이 문장을 구문 분석합니다.
parser_chunking.parse(sentence)
다음으로 출력을 얻어야합니다. 출력은 다음과 같은 단순 변수에서 생성됩니다.output_chunk.
Output_chunk = parser_chunking.parse(sentence)
다음 코드를 실행하면 출력을 트리 형태로 그릴 수 있습니다.
output.draw()
Bag of Word (BoW) 모델
자연어 처리 모델 인 Bag of Word (BoW)는 기본적으로 텍스트에서 특징을 추출하는 데 사용되므로 텍스트를 기계 학습 알고리즘과 같은 모델링에 사용할 수 있습니다.
이제 텍스트에서 특징을 추출해야하는 이유에 대한 의문이 생깁니다. 기계 학습 알고리즘은 원시 데이터로 작업 할 수없고 의미있는 정보를 추출 할 수 있도록 숫자 데이터가 필요하기 때문입니다. 텍스트 데이터를 숫자 데이터로 변환하는 것을 특징 추출 또는 특징 인코딩이라고합니다.
작동 원리
이것은 텍스트에서 특징을 추출하는 매우 간단한 접근 방식입니다. 우리가 텍스트 문서를 가지고 있고 그것을 숫자 데이터로 변환하거나 그것에서 특징을 추출하고 싶다고 말하고 싶다고 가정 해 봅시다. 그리고 나서 모든이 모델은 문서의 모든 단어에서 어휘를 추출합니다. 그런 다음 문서 용어 매트릭스를 사용하여 모델을 구축합니다. 이런 식으로 BoW는 문서를 단어 모음으로 만 표현합니다. 문서에서 단어의 순서 또는 구조에 대한 정보는 삭제됩니다.
문서 용어 매트릭스의 개념
BoW 알고리즘은 문서 용어 매트릭스를 사용하여 모델을 구축합니다. 이름에서 알 수 있듯이 문서 용어 행렬은 문서에서 발생하는 다양한 단어 수의 행렬입니다. 이 매트릭스의 도움으로 텍스트 문서는 다양한 단어의 가중치 조합으로 표현 될 수 있습니다. 임계 값을 설정하고 더 의미있는 단어를 선택하여 특성 벡터로 사용할 수있는 문서의 모든 단어에 대한 히스토그램을 작성할 수 있습니다. 다음은 문서 용어 매트릭스의 개념을 이해하는 예입니다.
Example
다음 두 문장이 있다고 가정합니다.
Sentence 1 − Bag of Words 모델을 사용하고 있습니다.
Sentence 2 − Bag of Words 모델은 특징 추출에 사용됩니다.
이제이 두 문장을 고려하면 다음과 같은 13 개의 별개 단어가 있습니다
- we
- are
- using
- the
- bag
- of
- words
- model
- is
- used
- for
- extracting
- features
이제 각 문장의 단어 수를 사용하여 각 문장에 대한 히스토그램을 구축해야합니다.
Sentence 1 − [1,1,1,1,1,1,1,1,0,0,0,0,0]
Sentence 2 − [0,0,0,1,1,1,1,1,1,1,1,1,1]
이런 식으로 추출 된 특징 벡터가 있습니다. 각 특징 벡터는 13 개의 고유 한 단어가 있기 때문에 13 차원입니다.
통계의 개념
통계의 개념을 tf-idf (TermFrequency-Inverse Document Frequency)라고합니다. 문서에서 모든 단어는 중요합니다. 통계는 모든 단어의 중요성을 이해하는 데 도움이됩니다.
기간 주파수 (tf)
문서에서 각 단어가 얼마나 자주 나타나는지 측정합니다. 각 단어의 수를 주어진 문서의 총 단어 수로 나누어 얻을 수 있습니다.
역 문서 빈도 (idf)
주어진 문서 세트에서이 문서에 대해 단어가 얼마나 고유한지에 대한 척도입니다. idf를 계산하고 고유 한 특징 벡터를 공식화하려면 the와 같이 일반적으로 발생하는 단어의 가중치를 줄이고 희귀 한 단어의 가중치를 높여야합니다.
NLTK에서 Bag of Words 모델 구축
이 섹션에서는 CountVectorizer를 사용하여 이러한 문장에서 벡터를 생성하여 문자열 모음을 정의합니다.
필요한 패키지를 가져 오자-
from sklearn.feature_extraction.text import CountVectorizer
이제 문장 세트를 정의하십시오.
Sentences = ['We are using the Bag of Word model', 'Bag of Word model is
used for extracting the features.']
vectorizer_count = CountVectorizer()
features_text = vectorizer.fit_transform(Sentences).todense()
print(vectorizer.vocabulary_)
위 프로그램은 아래와 같이 출력을 생성합니다. 위의 두 문장에 13 개의 다른 단어가 있음을 보여줍니다.
{'we': 11, 'are': 0, 'using': 10, 'the': 8, 'bag': 1, 'of': 7,
'word': 12, 'model': 6, 'is': 5, 'used': 9, 'for': 4, 'extracting': 2, 'features': 3}
기계 학습에 사용할 수있는 특성 벡터 (텍스트에서 숫자 형식)입니다.
문제 해결
이 섹션에서는 몇 가지 관련 문제를 해결합니다.
카테고리 예측
문서 세트에서는 단어뿐만 아니라 단어의 범주도 중요합니다. 특정 단어가 속하는 텍스트 범주. 예를 들어 주어진 문장이 이메일, 뉴스, 스포츠, 컴퓨터 등 카테고리에 속하는지 여부를 예측하려고합니다. 다음 예에서는 tf-idf를 사용하여 문서 카테고리를 찾기위한 특징 벡터를 공식화 할 것입니다. sklearn의 20 개 뉴스 그룹 데이터 세트의 데이터를 사용합니다.
필요한 패키지를 가져와야합니다.
from sklearn.datasets import fetch_20newsgroups
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.feature_extraction.text import CountVectorizer
카테고리 맵을 정의하십시오. 우리는 종교, 자동차, 스포츠, 전자 및 우주라는 다섯 가지 범주를 사용하고 있습니다.
category_map = {'talk.religion.misc':'Religion','rec.autos''Autos',
'rec.sport.hockey':'Hockey','sci.electronics':'Electronics', 'sci.space': 'Space'}
훈련 세트 만들기-
training_data = fetch_20newsgroups(subset = 'train',
categories = category_map.keys(), shuffle = True, random_state = 5)
카운트 벡터 라이저를 구축하고 항 카운트를 추출합니다.
vectorizer_count = CountVectorizer()
train_tc = vectorizer_count.fit_transform(training_data.data)
print("\nDimensions of training data:", train_tc.shape)
tf-idf 변환기는 다음과 같이 생성됩니다.
tfidf = TfidfTransformer()
train_tfidf = tfidf.fit_transform(train_tc)
이제 테스트 데이터를 정의하십시오.
input_data = [
'Discovery was a space shuttle',
'Hindu, Christian, Sikh all are religions',
'We must have to drive safely',
'Puck is a disk made of rubber',
'Television, Microwave, Refrigrated all uses electricity'
]
위의 데이터는 다항식 Naive Bayes 분류기를 학습하는 데 도움이됩니다.
classifier = MultinomialNB().fit(train_tfidf, training_data.target)
카운트 벡터 라이저를 사용하여 입력 데이터를 변환-
input_tc = vectorizer_count.transform(input_data)
이제 tfidf 변환기를 사용하여 벡터화 된 데이터를 변환합니다.
input_tfidf = tfidf.transform(input_tc)
출력 범주를 예측합니다.
predictions = classifier.predict(input_tfidf)
출력은 다음과 같이 생성됩니다.
for sent, category in zip(input_data, predictions):
print('\nInput Data:', sent, '\n Category:', \
category_map[training_data.target_names[category]])
카테고리 예측기는 다음 출력을 생성합니다.
Dimensions of training data: (2755, 39297)
Input Data: Discovery was a space shuttle
Category: Space
Input Data: Hindu, Christian, Sikh all are religions
Category: Religion
Input Data: We must have to drive safely
Category: Autos
Input Data: Puck is a disk made of rubber
Category: Hockey
Input Data: Television, Microwave, Refrigrated all uses electricity
Category: Electronics
성별 찾기
이 문제 설명에서 분류자는 이름을 제공하여 성별 (남성 또는 여성)을 찾도록 훈련됩니다. 특징 벡터를 구성하고 분류기를 훈련하기 위해 휴리스틱을 사용해야합니다. 우리는 scikit-learn 패키지의 레이블이 지정된 데이터를 사용할 것입니다. 다음은 성별 찾기를 빌드하는 Python 코드입니다.
필요한 패키지를 가져 오겠습니다.
import random
from nltk import NaiveBayesClassifier
from nltk.classify import accuracy as nltk_accuracy
from nltk.corpus import names
이제 입력 단어에서 마지막 N 개의 문자를 추출해야합니다. 이 편지는 기능으로 작동합니다-
def extract_features(word, N = 2):
last_n_letters = word[-N:]
return {'feature': last_n_letters.lower()}
if __name__=='__main__':
NLTK에서 사용할 수있는 레이블이 지정된 이름 (남성 및 여성)을 사용하여 훈련 데이터 생성-
male_list = [(name, 'male') for name in names.words('male.txt')]
female_list = [(name, 'female') for name in names.words('female.txt')]
data = (male_list + female_list)
random.seed(5)
random.shuffle(data)
이제 테스트 데이터는 다음과 같이 생성됩니다.
namesInput = ['Rajesh', 'Gaurav', 'Swati', 'Shubha']
다음 코드를 사용하여 학습 및 테스트에 사용되는 샘플 수를 정의합니다.
train_sample = int(0.8 * len(data))
이제 정확도를 비교할 수 있도록 다른 길이를 반복해야합니다.
for i in range(1, 6):
print('\nNumber of end letters:', i)
features = [(extract_features(n, i), gender) for (n, gender) in data]
train_data, test_data = features[:train_sample],
features[train_sample:]
classifier = NaiveBayesClassifier.train(train_data)
분류기의 정확도는 다음과 같이 계산할 수 있습니다.
accuracy_classifier = round(100 * nltk_accuracy(classifier, test_data), 2)
print('Accuracy = ' + str(accuracy_classifier) + '%')
이제 출력을 예측할 수 있습니다.
for name in namesInput:
print(name, '==>', classifier.classify(extract_features(name, i)))
위의 프로그램은 다음 출력을 생성합니다-
Number of end letters: 1
Accuracy = 74.7%
Rajesh -> female
Gaurav -> male
Swati -> female
Shubha -> female
Number of end letters: 2
Accuracy = 78.79%
Rajesh -> male
Gaurav -> male
Swati -> female
Shubha -> female
Number of end letters: 3
Accuracy = 77.22%
Rajesh -> male
Gaurav -> female
Swati -> female
Shubha -> female
Number of end letters: 4
Accuracy = 69.98%
Rajesh -> female
Gaurav -> female
Swati -> female
Shubha -> female
Number of end letters: 5
Accuracy = 64.63%
Rajesh -> female
Gaurav -> female
Swati -> female
Shubha -> female
위의 출력에서 최대 끝 문자 수의 정확도는 2이고 끝 문자 수가 증가함에 따라 감소하는 것을 볼 수 있습니다.
주제 모델링 : 텍스트 데이터에서 패턴 식별
우리는 일반적으로 문서가 주제별로 그룹화된다는 것을 알고 있습니다. 때로는 특정 주제에 해당하는 텍스트의 패턴을 식별해야합니다. 이를 수행하는 기술을 주제 모델링이라고합니다. 즉, 주제 모델링은 주어진 문서 세트에서 추상적 인 주제 또는 숨겨진 구조를 발견하는 기술이라고 말할 수 있습니다.
다음 시나리오에서 주제 모델링 기법을 사용할 수 있습니다.
텍스트 분류
주제 모델링의 도움으로 각 단어를 기능으로 개별적으로 사용하는 대신 유사한 단어를 함께 그룹화하므로 분류가 향상 될 수 있습니다.
추천 시스템
주제 모델링의 도움으로 유사성 측정을 사용하여 추천 시스템을 구축 할 수 있습니다.
주제 모델링을위한 알고리즘
토픽 모델링은 알고리즘을 사용하여 구현할 수 있습니다. 알고리즘은 다음과 같습니다-
잠재 디리클레 할당 (LDA)
이 알고리즘은 주제 모델링에 가장 많이 사용됩니다. 주제 모델링을 구현하기 위해 확률 적 그래픽 모델을 사용합니다. LDA slgorithm을 사용하려면 Python에서 gensim 패키지를 가져와야합니다.
LDA (Latent Semantic Analysis) 또는 LSI (Latent Semantic Indexing)
이 알고리즘은 선형 대수를 기반으로합니다. 기본적으로 문서 용어 매트릭스에서 SVD (Singular Value Decomposition) 개념을 사용합니다.
NMF (Non-Negative Matrix Factorization)
또한 선형 대수를 기반으로합니다.
위에서 언급 한 토픽 모델링을위한 모든 알고리즘은 number of topics 매개 변수로 Document-Word Matrix 입력으로 WTM (Word Topic Matrix) & TDM (Topic Document Matrix) 출력으로.
주어진 입력 시퀀스에서 다음을 예측하는 것은 기계 학습에서 또 다른 중요한 개념입니다. 이 장에서는 시계열 데이터 분석에 대한 자세한 설명을 제공합니다.
소개
시계열 데이터는 일련의 특정 시간 간격에있는 데이터를 의미합니다. 기계 학습에서 시퀀스 예측을 구축하려면 순차적 인 데이터와 시간을 처리해야합니다. 시리즈 데이터는 순차적 데이터의 추상입니다. 데이터 순서는 순차 데이터의 중요한 기능입니다.
시퀀스 분석 또는 시계열 분석의 기본 개념
시퀀스 분석 또는 시계열 분석은 이전에 관찰 된 내용을 기반으로 주어진 입력 시퀀스에서 다음 항목을 예측하는 것입니다. 예측은 다음에 올 수있는 모든 것이 될 수 있습니다 : 기호, 숫자, 다음 날 날씨, 다음 연설 용어 등. 시퀀스 분석은 주식 시장 분석, 일기 예보 및 제품 추천과 같은 애플리케이션에서 매우 편리 할 수 있습니다.
Example
시퀀스 예측을 이해하려면 다음 예제를 고려하십시오. 여기A,B,C,D 주어진 값이고 값을 예측해야합니다. E 시퀀스 예측 모델을 사용합니다.
유용한 패키지 설치
Python을 사용한 시계열 데이터 분석을 위해 다음 패키지를 설치해야합니다.
판다
Pandas는 Python을위한 고성능 데이터 구조 사용 및 데이터 분석 도구를 제공하는 오픈 소스 BSD 라이선스 라이브러리입니다. 다음 명령을 사용하여 Pandas를 설치할 수 있습니다.
pip install pandas
Anaconda를 사용 중이고 다음을 사용하여 설치하려는 경우 conda 패키지 관리자, 다음 명령을 사용할 수 있습니다-
conda install -c anaconda pandas
hmmlearn
Python에서 HMM (Hidden Markov Models)을 학습하기위한 간단한 알고리즘과 모델로 구성된 오픈 소스 BSD 라이선스 라이브러리입니다. 다음 명령을 사용하여 설치할 수 있습니다.
pip install hmmlearn
Anaconda를 사용 중이고 다음을 사용하여 설치하려는 경우 conda 패키지 관리자, 다음 명령을 사용할 수 있습니다-
conda install -c omnia hmmlearn
PyStruct
구조화 된 학습 및 예측 라이브러리입니다. PyStruct에서 구현 된 학습 알고리즘에는 조건부 랜덤 필드 (CRF), 최대 마진 마코프 랜덤 네트워크 (M3N) 또는 구조적 지원 벡터 머신과 같은 이름이 있습니다. 다음 명령을 사용하여 설치할 수 있습니다.
pip install pystruct
CVXOPT
파이썬 프로그래밍 언어를 기반으로 볼록 최적화에 사용됩니다. 또한 무료 소프트웨어 패키지입니다. 다음 명령을 사용하여 설치할 수 있습니다-
pip install cvxopt
Anaconda를 사용 중이고 다음을 사용하여 설치하려는 경우 conda 패키지 관리자, 다음 명령을 사용할 수 있습니다-
conda install -c anaconda cvdoxt
Pandas : 시계열 데이터에서 통계 처리, 분할 및 추출
Pandas는 시계열 데이터로 작업해야하는 경우 매우 유용한 도구입니다. Pandas의 도움으로 다음을 수행 할 수 있습니다.
다음을 사용하여 날짜 범위를 만듭니다. pd.date_range 꾸러미
다음을 사용하여 날짜가있는 판다 색인 pd.Series 꾸러미
다음을 사용하여 재 샘플링을 수행합니다. ts.resample 꾸러미
주파수 변경
예
다음 예제는 Pandas를 사용하여 시계열 데이터를 처리하고 분할하는 방법을 보여줍니다. 여기서는 Monthly Arctic Oscillation 데이터를 사용하고 있습니다.이 데이터는 월간 .ao.index.b50.current.ascii 에서 다운로드 할 수 있으며 사용을 위해 텍스트 형식으로 변환 할 수 있습니다.
시계열 데이터 처리
시계열 데이터를 처리하려면 다음 단계를 수행해야합니다.
첫 번째 단계는 다음 패키지를 가져 오는 것입니다.
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
다음으로, 아래 주어진 코드와 같이 입력 파일에서 데이터를 읽는 함수를 정의하십시오.
def read_data(input_file):
input_data = np.loadtxt(input_file, delimiter = None)
이제이 데이터를 시계열로 변환합니다. 이를 위해 시계열의 날짜 범위를 만듭니다. 이 예에서는 데이터 빈도로 한 달을 유지합니다. 파일에는 1950 년 1 월부터 시작되는 데이터가 있습니다.
dates = pd.date_range('1950-01', periods = input_data.shape[0], freq = 'M')
이 단계에서는 아래와 같이 Pandas Series의 도움으로 시계열 데이터를 생성합니다.
output = pd.Series(input_data[:, index], index = dates)
return output
if __name__=='__main__':
여기에 표시된대로 입력 파일의 경로를 입력하십시오-
input_file = "/Users/admin/AO.txt"
이제 여기에 표시된대로 열을 timeseries 형식으로 변환하십시오.
timeseries = read_data(input_file)
마지막으로 표시된 명령을 사용하여 데이터를 플로팅하고 시각화합니다.
plt.figure()
timeseries.plot()
plt.show()
다음 이미지와 같이 플롯을 관찰합니다.
시계열 데이터 슬라이스
슬라이싱에는 시계열 데이터의 일부만 검색하는 작업이 포함됩니다. 예제의 일부로 1980 년부터 1990 년까지만 데이터를 분할합니다.이 작업을 수행하는 다음 코드를 살펴보십시오.
timeseries['1980':'1990'].plot()
<matplotlib.axes._subplots.AxesSubplot at 0xa0e4b00>
plt.show()
시계열 데이터를 분할하는 코드를 실행하면 여기 이미지와 같이 다음 그래프를 볼 수 있습니다.
시계열 데이터에서 통계 추출
중요한 결론을 도출해야하는 경우 주어진 데이터에서 일부 통계를 추출해야합니다. 평균, 분산, 상관, 최대 값 및 최소값이 이러한 통계의 일부입니다. 주어진 시계열 데이터에서 이러한 통계를 추출하려면 다음 코드를 사용할 수 있습니다.
평균
사용할 수 있습니다 mean() 평균을 구하기위한 함수
timeseries.mean()
그런 다음 논의 된 예에서 관찰 할 출력은 다음과 같습니다.
-0.11143128165238671
최고
사용할 수 있습니다 max() 최대 값을 찾기위한 함수
timeseries.max()
그런 다음 논의 된 예에서 관찰 할 출력은 다음과 같습니다.
3.4952999999999999
최저한의
min () 함수를 사용하여 최소값을 찾을 수 있습니다.
timeseries.min()
그런 다음 논의 된 예에서 관찰 할 출력은 다음과 같습니다.
-4.2656999999999998
한 번에 모든 것을 얻기
한 번에 모든 통계를 계산하려면 다음을 사용할 수 있습니다. describe() 여기에 표시된 기능-
timeseries.describe()
그런 다음 논의 된 예에서 관찰 할 출력은 다음과 같습니다.
count 817.000000
mean -0.111431
std 1.003151
min -4.265700
25% -0.649430
50% -0.042744
75% 0.475720
max 3.495300
dtype: float64
재 샘플링
데이터를 다른 시간 빈도로 리샘플링 할 수 있습니다. 리샘플링을 수행하는 두 가지 매개 변수는 다음과 같습니다.
- 기간
- Method
mean ()을 사용한 재 샘플링
다음 코드를 사용하여 기본 방법 인 mean () 방법으로 데이터를 다시 샘플링 할 수 있습니다.
timeseries_mm = timeseries.resample("A").mean()
timeseries_mm.plot(style = 'g--')
plt.show()
그런 다음 mean ()을 사용한 리샘플링의 출력으로 다음 그래프를 볼 수 있습니다.
median ()을 사용한 재 샘플링
다음 코드를 사용하여 데이터를 다시 샘플링 할 수 있습니다. median()방법-
timeseries_mm = timeseries.resample("A").median()
timeseries_mm.plot()
plt.show()
그런 다음 median ()을 사용한 리샘플링의 출력으로 다음 그래프를 볼 수 있습니다.
롤링 평균
다음 코드를 사용하여 롤링 (이동) 평균을 계산할 수 있습니다.
timeseries.rolling(window = 12, center = False).mean().plot(style = '-g')
plt.show()
그런 다음 롤링 (이동) 평균의 출력으로 다음 그래프를 볼 수 있습니다.
은닉 마르코프 모델 (HMM)에 의한 순차 데이터 분석
HMM은 시계열 주식 시장 분석, 건강 검진, 음성 인식 등 연속성과 확장 성이있는 데이터에 널리 사용되는 통계 모델입니다. 이 섹션에서는 HMM (Hidden Markov Model)을 사용한 순차 데이터 분석에 대해 자세히 다룹니다.
은닉 마르코프 모델 (HMM)
HMM은 미래 통계의 확률이 이전 상태가 아닌 현재 프로세스 상태에만 의존한다는 가정을 바탕으로 Markov 체인의 개념을 기반으로 구축 된 확률 모델입니다. 예를 들어 동전을 던질 때 다섯 번째 던지기의 결과가 앞면이라고 말할 수 없습니다. 코인에는 메모리가없고 다음 결과는 이전 결과에 의존하지 않기 때문입니다.
수학적으로 HMM은 다음 변수로 구성됩니다.
주 (S)
HMM에 존재하는 숨겨진 상태 또는 잠재 상태의 집합입니다. S로 표시됩니다.
출력 기호 (O)
HMM에있는 가능한 출력 기호 세트입니다. O로 표시됩니다.
상태 전이 확률 매트릭스 (A)
한 상태에서 다른 상태로 전환 할 확률입니다. A로 표시됩니다.
관측 방출 확률 매트릭스 (B)
특정 상태에서 심볼을 방출 / 관찰 할 확률입니다. B로 표시됩니다.
사전 확률 행렬 (Π)
시스템의 다양한 상태에서 특정 상태에서 시작할 확률입니다. Π로 표시됩니다.
따라서 HMM은 다음과 같이 정의 할 수 있습니다. = (S,O,A,B,),
어디,
- S = {s1,s2,…,sN} N 개의 가능한 상태의 집합입니다.
- O = {o1,o2,…,oM} M 개의 가능한 관측 기호 세트입니다.
- A는 NN 상태 전이 확률 매트릭스 (TPM),
- B는 NM 관찰 또는 EPM (Emission Probability Matrix),
- π는 N 차원 초기 상태 확률 분포 벡터입니다.
예 : 주식 시장 데이터 분석
이 예에서는 주식 시장의 데이터를 단계별로 분석하여 HMM이 순차 또는 시계열 데이터로 작동하는 방식에 대한 아이디어를 얻을 것입니다. 이 예제는 Python으로 구현하고 있습니다.
아래와 같이 필요한 패키지를 가져옵니다.
import datetime
import warnings
이제 주식 시장 데이터를 사용하십시오. matpotlib.finance 여기에 표시된대로 패키지-
import numpy as np
from matplotlib import cm, pyplot as plt
from matplotlib.dates import YearLocator, MonthLocator
try:
from matplotlib.finance import quotes_historical_yahoo_och1
except ImportError:
from matplotlib.finance import (
quotes_historical_yahoo as quotes_historical_yahoo_och1)
from hmmlearn.hmm import GaussianHMM
시작 날짜와 종료 날짜, 즉 여기에 표시된 두 특정 날짜 사이의 데이터를로드합니다.
start_date = datetime.date(1995, 10, 10)
end_date = datetime.date(2015, 4, 25)
quotes = quotes_historical_yahoo_och1('INTC', start_date, end_date)
이 단계에서는 매일 닫는 따옴표를 추출합니다. 이를 위해 다음 명령을 사용하십시오-
closing_quotes = np.array([quote[2] for quote in quotes])
이제 우리는 매일 거래되는 주식의 양을 추출 할 것입니다. 이를 위해 다음 명령을 사용하십시오-
volumes = np.array([quote[5] for quote in quotes])[1:]
여기에서 아래 표시된 코드를 사용하여 종가의 백분율 차이를 가져옵니다.
diff_percentages = 100.0 * np.diff(closing_quotes) / closing_quotes[:-]
dates = np.array([quote[0] for quote in quotes], dtype = np.int)[1:]
training_data = np.column_stack([diff_percentages, volumes])
이 단계에서는 Gaussian HMM을 만들고 훈련시킵니다. 이를 위해 다음 코드를 사용하십시오-
hmm = GaussianHMM(n_components = 7, covariance_type = 'diag', n_iter = 1000)
with warnings.catch_warnings():
warnings.simplefilter('ignore')
hmm.fit(training_data)
이제 표시된 명령을 사용하여 HMM 모델을 사용하여 데이터를 생성합니다.
num_samples = 300
samples, _ = hmm.sample(num_samples)
마지막으로,이 단계에서 우리는 그래프 형태로 출력으로 거래되는 주식의 차이 비율과 볼륨을 플로팅하고 시각화합니다.
다음 코드를 사용하여 차이 백분율을 플로팅하고 시각화하십시오.
plt.figure()
plt.title('Difference percentages')
plt.plot(np.arange(num_samples), samples[:, 0], c = 'black')
다음 코드를 사용하여 거래 된 주식의 양을 플롯하고 시각화하십시오.
plt.figure()
plt.title('Volume of shares')
plt.plot(np.arange(num_samples), samples[:, 1], c = 'black')
plt.ylim(ymin = 0)
plt.show()
이 장에서는 Python에서 AI를 사용한 음성 인식에 대해 알아 봅니다.
말은 성인 인간 의사 소통의 가장 기본적인 수단입니다. 음성 처리의 기본 목표는 사람과 기계 간의 상호 작용을 제공하는 것입니다.
음성 처리 시스템에는 주로 세 가지 작업이 있습니다.
First, 기계가 우리가 말하는 단어, 구 및 문장을 포착 할 수있는 음성 인식
Second, 기계가 우리가 말하는 것을 이해할 수 있도록 자연어 처리
Third, 기계가 말할 수 있도록 음성 합성.
이 장에서는 speech recognition, 인간이 말하는 단어를 이해하는 과정. 음성 신호는 마이크의 도움으로 캡처되며 시스템에서이를 이해해야합니다.
음성 인식기 구축
음성 인식 또는 자동 음성 인식 (ASR)은 로봇 공학과 같은 AI 프로젝트의 관심의 중심입니다. ASR 없이는 인간과 상호 작용하는인지 로봇을 상상할 수 없습니다. 그러나 음성 인식기를 구축하는 것은 쉽지 않습니다.
음성 인식 시스템 개발의 어려움
고품질 음성 인식 시스템을 개발하는 것은 정말 어려운 문제입니다. 음성 인식 기술의 난이도는 아래에서 논의되는 여러 차원에 따라 광범위하게 특성화 될 수 있습니다.
Size of the vocabulary− 어휘의 크기는 ASR 개발의 용이성에 영향을 미칩니다. 더 나은 이해를 위해 다음 크기의 어휘를 고려하십시오.
작은 크기의 어휘는 음성 메뉴 시스템에서와 같이 2-100 개의 단어로 구성됩니다.
중간 크기의 어휘는 예를 들어 데이터베이스 검색 작업에서와 같이 수백에서 1,000 개의 단어로 구성됩니다.
큰 크기의 어휘는 일반적인 받아쓰기 작업에서와 같이 10,000 개의 단어로 구성됩니다.
Channel characteristics− 채널 품질도 중요한 차원입니다. 예를 들어, 사람의 음성은 전체 주파수 범위의 높은 대역폭을 포함하는 반면 전화 음성은 제한된 주파수 범위의 낮은 대역폭으로 구성됩니다. 후자의 경우 더 어렵습니다.
Speaking mode− ASR 개발의 용이성은 말하기 모드, 즉 음성이 격리 된 단어 모드인지, 연결된 단어 모드인지 또는 연속 음성 모드인지 여부에 따라 달라집니다. 연속 연설은 인식하기가 더 어렵습니다.
Speaking style− 읽기 연설은 형식적인 스타일이거나 캐주얼 한 스타일로 자연스럽게 대화 할 수 있습니다. 후자는 인식하기가 더 어렵습니다.
Speaker dependency− 말하기는 화자 의존적, 화자 적응 형 또는 화자 독립적 일 수 있습니다. 독립적 인 스피커는 구축하기 가장 어렵습니다.
Type of noise− 소음은 ASR을 개발할 때 고려해야 할 또 다른 요소입니다. 신호 대 잡음비는 배경 잡음이 적거나 많을 때 관찰되는 음향 환경에 따라 다양한 범위에있을 수 있습니다.
신호 대 잡음비가 30dB보다 크면 높은 범위로 간주됩니다.
신호 대 잡음비가 30dB에서 10db 사이이면 중간 SNR로 간주됩니다.
신호 대 잡음비가 10dB 미만이면 낮은 범위로 간주됩니다.
Microphone characteristics− 마이크 품질이 양호하거나 평균적이거나 평균 이하일 수 있습니다. 또한 입과 마이크 사이의 거리가 다를 수 있습니다. 인식 시스템에서도 이러한 요소를 고려해야합니다.
어휘의 크기가 클수록 인식을 수행하기가 더 어려워집니다.
예를 들어, 고정 된 소음, 사람이 아닌 소음, 배경 음성 및 다른 화자의 누화와 같은 배경 소음 유형도 문제의 어려움에 기여합니다.
이러한 어려움에도 불구하고 연구원들은 음성 신호, 화자 이해 및 악센트 식별과 같은 음성의 다양한 측면에서 많은 작업을 수행했습니다.
음성 인식기를 구축하려면 아래 단계를 따라야합니다.
오디오 신호 시각화-파일에서 읽기 및 작업
이것은 음성 인식 시스템을 구축하는 첫 번째 단계로, 오디오 신호의 구조를 이해하는 데 도움이됩니다. 오디오 신호 작업을 위해 따라야하는 몇 가지 일반적인 단계는 다음과 같습니다.
녹음
파일에서 오디오 신호를 읽어야 할 때 먼저 마이크를 사용하여 녹음하십시오.
견본 추출
마이크를 사용하여 녹음 할 때 신호는 디지털 형식으로 저장됩니다. 그러나 그것을 처리하기 위해 기계는 불연속 숫자 형태로 그것들을 필요로합니다. 따라서 특정 주파수에서 샘플링을 수행하고 신호를 이산 숫자 형식으로 변환해야합니다. 샘플링을 위해 고주파수를 선택한다는 것은 사람이 신호를들을 때 연속적인 오디오 신호로 느끼는 것을 의미합니다.
예
다음 예제는 파일에 저장된 Python을 사용하여 오디오 신호를 분석하는 단계적 접근 방식을 보여줍니다. 이 오디오 신호의 주파수는 44,100HZ입니다.
여기에 표시된대로 필요한 패키지를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
이제 저장된 오디오 파일을 읽으십시오. 샘플링 주파수와 오디오 신호의 두 가지 값을 반환합니다. 여기에 표시된대로 오디오 파일이 저장된 경로를 제공하십시오.
frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")
표시된 명령을 사용하여 오디오 신호의 샘플링 주파수, 신호의 데이터 유형 및 지속 시간과 같은 매개 변수를 표시합니다.
print('\nSignal shape:', audio_signal.shape)
print('Signal Datatype:', audio_signal.dtype)
print('Signal duration:', round(audio_signal.shape[0] /
float(frequency_sampling), 2), 'seconds')
이 단계는 아래와 같이 신호를 정규화하는 것을 포함합니다.
audio_signal = audio_signal / np.power(2, 15)
이 단계에서는 시각화 할이 신호에서 처음 100 개의 값을 추출합니다. 이 목적을 위해 다음 명령을 사용하십시오-
audio_signal = audio_signal [:100]
time_axis = 1000 * np.arange(0, len(signal), 1) / float(frequency_sampling)
이제 아래 주어진 명령을 사용하여 신호를 시각화하십시오.
plt.plot(time_axis, signal, color='blue')
plt.xlabel('Time (milliseconds)')
plt.ylabel('Amplitude')
plt.title('Input audio signal')
plt.show()
여기 이미지와 같이 위의 오디오 신호에 대해 추출 된 출력 그래프와 데이터를 볼 수 있습니다.
Signal shape: (132300,)
Signal Datatype: int16
Signal duration: 3.0 seconds
오디오 신호 특성화 : 주파수 도메인으로 변환
오디오 신호를 특성화하려면 시간 도메인 신호를 주파수 도메인으로 변환하고 해당 주파수 구성 요소를 이해해야합니다. 이것은 신호에 대한 많은 정보를 제공하기 때문에 중요한 단계입니다. 푸리에 변환과 같은 수학적 도구를 사용하여이 변환을 수행 할 수 있습니다.
예
다음 예제는 파일에 저장된 Python을 사용하여 신호를 특성화하는 방법을 단계별로 보여줍니다. 여기서 우리는 주파수 영역으로 변환하기 위해 푸리에 변환 수학 도구를 사용하고 있습니다.
여기에 표시된대로 필요한 패키지를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
이제 저장된 오디오 파일을 읽으십시오. 샘플링 주파수와 오디오 신호의 두 가지 값을 반환합니다. 여기에 명령에 표시된대로 오디오 파일이 저장된 경로를 제공하십시오.
frequency_sampling, audio_signal = wavfile.read("/Users/admin/sample.wav")
이 단계에서는 아래에 주어진 명령을 사용하여 오디오 신호의 샘플링 주파수, 신호의 데이터 유형 및 지속 시간과 같은 매개 변수를 표시합니다.
print('\nSignal shape:', audio_signal.shape)
print('Signal Datatype:', audio_signal.dtype)
print('Signal duration:', round(audio_signal.shape[0] /
float(frequency_sampling), 2), 'seconds')
이 단계에서는 다음 명령과 같이 신호를 정규화해야합니다.
audio_signal = audio_signal / np.power(2, 15)
이 단계에서는 신호의 길이와 절반 길이를 추출합니다. 이 목적을 위해 다음 명령을 사용하십시오-
length_signal = len(audio_signal)
half_length = np.ceil((length_signal + 1) / 2.0).astype(np.int)
이제 주파수 영역으로 변환하기 위해 수학 도구를 적용해야합니다. 여기에서는 푸리에 변환을 사용합니다.
signal_frequency = np.fft.fft(audio_signal)
이제 주파수 도메인 신호의 정규화를 수행하고 제곱합니다.
signal_frequency = abs(signal_frequency[0:half_length]) / length_signal
signal_frequency **= 2
다음으로 주파수 변환 신호의 길이와 절반 길이를 추출합니다.
len_fts = len(signal_frequency)
푸리에 변환 된 신호는 짝수 및 홀수 케이스에 대해 조정되어야합니다.
if length_signal % 2:
signal_frequency[1:len_fts] *= 2
else:
signal_frequency[1:len_fts-1] *= 2
이제 데 시발 (dB) 단위로 전력을 추출합니다.
signal_power = 10 * np.log10(signal_frequency)
X 축의 kHz 단위로 주파수 조정 −
x_axis = np.arange(0, len_half, 1) * (frequency_sampling / length_signal) / 1000.0
이제 다음과 같이 신호의 특성화를 시각화하십시오.
plt.figure()
plt.plot(x_axis, signal_power, color='black')
plt.xlabel('Frequency (kHz)')
plt.ylabel('Signal power (dB)')
plt.show()
아래 이미지와 같이 위 코드의 출력 그래프를 볼 수 있습니다.
모노톤 오디오 신호 생성
지금까지 본 두 단계는 신호에 대해 배우는 데 중요합니다. 이제이 단계는 사전 정의 된 매개 변수를 사용하여 오디오 신호를 생성하려는 경우에 유용합니다. 이 단계는 오디오 신호를 출력 파일에 저장합니다.
예
다음 예제에서는 파일에 저장 될 Python을 사용하여 모노톤 신호를 생성합니다. 이를 위해 다음 단계를 수행해야합니다.
그림과 같이 필요한 패키지를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
from scipy.io.wavfile import write
출력 파일을 저장할 파일을 제공하십시오.
output_file = 'audio_signal_generated.wav'
이제 다음과 같이 원하는 매개 변수를 지정하십시오.
duration = 4 # in seconds
frequency_sampling = 44100 # in Hz
frequency_tone = 784
min_val = -4 * np.pi
max_val = 4 * np.pi
이 단계에서 다음과 같이 오디오 신호를 생성 할 수 있습니다.
t = np.linspace(min_val, max_val, duration * frequency_sampling)
audio_signal = np.sin(2 * np.pi * tone_freq * t)
이제 출력 파일에 오디오 파일을 저장하십시오.
write(output_file, frequency_sampling, signal_scaled)
다음과 같이 그래프의 처음 100 개 값을 추출합니다.
audio_signal = audio_signal[:100]
time_axis = 1000 * np.arange(0, len(signal), 1) / float(sampling_freq)
이제 생성 된 오디오 신호를 다음과 같이 시각화합니다.
plt.plot(time_axis, signal, color='blue')
plt.xlabel('Time in milliseconds')
plt.ylabel('Amplitude')
plt.title('Generated audio signal')
plt.show()
여기에 주어진 그림과 같이 플롯을 관찰 할 수 있습니다.
음성에서 특징 추출
이것은 음성 인식기를 구축하는 데 가장 중요한 단계입니다. 음성 신호를 주파수 영역으로 변환 한 후 사용 가능한 형태의 특징 벡터로 변환해야하기 때문입니다. 이를 위해 MFCC, PLP, PLP-RASTA 등과 같은 다양한 특징 추출 기술을 사용할 수 있습니다.
예
다음 예제에서는 MFCC 기법을 사용하여 Python을 사용하여 단계별로 신호에서 특징을 추출 할 것입니다.
여기에 표시된대로 필요한 패키지를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank
이제 저장된 오디오 파일을 읽으십시오. 샘플링 주파수와 오디오 신호의 두 가지 값을 반환합니다. 오디오 파일이 저장된 경로를 제공하십시오.
frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")
여기서는 분석을 위해 처음 15000 개의 샘플을 채취하고 있습니다.
audio_signal = audio_signal[:15000]
MFCC 기술을 사용하고 다음 명령을 실행하여 MFCC 기능을 추출합니다.
features_mfcc = mfcc(audio_signal, frequency_sampling)
이제 다음과 같이 MFCC 매개 변수를 인쇄합니다.
print('\nMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])
이제 아래에 주어진 명령을 사용하여 MFCC 기능을 플롯하고 시각화합니다.
features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')
이 단계에서는 다음과 같이 필터 뱅크 기능을 사용합니다.
필터 뱅크 기능 추출-
filterbank_features = logfbank(audio_signal, frequency_sampling)
이제 filterbank 매개 변수를 인쇄합니다.
print('\nFilter bank:\nNumber of windows =', filterbank_features.shape[0])
print('Length of each feature =', filterbank_features.shape[1])
이제 필터 뱅크 기능을 플로팅하고 시각화합니다.
filterbank_features = filterbank_features.T
plt.matshow(filterbank_features)
plt.title('Filter bank')
plt.show()
위 단계의 결과로 다음과 같은 출력을 볼 수 있습니다. MFCC의 경우 그림 1, 필터 뱅크의 경우 그림 2
구어 인식
음성 인식은 사람이 말할 때 기계가 그것을 이해한다는 것을 의미합니다. 여기에서는 Python에서 Google Speech API를 사용하여이를 실현합니다. 이를 위해 다음 패키지를 설치해야합니다.
Pyaudio − 사용하여 설치할 수 있습니다. pip install Pyaudio 명령.
SpeechRecognition −이 패키지는 다음을 사용하여 설치할 수 있습니다. pip install SpeechRecognition.
Google-Speech-API − 명령어를 사용하여 설치할 수 있습니다. pip install google-api-python-client.
예
구어 인식에 대해 이해하려면 다음 예를 참조하십시오.
그림과 같이 필요한 패키지를 가져옵니다.
import speech_recognition as sr
아래와 같이 개체를 만듭니다-
recording = sr.Recognizer()
자, Microphone() 모듈은 음성을 입력으로받습니다.
with sr.Microphone() as source: recording.adjust_for_ambient_noise(source)
print("Please Say something:")
audio = recording.listen(source)
이제 Google API는 음성을 인식하고 출력을 제공합니다.
try:
print("You said: \n" + recording.recognize_google(audio))
except Exception as e:
print(e)
다음 출력을 볼 수 있습니다-
Please Say Something:
You said:
예를 들어, tutorialspoint.com, 시스템은 다음과 같이 올바르게 인식합니다.
tutorialspoint.com
휴리스틱 검색은 인공 지능에서 핵심적인 역할을합니다. 이 장에서는 이에 대해 자세히 배웁니다.
인공 지능의 휴리스틱 검색 개념
휴리스틱은 우리를 가능한 해결책으로 이끄는 경험 법칙입니다. 인공 지능의 대부분의 문제는 기하 급수적이며 가능한 많은 해결책이 있습니다. 어떤 솔루션이 올바른지 정확히 알지 못하며 모든 솔루션을 확인하는 데 비용이 많이 듭니다.
따라서 휴리스틱을 사용하면 솔루션 검색 범위가 좁아지고 잘못된 옵션이 제거됩니다. 휴리스틱을 사용하여 검색 공간에서 검색을 유도하는 방법을 휴리스틱 검색이라고합니다. 휴리스틱 기술은 사용할 때 검색을 향상시킬 수 있기 때문에 매우 유용합니다.
정보가없는 검색과 정보가없는 검색의 차이점
제어 전략 또는 검색 기술에는 정보가없는 것과 정보가있는 두 가지 유형이 있습니다. 여기에 주어진대로 자세히 설명되어 있습니다.
정보가없는 검색
블라인드 검색 또는 블라인드 제어 전략이라고도합니다. 문제 정의에 대한 정보 만 있고 상태에 대한 다른 추가 정보가 없기 때문에 이름이 지정되었습니다. 이러한 종류의 검색 기술은 솔루션을 얻기 위해 전체 상태 공간을 검색합니다. BFS (Breadth First Search) 및 DFS (Depth First Search)는 정보가없는 검색의 예입니다.
정보에 입각 한 검색
휴리스틱 검색 또는 휴리스틱 제어 전략이라고도합니다. 주에 대한 추가 정보가 있기 때문에 그렇게 명명되었습니다. 이 추가 정보는 탐색 및 확장 할 하위 노드 간의 선호도를 계산하는 데 유용합니다. 각 노드와 관련된 휴리스틱 기능이 있습니다. BFS (Best First Search), A *, 평균 및 분석은 정보에 입각 한 검색의 예입니다.
제약 만족 문제 (CSP)
제약은 제한 또는 제한을 의미합니다. AI에서 제약 만족 문제는 일부 제약 조건 하에서 해결해야하는 문제입니다. 이러한 문제를 해결하면서 제약을 위반하지 않는 데 초점을 두어야합니다. 마지막으로 최종 솔루션에 도달하면 CSP는 제한 사항을 준수해야합니다.
제약 만족으로 해결되는 실제 문제
이전 섹션에서는 제약 만족 문제 생성에 대해 설명했습니다. 이제 이것을 실제 문제에도 적용 해 보겠습니다. 제약 만족으로 해결 된 실제 문제의 몇 가지 예는 다음과 같습니다.
대수 관계 풀기
제약 만족 문제의 도움으로 우리는 대수 관계를 풀 수 있습니다. 이 예에서는 간단한 대수 관계를 풀려고합니다.a*2 = b. 다음 값을 반환합니다.a 과 b 우리가 정의 할 범위 내에서.
이 Python 프로그램을 완료하면 제약 조건 만족으로 문제를 해결하는 기본 사항을 이해할 수 있습니다.
프로그램을 작성하기 전에 python-constraint라는 Python 패키지를 설치해야합니다. 다음 명령을 사용하여 설치할 수 있습니다.
pip install python-constraint
다음 단계는 제약 조건 만족을 사용하여 대수 관계를 해결하기위한 Python 프로그램을 보여줍니다.
가져 오기 constraint 다음 명령을 사용하여 패키지-
from constraint import *
이제 다음과 같은 모듈의 개체를 만듭니다. problem() 아래와 같이-
problem = Problem()
이제 변수를 정의하십시오. 여기에 두 개의 변수 a와 b가 있고 10을 범위로 정의하고 있습니다. 즉, 처음 10 개의 숫자 내에서 해를 구했습니다.
problem.addVariable('a', range(10))
problem.addVariable('b', range(10))
다음으로이 문제에 적용 할 특정 제약 조건을 정의합니다. 여기서 우리는 제약 조건을 사용하고 있음을 관찰하십시오.a*2 = b.
problem.addConstraint(lambda a, b: a * 2 == b)
이제 개체를 만듭니다. getSolution() 다음 명령을 사용하는 모듈-
solutions = problem.getSolutions()
마지막으로 다음 명령을 사용하여 출력을 인쇄하십시오.
print (solutions)
위 프로그램의 출력을 다음과 같이 관찰 할 수 있습니다.
[{'a': 4, 'b': 8}, {'a': 3, 'b': 6}, {'a': 2, 'b': 4}, {'a': 1, 'b': 2}, {'a': 0, 'b': 0}]
매직 스퀘어
매직 스퀘어는 각 행과 각 열의 숫자와 대각선의 숫자가 모두 '마법 상수'라고하는 동일한 숫자가되는 정사각형 그리드에서 고유 한 숫자 (일반적으로 정수)의 배열입니다. .
다음은 매직 스퀘어를 생성하기위한 간단한 Python 코드의 단계적 실행입니다.
이름이 지정된 함수 정의 magic_square, 아래와 같이-
def magic_square(matrix_ms):
iSize = len(matrix_ms[0])
sum_list = []
다음 코드는 사각형의 수직 코드를 보여줍니다-
for col in range(iSize):
sum_list.append(sum(row[col] for row in matrix_ms))
다음 코드는 수평 제곱에 대한 코드를 보여줍니다-
sum_list.extend([sum (lines) for lines in matrix_ms])
다음 코드는 사각형의 수평 코드를 보여줍니다-
dlResult = 0
for i in range(0,iSize):
dlResult +=matrix_ms[i][i]
sum_list.append(dlResult)
drResult = 0
for i in range(iSize-1,-1,-1):
drResult +=matrix_ms[i][i]
sum_list.append(drResult)
if len(set(sum_list))>1:
return False
return True
이제 행렬의 값을 제공하고 출력을 확인하십시오.
print(magic_square([[1,2,3], [4,5,6], [7,8,9]]))
출력이 False 합계가 같은 숫자가 아니기 때문에.
print(magic_square([[3,9,2], [3,5,7], [9,1,6]]))
출력이 True 합계가 같은 숫자이므로 15 여기.
게임은 전략으로 진행됩니다. 모든 플레이어 나 팀은 게임을 시작하기 전에 전략을 세우고 게임의 현재 상황에 따라 새로운 전략을 변경하거나 구축해야합니다.
검색 알고리즘
위와 동일한 전략으로 컴퓨터 게임도 고려해야합니다. 검색 알고리즘은 컴퓨터 게임의 전략을 파악하는 알고리즘입니다.
작동 원리
검색 알고리즘의 목표는 최종 목적지에 도달하여 승리 할 수 있도록 최적의 동작 세트를 찾는 것입니다. 이 알고리즘은 게임마다 다른 승리 조건을 사용하여 최상의 동작을 찾습니다.
컴퓨터 게임을 트리로 시각화하십시오. 우리는 나무에 노드가 있다는 것을 알고 있습니다. 루트에서 시작하여 최종 승리 노드에 도달 할 수 있지만 최적의 움직임이 있습니다. 이것이 검색 알고리즘의 작업입니다. 이러한 트리의 모든 노드는 미래 상태를 나타냅니다. 검색 알고리즘은이 트리를 검색하여 게임의 각 단계 또는 노드에서 결정을 내립니다.
조합 검색
검색 알고리즘 사용의 가장 큰 단점은 본질적으로 철저하다는 것입니다. 그래서 전체 검색 공간을 탐색하여 자원 낭비를 초래하는 솔루션을 찾습니다. 이러한 알고리즘이 최종 솔루션을 찾기 위해 전체 검색 공간을 검색해야한다면 더 번거로울 것입니다.
이러한 종류의 문제를 제거하기 위해 휴리스틱을 사용하여 검색 공간을 탐색하고 가능한 잘못된 이동을 제거하여 크기를 줄이는 조합 검색을 사용할 수 있습니다. 따라서 이러한 알고리즘은 리소스를 절약 할 수 있습니다. 휴리스틱을 사용하여 공간을 검색하고 리소스를 절약하는 일부 알고리즘은 여기에서 설명합니다.
Minimax 알고리즘
검색 전략의 속도를 높이기 위해 휴리스틱을 사용하는 조합 검색에서 사용하는 전략입니다. Minimax 전략의 개념은 각 플레이어가 상대방의 다음 움직임을 예측하고 그 기능을 최소화하려고 시도하는 두 플레이어 게임의 예를 통해 이해할 수 있습니다. 또한, 이기기 위해 플레이어는 항상 현재 상황에 따라 자신의 기능을 극대화하려고 노력합니다.
휴리스틱은 Minimax와 같은 전략에서 중요한 역할을합니다. 트리의 모든 노드에는 이와 관련된 휴리스틱 기능이 있습니다. 그 휴리스틱을 기반으로 가장 많은 혜택을 볼 수있는 노드로 이동하기로 결정합니다.
알파-베타 가지 치기
Minimax 알고리즘의 주요 문제는 관련성이없는 트리 부분을 탐색하여 리소스를 낭비 할 수 있다는 것입니다. 따라서 트리의 어느 부분이 관련이 있고 어느 부분이 관련이 없는지 결정하고 관련이없는 부분을 탐색하지 않는 상태로 두는 전략이 있어야합니다. 알파-베타 가지 치기는 그러한 종류의 전략 중 하나입니다.
Alpha-Beta 가지 치기 알고리즘의 주요 목표는 솔루션이없는 트리 부분을 검색하지 않는 것입니다. Alpha-Beta 가지 치기의 주요 개념은 두 개의 경계를 사용하는 것입니다.Alpha, 최대 하한 및 Beta, 최소 상한. 이 두 매개 변수는 가능한 솔루션 세트를 제한하는 값입니다. 현재 노드의 값을 알파 및 베타 매개 변수의 값과 비교하여 솔루션이있는 트리 부분으로 이동하고 나머지는 버릴 수 있도록합니다.
Negamax 알고리즘
이 알고리즘은 Minimax 알고리즘과 다르지 않지만 더 우아한 구현이 있습니다. Minimax 알고리즘 사용의 주요 단점은 두 가지 휴리스틱 함수를 정의해야한다는 것입니다. 이러한 휴리스틱 간의 연결은 한 플레이어의 게임 상태가 좋을수록 다른 플레이어에게는 더 나쁘다는 것입니다. Negamax 알고리즘에서는 두 가지 휴리스틱 함수의 동일한 작업이 단일 휴리스틱 함수의 도움으로 수행됩니다.
게임 플레이를위한 봇 구축
AI에서 2 인용 게임을 플레이하기 위해 봇을 구축하려면 easyAI도서관. 2 인용 게임을 빌드하는 모든 기능을 제공하는 인공 지능 프레임 워크입니다. 다음 명령을 사용하여 다운로드 할 수 있습니다.
pip install easyAI
라스트 코인 스탠딩을하는 봇
이 게임에는 동전 더미가 있습니다. 각 플레이어는 그 더미에서 많은 동전을 가져와야합니다. 게임의 목표는 더미에서 마지막 동전을 가져 가지 않는 것입니다. 우리는 수업을 사용할 것입니다LastCoinStanding 에서 상속 TwoPlayersGame 클래스 easyAI도서관. 다음 코드는이 게임에 대한 Python 코드를 보여줍니다.
그림과 같이 필요한 패키지를 가져옵니다.
from easyAI import TwoPlayersGame, id_solve, Human_Player, AI_Player
from easyAI.AI import TT
이제 클래스를 TwoPlayerGame 게임의 모든 작업을 처리하는 클래스-
class LastCoin_game(TwoPlayersGame):
def __init__(self, players):
이제 게임을 시작할 플레이어와 플레이어를 정의합니다.
self.players = players
self.nplayer = 1
이제 게임의 코인 수를 정의합니다. 여기서는 게임에 15 개의 코인을 사용합니다.
self.num_coins = 15
플레이어가 움직일 수있는 최대 코인 수를 정의합니다.
self.max_coins = 4
이제 다음 코드와 같이 정의해야 할 몇 가지 사항이 있습니다. 가능한 움직임을 정의하십시오.
def possible_moves(self):
return [str(a) for a in range(1, self.max_coins + 1)]
동전 제거 정의
def make_move(self, move):
self.num_coins -= int(move)
누가 마지막 동전을 가져 갔는지 정의하십시오.
def win_game(self):
return self.num_coins <= 0
게임을 중지 할 때, 즉 누군가가 이길 때를 정의합니다.
def is_over(self):
return self.win()
점수 계산 방법을 정의합니다.
def score(self):
return 100 if self.win_game() else 0
더미에 남아있는 동전 수를 정의합니다.
def show(self):
print(self.num_coins, 'coins left in the pile')
if __name__ == "__main__":
tt = TT()
LastCoin_game.ttentry = lambda self: self.num_coins
다음 코드 블록으로 게임 풀기-
r, d, m = id_solve(LastCoin_game,
range(2, 20), win_score=100, tt=tt)
print(r, d, m)
게임을 시작할 사람 결정
game = LastCoin_game([AI_Player(tt), Human_Player()])
game.play()
다음 출력과이 게임의 간단한 플레이를 찾을 수 있습니다.
d:2, a:0, m:1
d:3, a:0, m:1
d:4, a:0, m:1
d:5, a:0, m:1
d:6, a:100, m:4
1 6 4
15 coins left in the pile
Move #1: player 1 plays 4 :
11 coins left in the pile
Player 2 what do you play ? 2
Move #2: player 2 plays 2 :
9 coins left in the pile
Move #3: player 1 plays 3 :
6 coins left in the pile
Player 2 what do you play ? 1
Move #4: player 2 plays 1 :
5 coins left in the pile
Move #5: player 1 plays 4 :
1 coins left in the pile
Player 2 what do you play ? 1
Move #6: player 2 plays 1 :
0 coins left in the pile
Tic Tac Toe를하는 봇
Tic-Tac-Toe는 매우 친숙하고 가장 인기있는 게임 중 하나입니다. 이 게임을 만들어 보겠습니다.easyAIPython의 라이브러리. 다음 코드는이 게임의 Python 코드입니다.
그림과 같이 패키지를 가져옵니다.
from easyAI import TwoPlayersGame, AI_Player, Negamax
from easyAI.Player import Human_Player
다음에서 클래스 상속 TwoPlayerGame 게임의 모든 작업을 처리하는 클래스-
class TicTacToe_game(TwoPlayersGame):
def __init__(self, players):
이제 게임을 시작할 플레이어와 플레이어를 정의합니다.
self.players = players
self.nplayer = 1
보드 유형 정의-
self.board = [0] * 9
이제 다음과 같이 정의해야 할 몇 가지 사항이 있습니다.
가능한 이동 정의
def possible_moves(self):
return [x + 1 for x, y in enumerate(self.board) if y == 0]
플레이어의 움직임 정의-
def make_move(self, move):
self.board[int(move) - 1] = self.nplayer
AI를 강화하려면 플레이어가 이동하는시기를 정의하십시오.
def umake_move(self, move):
self.board[int(move) - 1] = 0
상대가 한 줄에 3 개를 가지고있는 패배 조건을 정의합니다.
def condition_for_lose(self):
possible_combinations = [[1,2,3], [4,5,6], [7,8,9],
[1,4,7], [2,5,8], [3,6,9], [1,5,9], [3,5,7]]
return any([all([(self.board[z-1] == self.nopponent)
for z in combination]) for combination in possible_combinations])
게임 종료 확인 정의
def is_over(self):
return (self.possible_moves() == []) or self.condition_for_lose()
게임에서 플레이어의 현재 위치 표시
def show(self):
print('\n'+'\n'.join([' '.join([['.', 'O', 'X'][self.board[3*j + i]]
for i in range(3)]) for j in range(3)]))
점수를 계산하십시오.
def scoring(self):
return -100 if self.condition_for_lose() else 0
알고리즘을 정의하고 게임을 시작하는 주요 방법을 정의합니다.
if __name__ == "__main__":
algo = Negamax(7)
TicTacToe_game([Human_Player(), AI_Player(algo)]).play()
다음 출력과이 게임의 간단한 플레이를 볼 수 있습니다.
. . .
. . .
. . .
Player 1 what do you play ? 1
Move #1: player 1 plays 1 :
O . .
. . .
. . .
Move #2: player 2 plays 5 :
O . .
. X .
121
. . .
Player 1 what do you play ? 3
Move #3: player 1 plays 3 :
O . O
. X .
. . .
Move #4: player 2 plays 2 :
O X O
. X .
. . .
Player 1 what do you play ? 4
Move #5: player 1 plays 4 :
O X O
O X .
. . .
Move #6: player 2 plays 8 :
O X O
O X .
. X .
신경망은 뇌의 컴퓨터 모델을 만들기위한 병렬 컴퓨팅 장치입니다. 기본 목표는 기존 시스템보다 빠르게 다양한 계산 작업을 수행 할 수있는 시스템을 개발하는 것입니다. 이러한 작업에는 패턴 인식 및 분류, 근사화, 최적화 및 데이터 클러스터링이 포함됩니다.
인공 신경망 (ANN)이란?
인공 신경망 (ANN)은 생물학적 신경망의 비유에서 차용 한 중심 주제를 가진 효율적인 컴퓨팅 시스템입니다. ANN은 인공 신경 시스템, 병렬 분산 처리 시스템 및 연결 시스템이라고도합니다. ANN은 그들 사이의 통신을 허용하기 위해 어떤 패턴으로 상호 연결되어있는 대규모 단위 집합을 획득합니다. 이러한 단위는nodes 또는 neurons, 병렬로 작동하는 간단한 프로세서입니다.
모든 뉴런은 A를 통해 다른 뉴런과 연결됩니다. connection link. 각 연결 링크는 입력 신호에 대한 정보가있는 가중치와 연관됩니다. 이것은 뉴런이 특정 문제를 해결하는 데 가장 유용한 정보입니다.weight일반적으로 전달되는 신호를 자극하거나 억제합니다. 각 뉴런은 내부 상태를 가지고 있습니다.activation signal. 입력 신호와 활성화 규칙을 결합하여 생성 된 출력 신호를 다른 장치로 보낼 수 있습니다.
신경망을 자세히 연구하려면 인공 신경망 링크를 따를 수 있습니다 .
유용한 패키지 설치
Python에서 신경망을 만들기 위해 우리는 신경망을위한 강력한 패키지를 사용할 수 있습니다. NeuroLab. 유연한 네트워크 구성과 Python 용 학습 알고리즘을 갖춘 기본 신경망 알고리즘 라이브러리입니다. 명령 프롬프트에서 다음 명령을 사용하여이 패키지를 설치할 수 있습니다.
pip install NeuroLab
Anaconda 환경을 사용하는 경우 다음 명령을 사용하여 NeuroLab을 설치하십시오.
conda install -c labfabulous neurolab
신경망 구축
이 섹션에서는 NeuroLab 패키지를 사용하여 Python에서 신경망을 구축해 보겠습니다.
퍼셉트론 기반 분류기
퍼셉트론은 ANN의 빌딩 블록입니다. Perceptron에 대해 더 알고 싶으시면, Artificial_neural_network 링크를 따라갈 수 있습니다.
다음은 간단한 신경망 퍼셉트론 기반 분류기를 구축하기위한 Python 코드의 단계적 실행입니다.
그림과 같이 필요한 패키지를 가져옵니다.
import matplotlib.pyplot as plt
import neurolab as nl
입력 값을 입력하십시오. 지도 학습의 예이므로 목표 값도 제공해야합니다.
input = [[0, 0], [0, 1], [1, 0], [1, 1]]
target = [[0], [0], [0], [1]]
2 개의 입력과 1 개의 뉴런으로 네트워크 만들기 −
net = nl.net.newp([[0, 1],[0, 1]], 1)
이제 네트워크를 훈련 시키십시오. 여기에서는 훈련에 델타 규칙을 사용합니다.
error_progress = net.train(input, target, epochs=100, show=10, lr=0.1)
이제 출력을 시각화하고 그래프를 플로팅합니다.
plt.figure()
plt.plot(error_progress)
plt.xlabel('Number of epochs')
plt.ylabel('Training error')
plt.grid()
plt.show()
오류 메트릭을 사용하여 훈련 진행 상황을 보여주는 다음 그래프를 볼 수 있습니다.
단일 계층 신경망
이 예제에서는 출력을 생성하기 위해 입력 데이터에 작용하는 독립적 인 뉴런으로 구성된 단일 계층 신경망을 생성합니다. 우리는 텍스트 파일을 사용하고 있습니다.neural_simple.txt 우리의 입력으로.
다음과 같이 유용한 패키지를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
import neurolab as nl
다음과 같이 데이터 세트를로드하십시오-
input_data = np.loadtxt(“/Users/admin/neural_simple.txt')
다음은 우리가 사용할 데이터입니다. 이 데이터에서 처음 두 열은 특성이고 마지막 두 열은 레이블입니다.
array([[2. , 4. , 0. , 0. ],
[1.5, 3.9, 0. , 0. ],
[2.2, 4.1, 0. , 0. ],
[1.9, 4.7, 0. , 0. ],
[5.4, 2.2, 0. , 1. ],
[4.3, 7.1, 0. , 1. ],
[5.8, 4.9, 0. , 1. ],
[6.5, 3.2, 0. , 1. ],
[3. , 2. , 1. , 0. ],
[2.5, 0.5, 1. , 0. ],
[3.5, 2.1, 1. , 0. ],
[2.9, 0.3, 1. , 0. ],
[6.5, 8.3, 1. , 1. ],
[3.2, 6.2, 1. , 1. ],
[4.9, 7.8, 1. , 1. ],
[2.1, 4.8, 1. , 1. ]])
이제이 4 개의 열을 2 개의 데이터 열과 2 개의 레이블로 분리합니다.
data = input_data[:, 0:2]
labels = input_data[:, 2:]
다음 명령을 사용하여 입력 데이터를 플로팅-
plt.figure()
plt.scatter(data[:,0], data[:,1])
plt.xlabel('Dimension 1')
plt.ylabel('Dimension 2')
plt.title('Input data')
이제 여기에 표시된대로 각 차원의 최소값과 최대 값을 정의합니다.
dim1_min, dim1_max = data[:,0].min(), data[:,0].max()
dim2_min, dim2_max = data[:,1].min(), data[:,1].max()
다음으로 다음과 같이 출력 레이어의 뉴런 수를 정의합니다.
nn_output_layer = labels.shape[1]
이제 단일 계층 신경망을 정의하십시오.
dim1 = [dim1_min, dim1_max]
dim2 = [dim2_min, dim2_max]
neural_net = nl.net.newp([dim1, dim2], nn_output_layer)
다음과 같이 epoch 수와 학습률로 신경망을 훈련시킵니다.
error = neural_net.train(data, labels, epochs = 200, show = 20, lr = 0.01)
이제 다음 명령을 사용하여 훈련 진행 상황을 시각화하고 플로팅합니다.
plt.figure()
plt.plot(error)
plt.xlabel('Number of epochs')
plt.ylabel('Training error')
plt.title('Training error progress')
plt.grid()
plt.show()
이제 위 분류기에서 테스트 데이터 포인트를 사용하십시오.
print('\nTest Results:')
data_test = [[1.5, 3.2], [3.6, 1.7], [3.6, 5.7],[1.6, 3.9]] for item in data_test:
print(item, '-->', neural_net.sim([item])[0])
여기에 표시된대로 테스트 결과를 찾을 수 있습니다.
[1.5, 3.2] --> [1. 0.]
[3.6, 1.7] --> [1. 0.]
[3.6, 5.7] --> [1. 1.]
[1.6, 3.9] --> [1. 0.]
지금까지 논의 된 코드의 출력으로 다음 그래프를 볼 수 있습니다.
다층 신경망
이 예에서는 학습 데이터에서 기본 패턴을 추출하기 위해 둘 이상의 레이어로 구성된 다층 신경망을 생성합니다. 이 다층 신경망은 회귀 자처럼 작동합니다. 방정식을 기반으로 몇 가지 데이터 포인트를 생성 할 것입니다 : y = 2x 2 +8.
그림과 같이 필요한 패키지를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
import neurolab as nl
위에서 언급 한 방정식을 기반으로 데이터 포인트 생성-
min_val = -30
max_val = 30
num_points = 160
x = np.linspace(min_val, max_val, num_points)
y = 2 * np.square(x) + 8
y /= np.linalg.norm(y)
이제이 데이터 세트를 다음과 같이 재구성합니다.
data = x.reshape(num_points, 1)
labels = y.reshape(num_points, 1)
다음 명령을 사용하여 입력 데이터 세트를 시각화하고 플로팅합니다.
plt.figure()
plt.scatter(data, labels)
plt.xlabel('Dimension 1')
plt.ylabel('Dimension 2')
plt.title('Data-points')
이제 두 개의 은닉층이있는 신경망을 구축합니다. neurolab 와 ten 첫 번째 은닉층의 뉴런, six 두 번째 히든 레이어에서 one 출력 레이어에서.
neural_net = nl.net.newff([[min_val, max_val]], [10, 6, 1])
이제 그라디언트 훈련 알고리즘을 사용하십시오.
neural_net.trainf = nl.train.train_gd
이제 위에서 생성 된 데이터를 학습하는 것을 목표로 네트워크를 훈련 시키십시오.
error = neural_net.train(data, labels, epochs = 1000, show = 100, goal = 0.01)
이제 훈련 데이터 포인트에서 신경망을 실행합니다.
output = neural_net.sim(data)
y_pred = output.reshape(num_points)
이제 플롯 및 시각화 작업-
plt.figure()
plt.plot(error)
plt.xlabel('Number of epochs')
plt.ylabel('Error')
plt.title('Training error progress')
이제 우리는 실제 결과와 예측 결과를 그릴 것입니다.
x_dense = np.linspace(min_val, max_val, num_points * 2)
y_dense_pred = neural_net.sim(x_dense.reshape(x_dense.size,1)).reshape(x_dense.size)
plt.figure()
plt.plot(x_dense, y_dense_pred, '-', x, y, '.', x, y_pred, 'p')
plt.title('Actual vs predicted')
plt.show()
위 명령의 결과로 아래와 같이 그래프를 관찰 할 수 있습니다.
이 장에서는 Python을 사용한 AI의 강화 학습 개념에 대해 자세히 알아 봅니다.
강화 학습의 기초
이러한 유형의 학습은 비평 정보를 기반으로 네트워크를 강화하거나 강화하는 데 사용됩니다. 즉, 강화 학습하에 훈련 된 네트워크는 환경으로부터 일부 피드백을받습니다. 그러나 피드백은지도 학습의 경우와 같이 평가 적이며 유익하지 않습니다. 이 피드백을 기반으로 네트워크는 향후 더 나은 비평 정보를 얻기 위해 가중치를 조정합니다.
이 학습 과정은지도 학습과 유사하지만 정보가 매우 적을 수 있습니다. 다음 그림은 강화 학습의 블록 다이어그램을 제공합니다.
빌딩 블록 : 환경 및 에이전트
환경 및 에이전트는 AI에서 강화 학습의 주요 구성 요소입니다. 이 섹션에서는 이에 대해 자세히 설명합니다.
에이전트
에이전트는 센서를 통해 환경을 인식하고 이펙터를 통해 해당 환경에 작용할 수있는 모든 것입니다.
ㅏ human agent 센서와 평행 한 눈, 귀, 코, 혀 및 피부와 같은 감각 기관과 이펙터 용 손, 다리, 입과 같은 기타 기관이 있습니다.
ㅏ robotic agent 센서 용 카메라 및 적외선 거리 측정기, 이펙터 용 다양한 모터 및 액추에이터를 대체합니다.
ㅏ software agent 프로그램 및 작업으로 인코딩 된 비트 문자열이 있습니다.
에이전트 용어
다음 용어는 AI에서 강화 학습에 더 자주 사용됩니다.
Performance Measure of Agent − 상담원의 성공 여부를 결정하는 기준입니다.
Behavior of Agent − 주어진 지각 순서 후에 에이전트가 수행하는 작업입니다.
Percept − 주어진 인스턴스에서 에이전트의 지각 입력입니다.
Percept Sequence − 에이전트가 날짜까지인지 한 모든 것의 역사입니다.
Agent Function − 계율 순서에서 행동으로의지도입니다.
환경
일부 프로그램은 전적으로 artificial environment 키보드 입력, 데이터베이스, 컴퓨터 파일 시스템 및 화면의 문자 출력에 국한됩니다.
반대로 소프트웨어 로봇 또는 소프트 봇과 같은 일부 소프트웨어 에이전트는 풍부하고 무제한의 소프트 봇 도메인에 존재합니다. 시뮬레이터에는very detailed, 및 complex environment. 소프트웨어 에이전트는 실시간으로 다양한 작업 중에서 선택해야합니다.
예를 들어, 고객의 온라인 선호도를 스캔하고 고객에게 흥미로운 항목을 표시하도록 설계된 소프트 봇은 real 뿐만 아니라 artificial 환경.
환경의 특성
환경은 아래에 설명 된 바와 같이 다중 속성을 가지고 있습니다.
Discrete/Continuous− 환경의 뚜렷하고 명확하게 정의 된 상태가 제한된 수의 경우 환경은 개별적이며 그렇지 않은 경우 연속적입니다. 예를 들어 체스는 별개의 환경이고 운전은 지속적인 환경입니다.
Observable/Partially Observable− 지각에서 각 시점에서 환경의 완전한 상태를 결정할 수 있다면 관찰 가능합니다. 그렇지 않으면 부분적으로 만 관찰 할 수 있습니다.
Static/Dynamic− 에이전트가 작동하는 동안 환경이 변경되지 않으면 정적입니다. 그렇지 않으면 동적입니다.
Single agent/Multiple agents − 환경에는 에이전트와 동일하거나 다른 종류의 다른 에이전트가 포함될 수 있습니다.
Accessible/Inaccessible− 에이전트의 감각 장치가 환경의 전체 상태에 액세스 할 수있는 경우 해당 에이전트가 환경에 액세스 할 수 있습니다. 그렇지 않으면 액세스 할 수 없습니다.
Deterministic/Non-deterministic− 환경의 다음 상태가 현재 상태와 에이전트의 작업에 의해 완전히 결정되면 환경은 결정적입니다. 그렇지 않으면 비 결정적입니다.
Episodic/Non-episodic− 에피소드 적 환경에서 각 에피소드는 에이전트가인지하고 행동하는 것으로 구성됩니다. 행동의 질은 에피소드 자체에 달려 있습니다. 후속 에피소드는 이전 에피소드의 작업에 의존하지 않습니다. 에피소드 환경은 에이전트가 미리 생각할 필요가 없기 때문에 훨씬 간단합니다.
Python으로 환경 구축
강화 학습 에이전트를 구축하기 위해 우리는 OpenAI Gym 다음 명령의 도움으로 설치할 수있는 패키지-
pip install gym
OpenAI 체육관에는 다양한 용도로 사용할 수있는 다양한 환경이 있습니다. 그들 중 몇 가지는Cartpole-v0, Hopper-v1, 및 MsPacman-v0. 그들은 다른 엔진이 필요합니다. 세부 문서OpenAI Gym 찾을 수 있습니다 https://gym.openai.com/docs/#environments.
다음 코드는 cartpole-v0 환경에 대한 Python 코드의 예를 보여줍니다.
import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
env.render()
env.step(env.action_space.sample())
비슷한 방식으로 다른 환경을 구성 할 수 있습니다.
Python으로 학습 에이전트 구성
강화 학습 에이전트를 구축하기 위해 우리는 OpenAI Gym 패키지-
import gym
env = gym.make('CartPole-v0')
for _ in range(20):
observation = env.reset()
for i in range(100):
env.render()
print(observation)
action = env.action_space.sample()
observation, reward, done, info = env.step(action)
if done:
print("Episode finished after {} timesteps".format(i+1))
break
카트 폴이 스스로 균형을 잡을 수 있는지 관찰하십시오.
이 장에서는 AI의 유전 알고리즘에 대해 자세히 설명합니다.
유전 알고리즘이란 무엇입니까?
유전 알고리즘 (GA)은 자연 선택 및 유전학의 개념을 기반으로하는 검색 기반 알고리즘입니다. GA는 Evolutionary Computation으로 알려진 훨씬 더 큰 계산 분야의 하위 집합입니다.
GA는 미시간 대학교의 John Holland와 그의 학생 및 동료, 특히 David E. Goldberg가 개발했습니다. 이후 다양한 최적화 문제에 대해 높은 수준의 성공을 거두었습니다.
GA에는 주어진 문제에 대한 가능한 솔루션 풀이 있습니다. 그런 다음 이러한 솔루션은 재조합과 돌연변이 (자연 유전학에서와 같이)를 거쳐 새로운 어린이를 생성하며이 과정은 여러 세대에 걸쳐 반복됩니다. 각 개인 (또는 후보 솔루션)에는 적합성 값 (목적 함수 값을 기반으로 함)이 할당되고 피팅 자 개인에게는 짝짓기 및 양보 할 더 높은 기회가 제공됩니다.fitter개인. 이것은 다윈주의 이론과 일치합니다.Survival of the Fittest.
따라서 evolving 중단 기준에 도달 할 때까지 세대에 걸쳐 더 나은 개인 또는 솔루션을 제공합니다.
유전 알고리즘은 본질적으로 충분히 무작위 화되어 있지만, 역사적 정보도 활용하기 때문에 무작위 로컬 검색 (우리가 무작위 솔루션을 시도하고 지금까지 최고를 추적하는 것)보다 훨씬 더 잘 수행됩니다.
최적화 문제에 GA를 사용하는 방법?
최적화는 설계, 상황, 자원 및 시스템을 최대한 효과적으로 만드는 작업입니다. 다음 블록 다이어그램은 최적화 프로세스를 보여줍니다.
최적화 프로세스를위한 GA 메커니즘의 단계
다음은 문제 최적화에 사용될 때 GA 메커니즘의 일련의 단계입니다.
1 단계-초기 모집단을 무작위로 생성합니다.
2 단계-최적의 피트니스 값을 가진 초기 솔루션을 선택합니다.
3 단계-돌연변이 및 교차 연산자를 사용하여 선택한 솔루션을 다시 결합합니다.
4 단계-개체군에 자손을 삽입합니다.
5 단계-이제 중지 조건이 충족되면 최적의 피트니스 값으로 솔루션을 반환합니다. 그렇지 않으면 2 단계로 이동합니다.
필요한 패키지 설치
Python에서 Genetic Algorithms를 사용하여 문제를 해결하기 위해 GA를위한 강력한 패키지를 사용할 것입니다. DEAP. 신속한 프로토 타이핑 및 아이디어 테스트를위한 새로운 진화 계산 프레임 워크 라이브러리입니다. 명령 프롬프트에서 다음 명령을 사용하여이 패키지를 설치할 수 있습니다.
pip install deap
사용하는 경우 anaconda 환경, 다음 명령을 사용하여 deap을 설치할 수 있습니다-
conda install -c conda-forge deap
유전 알고리즘을 사용하여 솔루션 구현
이 섹션에서는 유전 알고리즘을 사용한 솔루션 구현에 대해 설명합니다.
비트 패턴 생성
다음 예제는 15 개의 1을 포함하는 비트 문자열을 생성하는 방법을 보여줍니다. One Max 문제.
그림과 같이 필요한 패키지를 가져옵니다.
import random
from deap import base, creator, tools
평가 기능을 정의합니다. 유전 알고리즘을 만드는 첫 번째 단계입니다.
def eval_func(individual):
target_sum = 15
return len(individual) - abs(sum(individual) - target_sum),
이제 올바른 매개 변수로 도구 상자를 만듭니다.
def create_toolbox(num_bits):
creator.create("FitnessMax", base.Fitness, weights=(1.0,))
creator.create("Individual", list, fitness=creator.FitnessMax)
도구 상자 초기화
toolbox = base.Toolbox()
toolbox.register("attr_bool", random.randint, 0, 1)
toolbox.register("individual", tools.initRepeat, creator.Individual,
toolbox.attr_bool, num_bits)
toolbox.register("population", tools.initRepeat, list, toolbox.individual)
평가 연산자 등록-
toolbox.register("evaluate", eval_func)
이제 크로스 오버 연산자를 등록하십시오.
toolbox.register("mate", tools.cxTwoPoint)
돌연변이 연산자 등록-
toolbox.register("mutate", tools.mutFlipBit, indpb = 0.05)
번식 연산자 정의-
toolbox.register("select", tools.selTournament, tournsize = 3)
return toolbox
if __name__ == "__main__":
num_bits = 45
toolbox = create_toolbox(num_bits)
random.seed(7)
population = toolbox.population(n = 500)
probab_crossing, probab_mutating = 0.5, 0.2
num_generations = 10
print('\nEvolution process starts')
전체 모집단 평가-
fitnesses = list(map(toolbox.evaluate, population))
for ind, fit in zip(population, fitnesses):
ind.fitness.values = fit
print('\nEvaluated', len(population), 'individuals')
생성 및 세대를 통해 반복-
for g in range(num_generations):
print("\n- Generation", g)
차세대 개인 선택-
offspring = toolbox.select(population, len(population))
이제 선택한 개인을 복제합니다.
offspring = list(map(toolbox.clone, offspring))
자손에 크로스 오버와 돌연변이 적용-
for child1, child2 in zip(offspring[::2], offspring[1::2]):
if random.random() < probab_crossing:
toolbox.mate(child1, child2)
자녀의 체력 값 삭제
del child1.fitness.values
del child2.fitness.values
자, 변이를 적용하십시오-
for mutant in offspring:
if random.random() < probab_mutating:
toolbox.mutate(mutant)
del mutant.fitness.values
적합하지 않은 개인을 평가하십시오-
invalid_ind = [ind for ind in offspring if not ind.fitness.valid]
fitnesses = map(toolbox.evaluate, invalid_ind)
for ind, fit in zip(invalid_ind, fitnesses):
ind.fitness.values = fit
print('Evaluated', len(invalid_ind), 'individuals')
이제 인구를 차세대 개인으로 대체하십시오.
population[:] = offspring
현재 세대에 대한 통계를 인쇄-
fits = [ind.fitness.values[0] for ind in population]
length = len(population)
mean = sum(fits) / length
sum2 = sum(x*x for x in fits)
std = abs(sum2 / length - mean**2)**0.5
print('Min =', min(fits), ', Max =', max(fits))
print('Average =', round(mean, 2), ', Standard deviation =',
round(std, 2))
print("\n- Evolution ends")
최종 출력 인쇄-
best_ind = tools.selBest(population, 1)[0]
print('\nBest individual:\n', best_ind)
print('\nNumber of ones:', sum(best_ind))
Following would be the output:
Evolution process starts
Evaluated 500 individuals
- Generation 0
Evaluated 295 individuals
Min = 32.0 , Max = 45.0
Average = 40.29 , Standard deviation = 2.61
- Generation 1
Evaluated 292 individuals
Min = 34.0 , Max = 45.0
Average = 42.35 , Standard deviation = 1.91
- Generation 2
Evaluated 277 individuals
Min = 37.0 , Max = 45.0
Average = 43.39 , Standard deviation = 1.46
… … … …
- Generation 9
Evaluated 299 individuals
Min = 40.0 , Max = 45.0
Average = 44.12 , Standard deviation = 1.11
- Evolution ends
Best individual:
[0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1,
1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0,
1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1]
Number of ones: 15
기호 회귀 문제
유전 프로그래밍에서 가장 잘 알려진 문제 중 하나입니다. 모든 기호 회귀 문제는 임의의 데이터 분포를 사용하고 기호 공식을 사용하여 가장 정확한 데이터를 맞추려고합니다. 일반적으로 RMSE (Root Mean Square Error)와 같은 측정은 개인의 체력을 측정하는 데 사용됩니다. 이것은 고전적인 회귀 문제이고 여기서 우리는 방정식을 사용합니다.5x3-6x2+8x=1. 위의 예에서 따라야하는 모든 단계를 따라야하지만, 평가를 시작할 수 있도록 개인을위한 구성 요소이기 때문에 기본 집합을 만드는 것이 주요 부분입니다. 여기서 우리는 고전적인 프리미티브 세트를 사용할 것입니다.
다음 Python 코드는 이것을 자세히 설명합니다.
import operator
import math
import random
import numpy as np
from deap import algorithms, base, creator, tools, gp
def division_operator(numerator, denominator):
if denominator == 0:
return 1
return numerator / denominator
def eval_func(individual, points):
func = toolbox.compile(expr=individual)
return math.fsum(mse) / len(points),
def create_toolbox():
pset = gp.PrimitiveSet("MAIN", 1)
pset.addPrimitive(operator.add, 2)
pset.addPrimitive(operator.sub, 2)
pset.addPrimitive(operator.mul, 2)
pset.addPrimitive(division_operator, 2)
pset.addPrimitive(operator.neg, 1)
pset.addPrimitive(math.cos, 1)
pset.addPrimitive(math.sin, 1)
pset.addEphemeralConstant("rand101", lambda: random.randint(-1,1))
pset.renameArguments(ARG0 = 'x')
creator.create("FitnessMin", base.Fitness, weights = (-1.0,))
creator.create("Individual",gp.PrimitiveTree,fitness=creator.FitnessMin)
toolbox = base.Toolbox()
toolbox.register("expr", gp.genHalfAndHalf, pset=pset, min_=1, max_=2)
toolbox.expr)
toolbox.register("population",tools.initRepeat,list, toolbox.individual)
toolbox.register("compile", gp.compile, pset = pset)
toolbox.register("evaluate", eval_func, points = [x/10. for x in range(-10,10)])
toolbox.register("select", tools.selTournament, tournsize = 3)
toolbox.register("mate", gp.cxOnePoint)
toolbox.register("expr_mut", gp.genFull, min_=0, max_=2)
toolbox.register("mutate", gp.mutUniform, expr = toolbox.expr_mut, pset = pset)
toolbox.decorate("mate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
toolbox.decorate("mutate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
return toolbox
if __name__ == "__main__":
random.seed(7)
toolbox = create_toolbox()
population = toolbox.population(n = 450)
hall_of_fame = tools.HallOfFame(1)
stats_fit = tools.Statistics(lambda x: x.fitness.values)
stats_size = tools.Statistics(len)
mstats = tools.MultiStatistics(fitness=stats_fit, size = stats_size)
mstats.register("avg", np.mean)
mstats.register("std", np.std)
mstats.register("min", np.min)
mstats.register("max", np.max)
probab_crossover = 0.4
probab_mutate = 0.2
number_gen = 10
population, log = algorithms.eaSimple(population, toolbox,
probab_crossover, probab_mutate, number_gen,
stats = mstats, halloffame = hall_of_fame, verbose = True)
모든 기본 단계는 비트 패턴을 생성하는 동안 사용 된 것과 동일합니다. 이 프로그램은 10 개 생성 후 최소, 최대, 표준 편차 (표준 편차)로 출력을 제공합니다.
컴퓨터 비전은 컴퓨터 소프트웨어와 하드웨어를 사용하여 인간의 비전을 모델링하고 복제하는 것과 관련이 있습니다. 이 장에서는 이에 대해 자세히 배웁니다.
컴퓨터 시각 인식
컴퓨터 비전은 장면에 존재하는 구조의 특성과 관련하여 2D 이미지에서 3D 장면을 재구성, 중단 및 이해하는 방법을 연구하는 학문입니다.
컴퓨터 비전 계층
컴퓨터 비전은 다음과 같이 세 가지 기본 범주로 나뉩니다.
Low-level vision − 특징 추출을위한 공정 이미지를 포함합니다.
Intermediate-level vision − 물체 인식 및 3D 장면 해석 포함
High-level vision − 활동, 의도 및 행동과 같은 장면에 대한 개념적 설명이 포함됩니다.
컴퓨터 비전 대 이미지 처리
이미지 처리는 이미지에서 이미지로의 변환을 연구합니다. 이미지 처리의 입력과 출력은 모두 이미지입니다.
컴퓨터 비전은 이미지에서 물리적 객체에 대한 명시적이고 의미있는 설명을 구성하는 것입니다. 컴퓨터 비전의 출력은 3D 장면의 구조에 대한 설명 또는 해석입니다.
응용
컴퓨터 비전은 다음 분야에서 응용 프로그램을 찾습니다-
Robotics
현지화로 로봇 위치를 자동으로 결정
Navigation
장애물 회피
조립 (페그 인 홀, 용접, 도장)
조작 (예 : PUMA 로봇 조작기)
HRI (Human Robot Interaction) : 사람들과 상호 작용하고 서비스를 제공하는 지능형 로봇
Medicine
분류 및 검출 (예 : 병변 또는 세포 분류 및 종양 검출)
2D / 3D 분할
3D 인간 장기 재건 (MRI 또는 초음파)
비전 유도 로봇 수술
Security
- 생체 인식 (홍채, 지문, 얼굴 인식)
- 특정 의심스러운 활동 또는 행동을 감시 감지
Transportation
- 자율 주행 차
- 안전 (예 : 운전자 경계 모니터링)
Industrial Automation Application
- 산업 검사 (결함 감지)
- Assembly
- 바코드 및 포장 라벨 판독
- 개체 정렬
- 문서 이해 (예 : OCR)
유용한 패키지 설치
Python을 사용하는 컴퓨터 비전의 경우 다음과 같은 인기있는 라이브러리를 사용할 수 있습니다. OpenCV(오픈 소스 컴퓨터 비전). 주로 실시간 컴퓨터 비전을 겨냥한 프로그래밍 함수 라이브러리입니다. C ++로 작성되었으며 기본 인터페이스는 C ++로 작성되었습니다. 다음 명령을 사용하여이 패키지를 설치할 수 있습니다.
pip install opencv_python-X.X-cp36-cp36m-winX.whl
여기서 X는 컴퓨터에 설치된 Python 버전과 사용중인 win32 또는 64 비트를 나타냅니다.
사용하는 경우 anaconda 환경에서 다음 명령을 사용하여 OpenCV를 설치하십시오-
conda install -c conda-forge opencv
이미지 읽기, 쓰기 및 표시
대부분의 CV 애플리케이션은 이미지를 입력으로 가져오고 이미지를 출력으로 생성해야합니다. 이 섹션에서는 OpenCV에서 제공하는 기능을 사용하여 이미지 파일을 읽고 쓰는 방법을 배웁니다.
이미지 파일 읽기, 표시, 쓰기를위한 OpenCV 함수
OpenCV는이를 위해 다음과 같은 기능을 제공합니다.
imread() function− 이미지를 읽는 기능입니다. OpenCV imread ()는 PNG, JPEG, JPG, TIFF 등과 같은 다양한 이미지 형식을 지원합니다.
imshow() function− 창에 이미지를 표시하는 기능입니다. 창이 이미지 크기에 자동으로 맞춰집니다. OpenCV imshow ()는 PNG, JPEG, JPG, TIFF 등과 같은 다양한 이미지 형식을 지원합니다.
imwrite() function− 이미지를 작성하는 기능입니다. OpenCV imwrite ()는 PNG, JPEG, JPG, TIFF 등과 같은 다양한 이미지 형식을 지원합니다.
예
이 예제는 하나의 형식으로 이미지를 읽기위한 Python 코드를 보여줍니다. 창에 표시하고 다른 형식으로 동일한 이미지를 작성합니다. 아래 표시된 단계를 고려하십시오.
그림과 같이 OpenCV 패키지를 가져옵니다.
import cv2
이제 특정 이미지를 읽으려면 imread () 함수를 사용하십시오.
image = cv2.imread('image_flower.jpg')
이미지를 표시하려면 imshow()함수. 이미지를 볼 수있는 창의 이름은 다음과 같습니다.image_flower.
cv2.imshow('image_flower',image)
cv2.destroyAllwindows()
이제 imwrite () 함수를 사용하여 .png와 같은 다른 형식으로 동일한 이미지를 쓸 수 있습니다.
cv2.imwrite('image_flower.png',image)
True 출력은 이미지가 동일한 폴더에도 .png 파일로 성공적으로 기록되었음을 의미합니다.
True
참조 : destroyallWindows () 함수는 우리가 만든 모든 창을 단순히 파괴합니다.
색 공간 변환
OpenCV에서 이미지는 기존의 RGB 색상을 사용하여 저장되지 않고 역순 즉 BGR 순서로 저장됩니다. 따라서 이미지를 읽는 동안 기본 색상 코드는 BGR입니다. 그만큼cvtColor() 한 색상 코드에서 다른 색상 코드로 이미지를 변환하기위한 색상 변환 기능.
예
이미지를 BGR에서 그레이 스케일로 변환하려면이 예제를 고려하십시오.
가져 오기 OpenCV 패키지-
import cv2
이제 특정 이미지를 읽으려면 imread () 함수를 사용하십시오.
image = cv2.imread('image_flower.jpg')
이제이 이미지를 보면 imshow() 그러면이 이미지가 BGR에 있음을 알 수 있습니다.
cv2.imshow('BGR_Penguins',image)
이제 cvtColor() 이 이미지를 회색조로 변환하는 함수입니다.
image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)
가장자리 감지
인간은 대략적인 스케치를 본 후 많은 물체 유형과 포즈를 쉽게 인식 할 수 있습니다. 그렇기 때문에 엣지는 인간의 삶과 컴퓨터 비전의 응용에서 중요한 역할을합니다. OpenCV는 매우 간단하고 유용한 기능을 제공합니다.Canny()가장자리를 감지합니다.
예
다음 예는 모서리의 명확한 식별을 보여줍니다.
그림과 같이 OpenCV 패키지 가져 오기-
import cv2
import numpy as np
이제 특정 이미지를 읽으려면 imread() 함수.
image = cv2.imread('Penguins.jpg')
이제 Canny () 이미 읽은 이미지의 가장자리를 감지하는 기능.
cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))
이제 가장자리가있는 이미지를 표시하려면 imshow () 함수를 사용하십시오.
cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))
이 Python 프로그램은 edges_penguins.jpg 가장자리 감지 기능이 있습니다.
얼굴 인식
얼굴 인식은 컴퓨터 비전의 매력적인 응용 프로그램 중 하나로서 미래형 일뿐만 아니라 현실적입니다. OpenCV에는 얼굴 감지를 수행하는 기능이 내장되어 있습니다. 우리는Haar 얼굴 감지를위한 캐스케이드 분류기.
Haar Cascade 데이터
Haar 캐스케이드 분류기를 사용하려면 데이터가 필요합니다. 이 데이터는 OpenCV 패키지에서 찾을 수 있습니다. OpenCv를 설치하면 폴더 이름을 볼 수 있습니다haarcascades. 다른 응용 프로그램에 대한 .xml 파일이 있습니다. 이제 다른 용도로 모두 복사 한 다음 현재 프로젝트 아래의 새 폴더에 붙여 넣습니다.
Example
다음은 Haar Cascade를 사용하여 다음 이미지에 표시된 Amitabh Bachan의 얼굴을 감지하는 Python 코드입니다.
가져 오기 OpenCV 패키지-
import cv2
import numpy as np
이제 HaarCascadeClassifier 얼굴 감지 용 −
face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')
이제 특정 이미지를 읽으려면 imread() 기능-
img = cv2.imread('AB.jpg')
이제 회색 이미지를 받아들이 기 때문에 회색조로 변환합니다.
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
이제 face_detection.detectMultiScale, 실제 얼굴 감지 수행
faces = face_detection.detectMultiScale(gray, 1.3, 5)
이제 얼굴 전체에 직사각형을 그립니다.
for (x,y,w,h) in faces:
img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)
이 Python 프로그램은 Face_AB.jpg 그림과 같이 얼굴 인식 기능
눈 감지
눈 감지는 컴퓨터 비전의 또 다른 매력적인 응용 프로그램으로 미래형 일뿐만 아니라 현실감있게 만듭니다. OpenCV에는 눈 감지를 수행하는 기능이 내장되어 있습니다. 우리는Haar cascade 눈 감지를위한 분류기.
예
다음 예제는 Haar Cascade를 사용하여 다음 이미지에 제공된 Amitabh Bachan의 얼굴을 감지하는 Python 코드를 제공합니다.
그림과 같이 OpenCV 패키지 가져 오기-
import cv2
import numpy as np
이제 HaarCascadeClassifier 얼굴 감지 용 −
eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')
이제 특정 이미지를 읽으려면 imread() 함수
img = cv2.imread('AB_Eye.jpg')
이제 회색 이미지를 받아들이 기 때문에 회색조로 변환합니다.
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
이제 도움으로 eye_cascade.detectMultiScale, 실제 얼굴 감지 수행
eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)
이제 얼굴 전체에 직사각형을 그립니다.
for (ex,ey,ew,eh) in eyes:
img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)
이 Python 프로그램은 Eye_AB.jpg 그림과 같이 눈 감지 기능 포함-
인공 신경망 (ANN)은 생물학적 신경망의 비유에서 차용 한 중심 주제 인 효율적인 컴퓨팅 시스템입니다. 신경망은 기계 학습을위한 모델의 한 유형입니다. 1980 년대 중반과 1990 년대 초에 신경망에서 많은 중요한 아키텍처 발전이 이루어졌습니다. 이 장에서는 AI의 접근 방식 인 딥 러닝에 대해 자세히 알아 봅니다.
딥 러닝은이 분야의 심각한 경쟁자로서 10 년의 폭발적인 컴퓨팅 성장을 통해 탄생했습니다. 따라서 딥 러닝은 알고리즘이 인간 두뇌의 구조와 기능에서 영감을받은 특정한 종류의 기계 학습입니다.
기계 학습 대 딥 러닝
딥 러닝은 요즘 가장 강력한 머신 러닝 기술입니다. 문제를 해결하는 방법을 배우면서 문제를 표현하는 가장 좋은 방법을 배우기 때문에 매우 강력합니다. 딥 러닝과 머신 러닝의 비교는 다음과 같습니다.
데이터 종속성
첫 번째 차이점은 데이터 규모가 증가 할 때 DL 및 ML의 성능을 기반으로합니다. 데이터가 크면 딥 러닝 알고리즘이 매우 잘 수행됩니다.
기계 의존성
딥 러닝 알고리즘이 완벽하게 작동하려면 고급 기계가 필요합니다. 반면에 기계 학습 알고리즘은 저사양 기계에서도 작동 할 수 있습니다.
특징 추출
딥 러닝 알고리즘은 높은 수준의 기능을 추출하고 동일한 기능으로부터 학습을 시도 할 수 있습니다. 반면에 기계 학습으로 추출 된 대부분의 기능을 식별하려면 전문가가 필요합니다.
실행 시간
실행 시간은 알고리즘에 사용되는 수많은 매개 변수에 따라 다릅니다. 딥 러닝에는 기계 학습 알고리즘보다 더 많은 매개 변수가 있습니다. 따라서 DL 알고리즘의 실행 시간, 특히 훈련 시간은 ML 알고리즘보다 훨씬 깁니다. 그러나 DL 알고리즘의 테스트 시간은 ML 알고리즘보다 적습니다.
문제 해결에 대한 접근
딥 러닝은 문제를 엔드 투 엔드로 해결하는 반면 머신 러닝은 문제를 여러 부분으로 분해하여 문제를 해결하는 전통적인 방법을 사용합니다.
컨볼 루션 신경망 (CNN)
컨볼 루션 신경망은 학습 가능한 가중치와 편향이있는 뉴런으로 구성되기 때문에 일반 신경망과 동일합니다. 일반 신경망은 입력 데이터의 구조를 무시하고 모든 데이터를 네트워크에 공급하기 전에 1 차원 배열로 변환합니다. 이 프로세스는 일반 데이터에 적합하지만 데이터에 이미지가 포함 된 경우 프로세스가 번거로울 수 있습니다.
CNN은이 문제를 쉽게 해결합니다. 이미지를 처리 할 때 이미지의 2D 구조를 고려하여 이미지에 특정한 속성을 추출 할 수 있습니다. 이러한 방식으로 CNN의 주요 목표는 입력 레이어의 원시 이미지 데이터에서 출력 레이어의 올바른 클래스로 이동하는 것입니다. 일반 NN과 CNN의 유일한 차이점은 입력 데이터 처리와 계층 유형입니다.
CNN의 아키텍처 개요
구조적으로 일반 신경망은 입력을 받아 일련의 숨겨진 레이어를 통해 변환합니다. 모든 계층은 뉴런의 도움으로 다른 계층에 연결됩니다. 일반적인 신경망의 가장 큰 단점은 전체 이미지로 잘 확장되지 않는다는 것입니다.
CNN의 아키텍처에는 너비, 높이 및 깊이라는 3 차원으로 정렬 된 뉴런이 있습니다. 현재 계층의 각 뉴런은 이전 계층의 출력의 작은 패치에 연결됩니다. 오버레이와 유사합니다.×입력 이미지를 필터링합니다. 그것은 사용합니다M모든 세부 사항을 확인하는 필터입니다. 이들M 필터는 모서리, 모서리 등과 같은 기능을 추출하는 기능 추출기입니다.
CNN을 구성하는 데 사용되는 레이어
다음 레이어는 CNN을 구성하는 데 사용됩니다-
Input Layer − 원본 이미지 데이터를 그대로 가져옵니다.
Convolutional Layer−이 계층은 대부분의 계산을 수행하는 CNN의 핵심 빌딩 블록입니다. 이 계층은 입력에서 뉴런과 다양한 패치 사이의 회선을 계산합니다.
Rectified Linear Unit Layer− 이전 레이어의 출력에 활성화 기능을 적용합니다. 네트워크에 비선형 성을 추가하여 모든 유형의 기능에 잘 일반화 할 수 있습니다.
Pooling Layer− 풀링은 네트워크에서 발전하는 동안 중요한 부분 만 유지하는 데 도움이됩니다. 풀링 레이어는 입력의 모든 깊이 슬라이스에서 독립적으로 작동하며 공간적으로 크기를 조정합니다. MAX 기능을 사용합니다.
Fully Connected layer/Output layer −이 계층은 마지막 계층의 출력 점수를 계산합니다. 결과 출력은 크기입니다.×× , 여기서 L은 훈련 데이터 세트 클래스의 수입니다.
유용한 Python 패키지 설치
당신이 사용할 수있는 Keras, Python으로 작성되었으며 TensorFlow, CNTK 또는 Theno에서 실행할 수있는 고수준 신경망 API입니다. Python 2.7-3.6과 호환됩니다. 자세한 내용은https://keras.io/.
다음 명령을 사용하여 keras를 설치하십시오-
pip install keras
의 위에 conda 환경에서는 다음 명령을 사용할 수 있습니다.
conda install –c conda-forge keras
ANN을 사용하여 선형 회귀 기 구축
이 섹션에서는 인공 신경망을 사용하여 선형 회귀자를 만드는 방법을 배웁니다. 당신이 사용할 수있는KerasRegressor이것을 달성하기 위해. 이 예에서는 Boston의 부동산에 대해 13 개의 숫자가있는 Boston 주택 가격 데이터 세트를 사용하고 있습니다. 동일한 Python 코드가 여기에 표시됩니다.
그림과 같이 필요한 모든 패키지를 가져옵니다.
import numpy
import pandas
from keras.models import Sequential
from keras.layers import Dense
from keras.wrappers.scikit_learn import KerasRegressor
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold
이제 로컬 디렉토리에 저장된 데이터 세트를로드합니다.
dataframe = pandas.read_csv("/Usrrs/admin/data.csv", delim_whitespace = True, header = None)
dataset = dataframe.values
이제 데이터를 입력 및 출력 변수 즉, X 및 Y로 나눕니다.
X = dataset[:,0:13]
Y = dataset[:,13]
기준 신경망을 사용하기 때문에 모델을 정의합니다.
def baseline_model():
이제 다음과 같이 모델을 만듭니다.
model_regressor = Sequential()
model_regressor.add(Dense(13, input_dim = 13, kernel_initializer = 'normal',
activation = 'relu'))
model_regressor.add(Dense(1, kernel_initializer = 'normal'))
다음으로, 모델을 컴파일하십시오-
model_regressor.compile(loss='mean_squared_error', optimizer='adam')
return model_regressor
이제 다음과 같이 재현성을 위해 랜덤 시드를 수정합니다.
seed = 7
numpy.random.seed(seed)
사용을위한 Keras 래퍼 객체 scikit-learn 회귀 추정기가 호출됨에 따라 KerasRegressor. 이 섹션에서는 표준화 데이터 세트로이 모델을 평가할 것입니다.
estimator = KerasRegressor(build_fn = baseline_model, nb_epoch = 100, batch_size = 5, verbose = 0)
kfold = KFold(n_splits = 10, random_state = seed)
baseline_result = cross_val_score(estimator, X, Y, cv = kfold)
print("Baseline: %.2f (%.2f) MSE" % (Baseline_result.mean(),Baseline_result.std()))
위에 표시된 코드의 출력은 보이지 않는 데이터에 대한 문제에 대한 모델의 성능 추정치입니다. 교차 검증 평가의 모든 10 배에 걸친 평균 및 표준 편차를 포함하는 평균 제곱 오차가됩니다.
이미지 분류기 : 딥 러닝의 응용
컨볼 루션 신경망 (CNN)은 이미지 분류 문제, 즉 입력 이미지가 속한 클래스를 해결합니다. Keras 딥 러닝 라이브러리를 사용할 수 있습니다. 우리는 다음 링크에서 고양이와 강아지 이미지의 훈련 및 테스트 데이터 세트를 사용하고 있습니다.https://www.kaggle.com/c/dogs-vs-cats/data.
그림과 같이 중요한 keras 라이브러리와 패키지를 가져옵니다.
순차라는 다음 패키지는 신경망을 순차 네트워크로 초기화합니다.
from keras.models import Sequential
다음 패키지는 Conv2D CNN의 첫 번째 단계 인 convolution 연산을 수행하는 데 사용됩니다.
from keras.layers import Conv2D
다음 패키지는 MaxPoling2D CNN의 두 번째 단계 인 풀링 작업을 수행하는 데 사용됩니다.
from keras.layers import MaxPooling2D
다음 패키지는 Flatten 모든 결과 2D 배열을 하나의 긴 연속 선형 벡터로 변환하는 프로세스입니다.
from keras.layers import Flatten
다음 패키지는 Dense CNN의 네 번째 단계 인 신경망의 전체 연결을 수행하는 데 사용됩니다.
from keras.layers import Dense
이제 순차 클래스의 객체를 만듭니다.
S_classifier = Sequential()
이제 다음 단계는 컨볼 루션 부분을 코딩하는 것입니다.
S_classifier.add(Conv2D(32, (3, 3), input_shape = (64, 64, 3), activation = 'relu'))
여기 relu 정류기 기능입니다.
이제 CNN의 다음 단계는 컨볼 루션 부분 이후 결과 피쳐 맵에 대한 풀링 작업입니다.
S-classifier.add(MaxPooling2D(pool_size = (2, 2)))
이제 아첨을 사용하여 풀링 된 모든 이미지를 연속 벡터로 변환합니다.
S_classifier.add(Flatten())
다음으로 완전 연결 계층을 만듭니다.
S_classifier.add(Dense(units = 128, activation = 'relu'))
여기서 128은 은닉 유닛의 수입니다. 은닉 유닛 수를 2의 거듭 제곱으로 정의하는 것이 일반적입니다.
이제 다음과 같이 출력 계층을 초기화하십시오.
S_classifier.add(Dense(units = 1, activation = 'sigmoid'))
이제 CNN을 컴파일하고 다음을 구축했습니다.
S_classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])
여기서 옵티 마이저 매개 변수는 확률 적 경사 하강 법 알고리즘을 선택하는 것이고 손실 매개 변수는 손실 함수를 선택하는 것이고 메트릭 매개 변수는 성능 지표를 선택하는 것입니다.
이제 이미지 확대를 수행 한 다음 이미지를 신경망에 맞 춥니 다.
train_datagen = ImageDataGenerator(rescale = 1./255,shear_range = 0.2,
zoom_range = 0.2,
horizontal_flip = True)
test_datagen = ImageDataGenerator(rescale = 1./255)
training_set =
train_datagen.flow_from_directory(”/Users/admin/training_set”,target_size =
(64, 64),batch_size = 32,class_mode = 'binary')
test_set =
test_datagen.flow_from_directory('test_set',target_size =
(64, 64),batch_size = 32,class_mode = 'binary')
이제 우리가 만든 모델에 데이터를 맞 춥니 다.
classifier.fit_generator(training_set,steps_per_epoch = 8000,epochs =
25,validation_data = test_set,validation_steps = 2000)
여기 steps_per_epoch에는 훈련 이미지의 수가 있습니다.
이제 모델이 학습되었으므로 다음과 같이 예측에 사용할 수 있습니다.
from keras.preprocessing import image
test_image = image.load_img('dataset/single_prediction/cat_or_dog_1.jpg',
target_size = (64, 64))
test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis = 0)
result = classifier.predict(test_image)
training_set.class_indices
if result[0][0] == 1:
prediction = 'dog'
else:
prediction = 'cat'