Theano-퀵 가이드
Python으로 기계 학습 모델을 개발 했습니까? 그렇다면 분명히 이러한 모델을 개발하는 데있어 복잡한 점을 알고 있습니다. 개발은 일반적으로 몇 시간과 며칠이 걸리는 연산 능력이 느린 프로세스입니다.
기계 학습 모델 개발에는 많은 수학적 계산이 필요합니다. 여기에는 일반적으로 산술 계산, 특히 다차원의 큰 행렬이 필요합니다. 요즘 우리는 머신 러닝 애플리케이션을 개발하기 위해 전통적인 통계 기술보다는 신경망을 사용합니다. 신경망은 엄청난 양의 데이터에 대해 훈련되어야합니다. 훈련은 합리적인 크기의 데이터 배치로 수행됩니다. 따라서 학습 과정은 반복적입니다. 따라서 계산이 효율적으로 수행되지 않으면 네트워크 훈련에 몇 시간 또는 며칠이 걸릴 수 있습니다. 따라서 실행 가능한 코드의 최적화가 매우 필요합니다. 이것이 바로 Theano가 제공하는 것입니다.
Theano는 기계 학습에 사용되는 수학 표현식을 정의하고 이러한 표현식을 최적화하며 결정적으로 중요한 영역에서 GPU를 사용하여 매우 효율적으로 평가할 수있는 Python 라이브러리입니다. 대부분의 경우 일반적인 전체 C 구현과 경쟁 할 수 있습니다.
Theano는 효율적인 기계 학습 알고리즘의 신속한 개발을 제공 할 목적으로 LISA 연구소에서 작성되었습니다. BSD 라이선스로 출시되었습니다.
이 튜토리얼에서는 Theano 라이브러리를 사용하는 방법을 배웁니다.
Theano는 Windows, MacOS 및 Linux에 설치할 수 있습니다. 모든 경우에 설치는 간단합니다. Theano를 설치하기 전에 종속성을 설치해야합니다. 다음은 종속성 목록입니다-
- Python
- NumPy-필수
- SciPy-희소 행렬 및 특수 기능에만 필요
- BLAS − 기본 벡터 및 행렬 연산을 수행하기위한 표준 빌딩 블록을 제공합니다.
필요에 따라 설치할 수있는 옵션 패키지는 다음과 같습니다.
- nose : Theano의 테스트 스위트를 실행하려면
- Sphinx − 문서 작성 용
- Graphiz 및 pydot-그래픽 및 이미지 처리
- NVIDIA CUDA 드라이버-GPU 코드 생성 / 실행에 필요
- libgpuarray-CUDA 및 OpenCL 장치에서 GPU / CPU 코드 생성에 필요
MacOS에 Theano를 설치하는 단계에 대해 설명하겠습니다.
MacOS 설치
Theano 및 해당 종속성을 설치하려면 pip다음과 같이 명령 줄에서. 이 튜토리얼에서 필요한 최소한의 종속성입니다.
$ pip install Theano
$ pip install numpy
$ pip install scipy
$ pip install pydot
또한 다음 명령을 사용하여 OSx 명령 줄 개발자 도구를 설치해야합니다.
$ xcode-select --install
다음 화면이 표시됩니다. 클릭Install 버튼을 눌러 도구를 설치하십시오.
성공적으로 설치되면 콘솔에 성공 메시지가 표시됩니다.
설치 테스트
설치가 성공적으로 완료되면 Anaconda Jupyter에서 새 노트북을 엽니 다. 코드 셀에 다음 Python 스크립트를 입력하십시오.
예
import theano
from theano import tensor
a = tensor.dscalar()
b = tensor.dscalar()
c = a + b
f = theano.function([a,b], c)
d = f(1.5, 2.5)
print (d)
산출
스크립트를 실행하면 다음 출력이 표시됩니다.
4.0
빠른 참조를 위해 실행 스크린 샷이 아래에 나와 있습니다.
위의 출력이 나오면 Theano 설치가 완료된 것입니다. 그렇지 않은 경우 Theano 다운로드 페이지의 디버그 지침에 따라 문제를 해결하십시오.
Theano는 무엇입니까?
이제 Theano를 성공적으로 설치 했으므로 먼저 Theano가 무엇인지 이해해 보겠습니다. Theano는 Python 라이브러리입니다. 특히 기계 학습 모델 개발에 사용되는 수학 표현식을 정의, 최적화 및 평가할 수 있습니다. Theano 자체에는 사전 정의 된 ML 모델이 포함되어 있지 않습니다. 그것은 단지 그것의 개발을 촉진합니다. 다차원 배열을 다룰 때 특히 유용합니다. Python의 과학적 계산을 위해 기본적이고 널리 사용되는 패키지 인 NumPy와 원활하게 통합됩니다.
Theano는 ML 개발에 사용되는 수학적 표현 정의를 용이하게합니다. 이러한 표현에는 일반적으로 행렬 산술, 미분, 기울기 계산 등이 포함됩니다.
Theano는 먼저 모델에 대한 전체 계산 그래프를 작성합니다. 그런 다음 그래프에 여러 최적화 기술을 적용하여이를 매우 효율적인 코드로 컴파일합니다. 컴파일 된 코드는 다음과 같은 특수 작업에 의해 Theano 런타임에 삽입됩니다.functionTheano에서 사용할 수 있습니다. 우리는 이것을 실행합니다function신경망을 훈련시키기 위해 반복적으로. 순수한 Python 코딩 또는 전체 C 구현을 사용하는 것과 비교하여 훈련 시간이 크게 단축됩니다.
이제 Theano 개발 과정을 이해하겠습니다. Theano에서 수학적 표현을 정의하는 방법부터 시작하겠습니다.
Theano의 사소한 표현을 정의하고 평가하여 Theano의 여정을 시작하겠습니다. 두 개의 스칼라를 더하는 다음과 같은 간단한 표현식을 고려하십시오.
c = a + b
어디 a, b 변수이고 c표현식 출력입니다. Theano에서는이 사소한 표현조차 정의하고 평가하는 것이 까다 롭습니다.
위의 식을 평가하는 단계를 이해합시다.
Theano 가져 오기
먼저 프로그램에서 Theano 라이브러리를 가져와야합니다. 다음 문을 사용합니다.
from theano import *
개별 패키지를 가져 오는 대신 위의 설명에서 *를 사용하여 Theano 라이브러리의 모든 패키지를 포함했습니다.
변수 선언
다음으로, 우리는 a 다음 문장을 사용하여-
a = tensor.dscalar()
그만큼 dscalar메서드는 10 진수 스칼라 변수를 선언합니다. 위 명령문을 실행하면 다음과 같은 변수가 생성됩니다.a프로그램 코드에서. 마찬가지로 변수를 생성합니다.b 다음 문장을 사용하여-
b = tensor.dscalar()
식 정의
다음으로이 두 변수에 대해 작동하는 표현식을 정의합니다. a 과 b.
c = a + b
Theano에서 위 명령문의 실행은 두 변수의 스칼라 추가를 수행하지 않습니다. a 과 b.
Theano 기능 정의
위의 식을 평가하려면 다음과 같이 Theano에서 함수를 정의해야합니다.
f = theano.function([a,b], c)
함수 function두 개의 인수를 취하며 첫 번째 인수는 함수에 대한 입력이고 두 번째 인수는 출력입니다. 위의 선언은 첫 번째 인수가 두 요소로 구성된 배열 유형임을 나타냅니다.a 과 b. 출력은 다음과 같은 스칼라 단위입니다.c. 이 함수는 변수 이름으로 참조됩니다.f 추가 코드에서.
Theano 함수 호출
함수 f에 대한 호출은 다음 문을 사용하여 이루어집니다.
d = f(3.5, 5.5)
함수에 대한 입력은 두 개의 스칼라로 구성된 배열입니다. 3.5 과 5.5. 실행 출력은 스칼라 변수에 할당됩니다.d. 내용을 인쇄하려면d, 우리는 print 성명-
print (d)
실행으로 인해 d 콘솔에 인쇄됩니다.이 경우 9.0입니다.
전체 프로그램 목록
빠른 참조를 위해 전체 프로그램 목록이 여기에 제공됩니다.
from theano import *
a = tensor.dscalar()
b = tensor.dscalar()
c = a + b
f = theano.function([a,b], c)
d = f(3.5, 5.5)
print (d)
위의 코드를 실행하면 출력이 9.0으로 표시됩니다. 스크린 샷이 여기에 표시됩니다.
이제 두 행렬의 곱셈을 계산하는 약간 더 복잡한 예를 살펴 보겠습니다.
두 행렬의 내적을 계산합니다. 첫 번째 행렬은 차원 2 x 3이고 두 번째 행렬은 차원 3 x 2입니다. 입력으로 사용한 행렬과 그 곱은 여기에 표현됩니다.
$$ \ begin {bmatrix} 0 & -1 & 2 \\ 4 & 11 & 2 \ end {bmatrix} \ : \ begin {bmatrix} 3 & -1 \\ 1 & 2 \\ 35 & 20 \ end {bmatrix} = \ begin {bmatrix} 11 & 0 \\ 35 & 20 \ end {bmatrix} $$변수 선언
위의 Theano 표현식을 작성하려면 먼저 다음과 같이 행렬을 나타내는 두 개의 변수를 선언합니다.
a = tensor.dmatrix()
b = tensor.dmatrix()
dmatrix는 double에 대한 행렬의 유형입니다. 우리는 어디에도 행렬 크기를 지정하지 않습니다. 따라서 이러한 변수는 모든 차원의 행렬을 나타낼 수 있습니다.
식 정의
내적을 계산하기 위해 우리는 dot 다음과 같이-
c = tensor.dot(a,b)
곱셈의 출력은 다음과 같은 행렬 변수에 할당됩니다. c.
Theano 기능 정의
다음으로 식을 평가하기 위해 이전 예제에서와 같이 함수를 정의합니다.
f = theano.function([a,b], c)
함수에 대한 입력은 행렬 유형 인 두 개의 변수 a와 b입니다. 함수 출력은 변수에 할당됩니다.c 자동으로 매트릭스 유형이됩니다.
Theano 함수 호출
이제 다음 명령문을 사용하여 함수를 호출합니다.
d = f([[0, -1, 2], [4, 11, 2]], [[3, -1],[1,2], [6,1]])
위 명령문의 두 변수는 NumPy 배열입니다. 여기에 표시된대로 NumPy 배열을 명시 적으로 정의 할 수 있습니다.
f(numpy.array([[0, -1, 2], [4, 11, 2]]),
numpy.array([[3, -1],[1,2], [6,1]]))
후 d 계산되어 그 값을 인쇄합니다.
print (d)
출력에 다음 출력이 표시됩니다.
[[11. 0.]
[25. 20.]]
전체 프로그램 목록
The complete program listing is given here:
from theano import *
a = tensor.dmatrix()
b = tensor.dmatrix()
c = tensor.dot(a,b)
f = theano.function([a,b], c)
d = f([[0, -1, 2],[4, 11, 2]], [[3, -1],[1,2],[6,1]])
print (d)
프로그램 실행의 스크린 샷은 다음과 같습니다.
위의 두 가지 예에서 Theano에서 우리는 Theano를 사용하여 결국 평가되는 표현식을 생성한다는 것을 알 수 있습니다. function. Theano는 고급 최적화 기술을 사용하여 표현식 실행을 최적화합니다. 계산 그래프를 시각화하기 위해 Theano는printing 라이브러리의 패키지.
스칼라 덧셈에 대한 기호 그래프
스칼라 추가 프로그램의 계산 그래프를 보려면 다음과 같이 인쇄 라이브러리를 사용하십시오.
theano.printing.pydotprint(f, outfile="scalar_addition.png", var_with_name_simple=True)
이 문을 실행하면 scalar_addition.png컴퓨터에 생성됩니다. 빠른 참조를 위해 저장된 계산 그래프가 여기에 표시됩니다.
위의 이미지를 생성하는 전체 프로그램 목록은 다음과 같습니다.
from theano import *
a = tensor.dscalar()
b = tensor.dscalar()
c = a + b
f = theano.function([a,b], c)
theano.printing.pydotprint(f, outfile="scalar_addition.png", var_with_name_simple=True)
행렬 승수에 대한 기호 그래프
이제 행렬 승수에 대한 계산 그래프를 만들어보십시오. 이 그래프를 생성하기위한 전체 목록은 다음과 같습니다.
from theano import *
a = tensor.dmatrix()
b = tensor.dmatrix()
c = tensor.dot(a,b)
f = theano.function([a,b], c)
theano.printing.pydotprint(f, outfile="matrix_dot_product.png", var_with_name_simple=True)
생성 된 그래프는 다음과 같습니다.
복잡한 그래프
더 큰 표현에서는 계산 그래프가 매우 복잡 할 수 있습니다. Theano 문서에서 가져온 그래프 중 하나가 여기에 표시됩니다.
Theano의 작동 방식을 이해하려면 먼저 이러한 계산 그래프의 중요성을 아는 것이 중요합니다. 이러한 이해를 바탕으로 Theano의 중요성을 알게 될 것입니다.
왜 Theano입니까?
계산 그래프의 복잡성을 살펴보면 이제 Theano 개발의 목적을 이해할 수 있습니다. 일반적인 컴파일러는 전체 계산을 단일 단위로 보지 않기 때문에 프로그램에서 로컬 최적화를 제공합니다.
Theano는 전체 계산 그래프를 최적화하기 위해 매우 고급 최적화 기술을 구현합니다. 그것은 대수학의 측면과 최적화 컴파일러의 측면을 결합합니다. 그래프의 일부는 C 언어 코드로 컴파일 될 수 있습니다. 반복 계산의 경우 평가 속도가 중요하며 Theano는 매우 효율적인 코드를 생성하여이 목적을 충족합니다.
이제 Theano의 기본 사항을 이해 했으므로 표현식을 만드는 데 사용할 수있는 다양한 데이터 유형부터 시작하겠습니다. 다음 표는 Theano에 정의 된 데이터 유형의 일부 목록을 제공합니다.
데이터 형식 | Theano 유형 |
---|---|
바이트 | bscalar, bvector, bmatrix, brow, bcol, btensor3, btensor4, btensor5, btensor6, btensor7 |
16 비트 정수 | wscalar, wvector, wmatrix, wrow, wcol, wtensor3, wtensor4, wtensor5, wtensor6, wtensor7 |
32 비트 정수 | iscalar, ivector, imatrix, irow, icol, itensor3, itensor4, itensor5, itensor6, itensor7 |
64 비트 정수 | lscalar, lvector, lmatrix, lrow, lcol, ltensor3, ltensor4, ltensor5, ltensor6, ltensor7 |
흙손 | fscalar, fvector, fmatrix, frow, fcol, ftensor3, ftensor4, ftensor5, ftensor6, ftensor7 |
더블 | dscalar, dvector, dmatrix, drow, dcol, dtensor3, dtensor4, dtensor5, dtensor6, dtensor7 |
복잡한 | cscalar, cvector, cmatrix, crow, ccol, ctensor3, ctensor4, ctensor5, ctensor6, ctensor7 |
위의 목록은 완전하지 않으며 독자는 전체 목록을 위해 텐서 생성 문서를 참조합니다.
이제 Theano에서 다양한 종류의 데이터 변수를 생성하는 방법에 대한 몇 가지 예를 보여 드리겠습니다.
스칼라
스칼라 변수를 생성하려면 다음 구문을 사용합니다.
통사론
x = theano.tensor.scalar ('x')
x = 5.0
print (x)
산출
5.0
1 차원 배열
1 차원 배열을 만들려면 다음 선언을 사용하십시오.
예
f = theano.tensor.vector
f = (2.0, 5.0, 3.0)
print (f)f = theano.tensor.vector
f = (2.0, 5.0, 3.0)
print (f)
print (f[0])
print (f[2])
산출
(2.0, 5.0, 3.0)
2.0
3.0
만약 당신이 f[3] 여기에 표시된대로 범위를 벗어난 인덱스 오류를 생성합니다.
print f([3])
산출
IndexError Traceback (most recent call last)
<ipython-input-13-2a9c2a643c3a> in <module>
4 print (f[0])
5 print (f[2])
----> 6 print (f[3])
IndexError: tuple index out of range
2 차원 배열
2 차원 배열을 선언하려면 다음 코드 스 니펫을 사용합니다.
예
m = theano.tensor.matrix
m = ([2,3], [4,5], [2,4])
print (m[0])
print (m[1][0])
산출
[2, 3]
4
5 차원 배열
5 차원 배열을 선언하려면 다음 구문을 사용하십시오.
예
m5 = theano.tensor.tensor5
m5 = ([0,1,2,3,4], [5,6,7,8,9], [10,11,12,13,14])
print (m5[1])
print (m5[2][3])
산출
[5, 6, 7, 8, 9]
13
데이터 유형을 사용하여 3 차원 배열을 선언 할 수 있습니다. tensor3 대신에 tensor5, 데이터 유형을 사용하는 4 차원 배열 tensor4, 등등 tensor7.
복수 생성자
때로는 단일 선언에서 동일한 유형의 변수를 만들고 싶을 수 있습니다. 다음 구문을 사용하여 그렇게 할 수 있습니다-
통사론
from theano.tensor import * x, y, z = dmatrices('x', 'y', 'z')
x = ([1,2],[3,4],[5,6])
y = ([7,8],[9,10],[11,12])
z = ([13,14],[15,16],[17,18])
print (x[2])
print (y[1])
print (z[0])
산출
[5, 6]
[9, 10]
[13, 14]
이전 장에서 데이터 유형에 대해 논의하면서 Theano 변수를 만들고 사용했습니다. 다시 말하면 다음 구문을 사용하여 Theano에서 변수를 생성합니다.
x = theano.tensor.fvector('x')
이 문에서 우리는 변수를 만들었습니다. x32 비트 부동 소수점을 포함하는 벡터 유형의. 우리는 또한 그것을 다음과 같이 명명합니다.x. 이름은 일반적으로 디버깅에 유용합니다.
32 비트 정수 벡터를 선언하려면 다음 구문을 사용합니다.
i32 = theano.tensor.ivector
여기서는 변수 이름을 지정하지 않습니다.
64 비트 부동 소수점으로 구성된 3 차원 벡터를 선언하려면 다음 선언을 사용합니다.
f64 = theano.tensor.dtensor3
데이터 유형과 함께 다양한 유형의 생성자가 아래 표에 나열되어 있습니다.
건설자 | 데이터 형식 | 치수 |
---|---|---|
fvector | float32 | 1 |
ivector | int32 | 1 |
fscalar | float32 | 0 |
fmatrix | float32 | 2 |
ftensor3 | float32 | 삼 |
dtensor3 | float64 | 삼 |
일반 벡터 생성자를 사용하고 다음과 같이 명시 적으로 데이터 유형을 지정할 수 있습니다.
x = theano.tensor.vector ('x', dtype=int32)
다음 장에서는 공유 변수를 만드는 방법을 배웁니다.
여러 번, 서로 다른 함수간에 그리고 동일한 함수에 대한 여러 호출간에 공유되는 변수를 만들어야합니다. 예를 들어, 신경망을 훈련하는 동안 고려중인 각 특성에 가중치를 할당하기위한 가중치 벡터를 생성합니다. 이 벡터는 네트워크 훈련 중 모든 반복에서 수정됩니다. 따라서 동일한 함수에 대한 여러 호출에서 전역 적으로 액세스 할 수 있어야합니다. 그래서 우리는이 목적을 위해 공유 변수를 만듭니다. 일반적으로 Theano는 이러한 공유 변수를 GPU로 이동합니다. 이것은 계산 속도를 높입니다.
통사론
다음 구문을 사용하여 공유 변수를 만듭니다.
import numpy
W = theano.shared(numpy.asarray([0.1, 0.25, 0.15, 0.3]), 'W')
예
여기서 4 개의 부동 소수점 숫자로 구성된 NumPy 배열이 생성됩니다. 설정 / 얻기W 다음 코드 스 니펫을 사용하는 값-
import numpy
W = theano.shared(numpy.asarray([0.1, 0.25, 0.15, 0.3]), 'W')
print ("Original: ", W.get_value())
print ("Setting new values (0.5, 0.2, 0.4, 0.2)")
W.set_value([0.5, 0.2, 0.4, 0.2])
print ("After modifications:", W.get_value())
산출
Original: [0.1 0.25 0.15 0.3 ]
Setting new values (0.5, 0.2, 0.4, 0.2)
After modifications: [0.5 0.2 0.4 0.2]
테 아노 function기호 그래프와 상호 작용하기위한 후크 역할을합니다. 기호 그래프는 매우 효율적인 실행 코드로 컴파일됩니다. 이를 위해 수학 방정식을 재구성하여 더 빠르게 만듭니다. 표현식의 일부를 C 언어 코드로 컴파일합니다. 일부 텐서를 GPU로 이동하는 식입니다.
이제 효율적으로 컴파일 된 코드가 Theano에 입력으로 제공됩니다. function. Theano를 실행할 때function, 우리가 지정한 변수에 계산 결과를 할당합니다. 최적화 유형은 FAST_COMPILE 또는 FAST_RUN으로 지정할 수 있습니다. 환경 변수 THEANO_FLAGS에 지정됩니다.
테 아노 function 다음 구문을 사용하여 선언됩니다-
f = theano.function ([x], y)
첫 번째 매개 변수 [x] 입력 변수와 두 번째 매개 변수의 목록입니다. y 출력 변수 목록입니다.
이제 Theano의 기본 사항을 이해 했으므로 간단한 예제로 Theano 코딩을 시작하겠습니다.
Theano는 최적을 달성하기 위해 비용과 기울기를 반복적으로 계산해야하는 신경망 훈련에 매우 유용합니다. 대규모 데이터 세트에서는 계산 집약적입니다. Theano는 이전에 보았던 계산 그래프의 내부 최적화 덕분에이를 효율적으로 수행합니다.
문제 설명
이제 Theano 라이브러리를 사용하여 네트워크를 훈련시키는 방법을 배웁니다. 4 가지 기능 데이터 세트로 시작하는 간단한 사례를 살펴 보겠습니다. 각 특성에 특정 가중치 (중요도)를 적용한 후 이러한 특성의 합계를 계산합니다.
훈련의 목표는 합계가 목표 값인 100에 도달하도록 각 특성에 할당 된 가중치를 수정하는 것입니다.
sum = f1 * w1 + f2 * w2 + f3 * w3 + f4 * w4
어디 f1, f2, ...은 기능 값이며 w1, w2, ...는 가중치입니다.
문제 설명을 더 잘 이해하기 위해 예제를 정량화하겠습니다. 각 기능에 대해 초기 값을 1.0으로 가정하고 w1을0.1, w2 같음 0.25, w3 같음 0.15, 및 w4 같음 0.3. 가중치 값을 할당하는 데 명확한 논리는 없으며 직관 일뿐입니다. 따라서 초기 합계는 다음과 같습니다.
sum = 1.0 * 0.1 + 1.0 * 0.25 + 1.0 * 0.15 + 1.0 * 0.3
합계 0.8. 이제이 합계가 100에 가까워 지도록 가중치 할당을 계속 수정합니다. 현재 결과 값0.8 원하는 목표 값 인 100과는 거리가 멀습니다. 기계 학습 용어로 cost목표 값에서 현재 출력 값을 뺀 차이로, 일반적으로 오류를 날려 버리기 위해 제곱합니다. 그라디언트를 계산하고 가중치 벡터를 업데이트하여 각 반복에서이 비용을 줄입니다.
이 전체 로직이 Theano에서 어떻게 구현되는지 살펴 보겠습니다.
변수 선언
먼저 입력 벡터 x를 다음과 같이 선언합니다.
x = tensor.fvector('x')
어디 x 부동 소수점 값의 1 차원 배열입니다.
스칼라를 정의합니다. target 아래 주어진 변수-
target = tensor.fscalar('target')
다음으로 가중치 텐서를 만듭니다. W 위에서 논의한 초기 값으로-
W = theano.shared(numpy.asarray([0.1, 0.25, 0.15, 0.3]), 'W')
Theano 표현 정의
이제 다음 식을 사용하여 출력을 계산합니다.
y = (x * W).sum()
위의 진술에서 x 과 W단순한 스칼라 변수가 아닌 벡터입니다. 이제 다음 식으로 오류 (비용)를 계산합니다.
cost = tensor.sqr(target - y)
비용은 목표 값과 현재 출력 간의 차이를 제곱 한 것입니다.
목표물에서 얼마나 멀리 떨어져 있는지 알려주는 기울기를 계산하기 위해 grad 다음과 같이 방법-
gradients = tensor.grad(cost, [W])
이제 우리는 weights 벡터의 학습률을 0.1 다음과 같이-
W_updated = W - (0.1 * gradients[0])
다음으로 위의 값을 사용하여 가중치 벡터를 업데이트해야합니다. 우리는 다음 문장에서 이것을합니다.
updates = [(W, W_updated)]
Theano 함수 정의 / 호출
마지막으로 우리는 function Theano에서 합계를 계산합니다.
f = function([x, target], y, updates=updates)
위의 함수를 특정 횟수만큼 호출하기 위해 for 다음과 같이 루프-
for i in range(10):
output = f([1.0, 1.0, 1.0, 1.0], 100.0)
앞서 말했듯이 함수에 대한 입력은 네 가지 특징에 대한 초기 값을 포함하는 벡터입니다. 1.0특별한 이유없이 각 기능에. 선택한 다른 값을 할당하고 함수가 궁극적으로 수렴하는지 확인할 수 있습니다. 각 반복에서 가중치 벡터의 값과 해당 출력을 인쇄합니다. 아래 코드에 나와 있습니다.
print ("iteration: ", i)
print ("Modified Weights: ", W.get_value())
print ("Output: ", output)
전체 프로그램 목록
전체 프로그램 목록은 빠른 참조를 위해 여기에 재현되어 있습니다.
from theano import *
import numpy
x = tensor.fvector('x')
target = tensor.fscalar('target')
W = theano.shared(numpy.asarray([0.1, 0.25, 0.15, 0.3]), 'W')
print ("Weights: ", W.get_value())
y = (x * W).sum()
cost = tensor.sqr(target - y)
gradients = tensor.grad(cost, [W])
W_updated = W - (0.1 * gradients[0])
updates = [(W, W_updated)]
f = function([x, target], y, updates=updates)
for i in range(10):
output = f([1.0, 1.0, 1.0, 1.0], 100.0)
print ("iteration: ", i)
print ("Modified Weights: ", W.get_value())
print ("Output: ", output)
프로그램을 실행하면 다음 출력이 표시됩니다.
Weights: [0.1 0.25 0.15 0.3 ]
iteration: 0
Modified Weights: [19.94 20.09 19.99 20.14]
Output: 0.8
iteration: 1
Modified Weights: [23.908 24.058 23.958 24.108]
Output: 80.16000000000001
iteration: 2
Modified Weights: [24.7016 24.8516 24.7516 24.9016]
Output: 96.03200000000001
iteration: 3
Modified Weights: [24.86032 25.01032 24.91032 25.06032]
Output: 99.2064
iteration: 4
Modified Weights: [24.892064 25.042064 24.942064 25.092064]
Output: 99.84128
iteration: 5
Modified Weights: [24.8984128 25.0484128 24.9484128 25.0984128]
Output: 99.968256
iteration: 6
Modified Weights: [24.89968256 25.04968256 24.94968256 25.09968256]
Output: 99.9936512
iteration: 7
Modified Weights: [24.89993651 25.04993651 24.94993651 25.09993651]
Output: 99.99873024
iteration: 8
Modified Weights: [24.8999873 25.0499873 24.9499873 25.0999873]
Output: 99.99974604799999
iteration: 9
Modified Weights: [24.89999746 25.04999746 24.94999746 25.09999746]
Output: 99.99994920960002
네 번의 반복 후 출력은 다음과 같습니다. 99.96 다섯 번 반복하면 99.99, 우리가 원하는 목표 인 100.0.
원하는 정확도에 따라 네트워크가 4 ~ 5 회 반복으로 훈련되었다고 안전하게 결론을 내릴 수 있습니다. 훈련이 완료된 후, 5 회 반복 후 다음 값을 취하는 가중치 벡터를 찾습니다.
iteration: 5
Modified Weights: [24.8984128 25.0484128 24.9484128 25.0984128]
이제 모델 배포를 위해 네트워크에서 이러한 값을 사용할 수 있습니다.
기계 학습 모델 구축에는 텐서를 포함하는 집중적이고 반복적 인 계산이 포함됩니다. 여기에는 집약적 인 컴퓨팅 리소스가 필요합니다. 일반 컴파일러는 로컬 수준에서 최적화를 제공하므로 일반적으로 빠른 실행 코드를 생성하지 않습니다.
Theano는 먼저 전체 계산에 대한 계산 그래프를 작성합니다. 컴파일 중에 전체 계산 그림을 단일 이미지로 사용할 수 있으므로 사전 컴파일 중에 여러 최적화 기술을 적용 할 수 있으며 이것이 바로 Theano가하는 일입니다. 계산 그래프를 재구성하고, 부분적으로 C로 변환하고, 공유 변수를 GPU로 이동하는 등 매우 빠른 실행 코드를 생성합니다. 컴파일 된 코드는 Theano에 의해 실행됩니다.function컴파일 된 코드를 런타임에 삽입하기위한 후크 역할을합니다. Theano는 자격 증명을 입증했으며 학계와 업계 모두에서 널리 인정 받고 있습니다.