Theano - Uma Expressão Trivial Theano
Vamos começar nossa jornada de Theano definindo e avaliando uma expressão trivial em Theano. Considere a seguinte expressão trivial que adiciona dois escalares -
c = a + b
Onde a, b são variáveis e cé a saída da expressão. Em Theano, definir e avaliar até mesmo essa expressão trivial é complicado.
Vamos entender as etapas para avaliar a expressão acima.
Importando Theano
Primeiro, precisamos importar a biblioteca Theano em nosso programa, o que fazemos usando a seguinte instrução -
from theano import *
Em vez de importar os pacotes individuais, usamos * na instrução acima para incluir todos os pacotes da biblioteca Theano.
Declarando Variáveis
A seguir, vamos declarar uma variável chamada a usando a seguinte declaração -
a = tensor.dscalar()
o dscalarmétodo declara uma variável escalar decimal. A execução da instrução acima cria uma variável chamadaaem seu código de programa. Da mesma forma, vamos criar variáveisb usando a seguinte declaração -
b = tensor.dscalar()
Definindo Expressão
A seguir, definiremos nossa expressão que opera nessas duas variáveis a e b.
c = a + b
No Theano, a execução da instrução acima não realiza a adição escalar das duas variáveis a e b.
Definindo a Função Theano
Para avaliar a expressão acima, precisamos definir uma função em Theano da seguinte maneira -
f = theano.function([a,b], c)
A função functionrecebe dois argumentos, o primeiro argumento é uma entrada para a função e o segundo é sua saída. A declaração acima afirma que o primeiro argumento é um tipo de array que consiste em dois elementosa e b. A saída é uma unidade escalar chamadac. Esta função será referenciada com o nome da variávelf em nosso código posterior.
Invocando a função Theano
A chamada para a função f é feita usando a seguinte instrução -
d = f(3.5, 5.5)
A entrada para a função é uma matriz que consiste em dois escalares: 3.5 e 5.5. A saída da execução é atribuída à variável escalard. Para imprimir o conteúdo ded, vamos usar o print declaração -
print (d)
A execução faria com que o valor de d a ser impresso no console, que é 9.0 neste caso.
Lista completa do programa
A lista completa do programa é fornecida aqui para sua referência rápida -
from theano import *
a = tensor.dscalar()
b = tensor.dscalar()
c = a + b
f = theano.function([a,b], c)
d = f(3.5, 5.5)
print (d)
Execute o código acima e você verá a saída como 9.0. A captura de tela é mostrada aqui -
Agora, vamos discutir um exemplo um pouco mais complexo que calcula a multiplicação de duas matrizes.