PyTorch-クイックガイド
PyTorchは、Python用のオープンソースの機械学習ライブラリとして定義されています。自然言語処理などのアプリケーションに使用されます。これは当初、Facebookの人工知能研究グループと、それに基づいて構築された確率的プログラミング用のUberのPyroソフトウェアによって開発されました。
もともと、PyTorchは、Torchフレームワークに基づくLusJITのPythonラッパーとしてHughPerkinsによって開発されました。PyTorchには2つのバリエーションがあります。
PyTorchは、バックエンドコード用に同じコアCライブラリを共有しながら、PythonでTorchを再設計および実装します。PyTorch開発者は、Pythonを効率的に実行するためにこのバックエンドコードを調整しました。また、GPUベースのハードウェアアクセラレーションと、Luaベースのトーチを作成した拡張機能も維持しました。
特徴
PyTorchの主な機能は以下のとおりです-
Easy Interface−PyTorchは使いやすいAPIを提供します。したがって、操作は非常に簡単で、Pythonで実行できると考えられています。このフレームワークでのコード実行は非常に簡単です。
Python usage−このライブラリは、Pythonデータサイエンススタックとスムーズに統合されるPythonicと見なされます。したがって、Python環境によって提供されるすべてのサービスと機能を活用できます。
Computational graphs− PyTorchは、動的な計算グラフを提供する優れたプラットフォームを提供します。したがって、ユーザーは実行時にそれらを変更できます。これは、開発者がニューラルネットワークモデルの作成に必要なメモリ量がわからない場合に非常に役立ちます。
PyTorchは、以下に示すように3つのレベルの抽象化があることで知られています-
Tensor-GPUで実行される命令型のn次元配列。
変数-計算グラフのノード。これはデータと勾配を保存します。
モジュール-状態または学習可能な重みを格納するニューラルネットワーク層。
PyTorchの利点
PyTorchの利点は次のとおりです-
コードのデバッグと理解は簡単です。
それはトーチとして多くの層を含みます。
多くの損失関数が含まれています。
これは、GPUのNumPy拡張機能と見なすことができます。
これにより、構造が計算自体に依存するネットワークを構築できます。
TensorFlowとPyTorch
以下で、TensorFlowとPyTorchの主な違いを調べます。
PyTorch | TensorFlow |
---|---|
PyTorchは、Facebookで積極的に使用されているluaベースのTorchフレームワークと密接に関連しています。 |
TensorFlowはGoogleBrainによって開発され、Googleで積極的に使用されています。 |
PyTorchは、他の競合テクノロジーと比較して比較的新しいものです。 |
TensorFlowは新しいものではなく、多くの研究者や業界の専門家から持ち帰り用のツールと見なされています。 |
PyTorchには、すべてが必須かつ動的に含まれています。 |
TensorFlowには、静的グラフと動的グラフの組み合わせが含まれています。 |
PyTorchの計算グラフは、実行時に定義されます。 |
TensorFlowにはランタイムオプションは含まれていません。 |
PyTorchには、モバイルおよび組み込みフレームワーク向けのデプロイメント機能が含まれています。 |
TensorFlowは、組み込みフレームワークに適しています。 |
PyTorchは、人気のあるディープラーニングフレームワークです。このチュートリアルでは、「Windows10」をオペレーティングシステムと見なします。環境設定を成功させるための手順は次のとおりです。
ステップ1
次のリンクには、PyTorchに適したパッケージを含むパッケージのリストが含まれています。
https://drive.google.com/drive/folders/0B-X0-FlSGfCYdTNldW02UGl4MXM次のスクリーンショットに示すように、それぞれのパッケージをダウンロードしてインストールするだけです。
ステップ2
これには、AnacondaFrameworkを使用してPyTorchフレームワークのインストールを確認することが含まれます。
次のコマンドを使用して、同じことを確認します-
conda list
「コンダリスト」には、インストールされているフレームワークのリストが表示されます。
強調表示されている部分は、PyTorchがシステムに正常にインストールされたことを示しています。
数学はあらゆる機械学習アルゴリズムに不可欠であり、特定の方法で適切なアルゴリズムを設計するための数学のさまざまなコアコンセプトが含まれています。
機械学習とデータサイエンスにおける数学のトピックの重要性を以下に示します-
ここで、自然言語処理の観点から重要な機械学習の主要な数学的概念に焦点を当てましょう。
ベクトル
ベクトルは、連続または離散の数の配列と見なされ、ベクトルで構成される空間はベクトル空間と呼ばれます。ベクトルの空間次元は有限または無限のいずれかですが、機械学習とデータサイエンスの問題は固定長のベクトルを扱うことが観察されています。
ベクトル表現は以下のように表示されます-
temp = torch.FloatTensor([23,24,24.5,26,27.2,23.0])
temp.size()
Output - torch.Size([6])
機械学習では、多次元データを扱います。したがって、ベクトルは非常に重要になり、予測問題ステートメントの入力特徴と見なされます。
スカラー
スカラーは、1つの値のみを含むゼロ次元を持つと呼ばれます。PyTorchに関しては、次元がゼロの特別なテンソルは含まれていません。したがって、宣言は次のように行われます。
x = torch.rand(10)
x.size()
Output - torch.Size([10])
行列
構造化データのほとんどは、通常、テーブルまたは特定のマトリックスの形式で表されます。ボストンハウスプライスと呼ばれるデータセットを使用します。これは、Pythonscikit-learn機械学習ライブラリですぐに利用できます。
boston_tensor = torch.from_numpy(boston.data)
boston_tensor.size()
Output: torch.Size([506, 13])
boston_tensor[:2]
Output:
Columns 0 to 7
0.0063 18.0000 2.3100 0.0000 0.5380 6.5750 65.2000 4.0900
0.0273 0.0000 7.0700 0.0000 0.4690 6.4210 78.9000 4.9671
Columns 8 to 12
1.0000 296.0000 15.3000 396.9000 4.9800
2.0000 242.0000 17.8000 396.9000 9.1400
ニューラルネットワークの主な原理には、基本的な要素、つまり人工ニューロンまたはパーセプトロンのコレクションが含まれます。これには、x1、x2….. xnなどのいくつかの基本的な入力が含まれ、合計が活動電位よりも大きい場合にバイナリ出力を生成します。
サンプルニューロンの概略図を以下に示します-
生成された出力は、活動電位またはバイアスを伴う加重和と見なすことができます。
$$出力= \ sum_jw_jx_j +バイアス$$
典型的なニューラルネットワークアーキテクチャを以下に説明します-
入力と出力の間のレイヤーは非表示レイヤーと呼ばれ、レイヤー間の接続の密度とタイプが構成です。たとえば、完全に接続された構成では、レイヤーLのすべてのニューロンがL +1のニューロンに接続されます。より明確なローカリゼーションのために、ローカル近傍、たとえば9つのニューロンのみを次の層に接続できます。図1-9は、密な接続を持つ2つの隠れ層を示しています。
さまざまな種類のニューラルネットワークは次のとおりです。
フィードフォワードニューラルネットワーク
フィードフォワードニューラルネットワークには、ニューラルネットワークファミリーの基本単位が含まれています。このタイプのニューラルネットワークでのデータの移動は、現在の隠れ層を経由して、入力層から出力層へと行われます。1つの層の出力は、ネットワークアーキテクチャ内のあらゆる種類のループに制限のある入力層として機能します。
リカレントニューラルネットワーク
リカレントニューラルネットワークは、データパターンが一定期間にわたって結果的に変化する場合です。RNNでは、同じレイヤーが適用され、指定されたニューラルネットワークで入力パラメーターを受け入れて出力パラメーターを表示します。
ニューラルネットワークは、torch.nnパッケージを使用して構築できます。
これは単純なフィードフォワードネットワークです。入力を受け取り、それをいくつかのレイヤーに次々にフィードし、最後に出力を提供します。
PyTorchの助けを借りて、ニューラルネットワークの一般的なトレーニング手順に次の手順を使用できます-
- いくつかの学習可能なパラメーター(または重み)を持つニューラルネットワークを定義します。
- 入力のデータセットを反復処理します。
- ネットワークを介して入力を処理します。
- 損失を計算します(出力が正しいことからどれだけ離れているか)。
- 勾配をネットワークのパラメータに伝播します。
- ネットワークの重みを更新します。通常は、以下に示す簡単な更新を使用します。
rule: weight = weight -learning_rate * gradient
人工知能は、最近、より大きな傾向にあります。機械学習と深層学習は人工知能を構成します。下記のベン図は、機械学習と深層学習の関係を説明しています。
機械学習
機械学習は、コンピューターが設計およびプログラムされたアルゴリズムに従って動作できるようにする科学の芸術です。多くの研究者は、機械学習が人間レベルのAIに向けて進歩するための最良の方法であると考えています。これには、次のようなさまざまなタイプのパターンが含まれます。
- 教師あり学習パターン
- 教師なし学習パターン
ディープラーニング
ディープラーニングは機械学習のサブフィールドであり、関連するアルゴリズムは人工ニューラルネットワークと呼ばれる脳の構造と機能に触発されています。
ディープラーニングは、教師あり学習またはラベル付きデータとアルゴリズムからの学習を通じて非常に重要になっています。ディープラーニングの各アルゴリズムは同じプロセスを経ます。これには、入力の非線形変換の階層が含まれ、出力として統計モデルを作成するために使用されます。
機械学習プロセスは、次の手順を使用して定義されます-
- 関連するデータセットを特定し、分析のために準備します。
- 使用するアルゴリズムのタイプを選択します。
- 使用したアルゴリズムに基づいて分析モデルを構築します。
- テストデータセットでモデルをトレーニングし、必要に応じて修正します。
- モデルを実行してテストスコアを生成します。
この章では、機械学習と深層学習の概念の主な違いについて説明します。
データ量
機械学習はさまざまな量のデータで機能し、主に少量のデータに使用されます。一方、ディープラーニングは、データ量が急激に増加する場合に効率的に機能します。次の図は、データ量に関する機械学習とディープラーニングの動作を示しています。
ハードウェアの依存関係
ディープラーニングアルゴリズムは、従来の機械学習アルゴリズムとは異なり、ハイエンドマシンに大きく依存するように設計されています。深層学習アルゴリズムは、膨大なハードウェアサポートを必要とする大量の行列乗算演算を実行します。
機能エンジニアリング
機能エンジニアリングは、ドメイン知識を特定の機能に組み込んで、データの複雑さを軽減し、学習アルゴリズムに表示されるパターンを作成するプロセスです。
たとえば、従来の機械学習パターンは、機能エンジニアリングプロセスに必要なピクセルやその他の属性に焦点を当てています。深層学習アルゴリズムは、データからの高レベルの特徴に焦点を当てています。これにより、新しい問題ごとに新しい特徴抽出器を開発するタスクが軽減されます。
PyTorchには、ニューラルネットワークを作成および実装する特別な機能が含まれています。この章では、1つの隠れ層が1つの出力ユニットを開発する単純なニューラルネットワークを作成します。
次の手順を使用して、PyTorch −を使用して最初のニューラルネットワークを実装します。
ステップ1
まず、以下のコマンドを使用してPyTorchライブラリをインポートする必要があります-
import torch
import torch.nn as nn
ステップ2
以下に示すように、ニューラルネットワークの実行を開始するためにすべてのレイヤーとバッチサイズを定義します-
# Defining input size, hidden layer size, output size and batch size respectively
n_in, n_h, n_out, batch_size = 10, 5, 1, 10
ステップ3
ニューラルネットワークには、それぞれの出力データを取得するための入力データの組み合わせが含まれているため、以下に示すのと同じ手順に従います。
# Create dummy input and target tensors (data)
x = torch.randn(batch_size, n_in)
y = torch.tensor([[1.0], [0.0], [0.0],
[1.0], [1.0], [1.0], [0.0], [0.0], [1.0], [1.0]])
ステップ4
組み込み関数を使用してシーケンシャルモデルを作成します。以下のコード行を使用して、シーケンシャルモデルを作成します-
# Create a model
model = nn.Sequential(nn.Linear(n_in, n_h),
nn.ReLU(),
nn.Linear(n_h, n_out),
nn.Sigmoid())
ステップ5
以下に示すように、勾配降下オプティマイザーを使用して損失関数を作成します。
Construct the loss function
criterion = torch.nn.MSELoss()
# Construct the optimizer (Stochastic Gradient Descent in this case)
optimizer = torch.optim.SGD(model.parameters(), lr = 0.01)
ステップ6
与えられたコード行を使用して反復ループを使用して最急降下モデルを実装します-
# Gradient Descent
for epoch in range(50):
# Forward pass: Compute predicted y by passing x to the model
y_pred = model(x)
# Compute and print loss
loss = criterion(y_pred, y)
print('epoch: ', epoch,' loss: ', loss.item())
# Zero gradients, perform a backward pass, and update the weights.
optimizer.zero_grad()
# perform a backward pass (backpropagation)
loss.backward()
# Update the parameters
optimizer.step()
ステップ7
生成される出力は次のとおりです-
epoch: 0 loss: 0.2545787990093231
epoch: 1 loss: 0.2545052170753479
epoch: 2 loss: 0.254431813955307
epoch: 3 loss: 0.25435858964920044
epoch: 4 loss: 0.2542854845523834
epoch: 5 loss: 0.25421255826950073
epoch: 6 loss: 0.25413978099823
epoch: 7 loss: 0.25406715273857117
epoch: 8 loss: 0.2539947032928467
epoch: 9 loss: 0.25392240285873413
epoch: 10 loss: 0.25385022163391113
epoch: 11 loss: 0.25377824902534485
epoch: 12 loss: 0.2537063956260681
epoch: 13 loss: 0.2536346912384033
epoch: 14 loss: 0.25356316566467285
epoch: 15 loss: 0.25349172949790955
epoch: 16 loss: 0.25342053174972534
epoch: 17 loss: 0.2533493936061859
epoch: 18 loss: 0.2532784342765808
epoch: 19 loss: 0.25320762395858765
epoch: 20 loss: 0.2531369626522064
epoch: 21 loss: 0.25306645035743713
epoch: 22 loss: 0.252996027469635
epoch: 23 loss: 0.2529257833957672
epoch: 24 loss: 0.25285571813583374
epoch: 25 loss: 0.25278574228286743
epoch: 26 loss: 0.25271597504615784
epoch: 27 loss: 0.25264623761177063
epoch: 28 loss: 0.25257670879364014
epoch: 29 loss: 0.2525072991847992
epoch: 30 loss: 0.2524380087852478
epoch: 31 loss: 0.2523689270019531
epoch: 32 loss: 0.25229987502098083
epoch: 33 loss: 0.25223103165626526
epoch: 34 loss: 0.25216227769851685
epoch: 35 loss: 0.252093642950058
epoch: 36 loss: 0.25202515721321106
epoch: 37 loss: 0.2519568204879761
epoch: 38 loss: 0.251888632774353
epoch: 39 loss: 0.25182053446769714
epoch: 40 loss: 0.2517525553703308
epoch: 41 loss: 0.2516847252845764
epoch: 42 loss: 0.2516169846057892
epoch: 43 loss: 0.2515493929386139
epoch: 44 loss: 0.25148195028305054
epoch: 45 loss: 0.25141456723213196
epoch: 46 loss: 0.2513473629951477
epoch: 47 loss: 0.2512802183628082
epoch: 48 loss: 0.2512132525444031
epoch: 49 loss: 0.2511464059352875
深層学習アルゴリズムのトレーニングには、次の手順が含まれます-
- データパイプラインの構築
- ネットワークアーキテクチャの構築
- 損失関数を使用したアーキテクチャの評価
- 最適化アルゴリズムを使用したネットワークアーキテクチャの重みの最適化
特定の深層学習アルゴリズムのトレーニングは、以下に示すようにニューラルネットワークを機能ブロックに変換するための正確な要件です。
上の図に関して、深層学習アルゴリズムには、入力データを取得し、それらに埋め込まれた一連のレイヤーを含むそれぞれのアーキテクチャを構築することが含まれます。
上の図を観察すると、ニューラルネットワークの重みの最適化に関する損失関数を使用して精度が評価されます。
この章では、PyTorchで最も一般的に使用される用語のいくつかについて説明します。
PyTorch NumPy
PyTorchテンソルはNumPy配列と同じです。テンソルはn次元配列であり、PyTorchに関しては、これらのテンソルを操作するための多くの関数を提供します。
PyTorchテンソルは通常、GPUを使用して数値計算を高速化します。PyTorchで作成されたこれらのテンソルは、2層ネットワークをランダムデータに適合させるために使用できます。ユーザーは、ネットワークを介した順方向パスと逆方向パスを手動で実装できます。
変数とAutograd
autogradを使用する場合、ネットワークのフォワードパスは computational graph −グラフのノードはテンソルになり、エッジは入力テンソルから出力テンソルを生成する関数になります。
PyTorchテンソルは、変数が計算グラフのノードを表す変数オブジェクトとして作成できます。
動的グラフ
静的グラフは、ユーザーが事前にグラフを最適化できるので便利です。プログラマーが同じグラフを何度も再利用している場合、同じグラフが何度も再実行されるため、この潜在的にコストのかかる事前の最適化を維持できます。
それらの主な違いは、Tensor Flowの計算グラフは静的であり、PyTorchは動的な計算グラフを使用することです。
オプティムパッケージ
PyTorchのoptimパッケージは、さまざまな方法で実装される最適化アルゴリズムの概念を抽象化し、一般的に使用される最適化アルゴリズムの図を提供します。これは、importステートメント内で呼び出すことができます。
マルチプロセッシング
マルチプロセッシングは同じ操作をサポートするため、すべてのテンソルは複数のプロセッサで動作します。キューはデータを共有メモリに移動し、ハンドルを別のプロセスに送信するだけです。
PyTorchには、データセットのロードと準備に使用されるtorchvisionというパッケージが含まれています。これには、データセットの変換とロードに役立つDatasetとDataLoaderという2つの基本的な関数が含まれています。
データセット
データセットは、指定されたデータセットからデータポイントを読み取って変換するために使用されます。実装する基本的な構文は以下のとおりです-
trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
download = True, transform = transform)
DataLoaderは、データのシャッフルとバッチ処理に使用されます。マルチプロセッシングワーカーと並行してデータをロードするために使用できます。
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
shuffle = True, num_workers = 2)
例:CSVファイルの読み込み
PythonパッケージPandaを使用してcsvファイルをロードします。元のファイルの形式は次のとおりです(画像名、68個のランドマーク-各ランドマークにはax、y座標があります)。
landmarks_frame = pd.read_csv('faces/face_landmarks.csv')
n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)
この章では、TensorFlowを使用した線形回帰の実装の基本的な例に焦点を当てます。ロジスティック回帰または線形回帰は、次数離散カテゴリを分類するための教師あり機械学習アプローチです。この章の目標は、ユーザーが予測変数と1つ以上の独立変数の間の関係を予測できるモデルを構築することです。
これら2つの変数間の関係は線形と見なされます。つまり、yが従属変数であり、xが独立変数と見なされる場合、2つの変数の線形回帰関係は、以下の式のようになります。
Y = Ax+b
次に、線形回帰のアルゴリズムを設計します。これにより、以下に示す2つの重要な概念を理解できます。
- コスト関数
- 最急降下アルゴリズム
線形回帰の概略図を以下に示します
結果の解釈
$$ Y = ax + b $$
の値 a 勾配です。
の値 b それは y − intercept。
r それは correlation coefficient。
r2 それは correlation coefficient。
線形回帰の方程式のグラフ表示を以下に示します-
PyTorch −を使用して線形回帰を実装するには、次の手順を使用します。
ステップ1
以下のコードを使用して、PyTorchで線形回帰を作成するために必要なパッケージをインポートします-
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
import seaborn as sns
import pandas as pd
%matplotlib inline
sns.set_style(style = 'whitegrid')
plt.rcParams["patch.force_edgecolor"] = True
ステップ2
以下に示すように、利用可能なデータセットを使用して単一のトレーニングセットを作成します-
m = 2 # slope
c = 3 # interceptm = 2 # slope
c = 3 # intercept
x = np.random.rand(256)
noise = np.random.randn(256) / 4
y = x * m + c + noise
df = pd.DataFrame()
df['x'] = x
df['y'] = y
sns.lmplot(x ='x', y ='y', data = df)
ステップ3
以下に説明するように、PyTorchライブラリを使用して線形回帰を実装します-
import torch
import torch.nn as nn
from torch.autograd import Variable
x_train = x.reshape(-1, 1).astype('float32')
y_train = y.reshape(-1, 1).astype('float32')
class LinearRegressionModel(nn.Module):
def __init__(self, input_dim, output_dim):
super(LinearRegressionModel, self).__init__()
self.linear = nn.Linear(input_dim, output_dim)
def forward(self, x):
out = self.linear(x)
return out
input_dim = x_train.shape[1]
output_dim = y_train.shape[1]
input_dim, output_dim(1, 1)
model = LinearRegressionModel(input_dim, output_dim)
criterion = nn.MSELoss()
[w, b] = model.parameters()
def get_param_values():
return w.data[0][0], b.data[0]
def plot_current_fit(title = ""):
plt.figure(figsize = (12,4))
plt.title(title)
plt.scatter(x, y, s = 8)
w1 = w.data[0][0]
b1 = b.data[0]
x1 = np.array([0., 1.])
y1 = x1 * w1 + b1
plt.plot(x1, y1, 'r', label = 'Current Fit ({:.3f}, {:.3f})'.format(w1, b1))
plt.xlabel('x (input)')
plt.ylabel('y (target)')
plt.legend()
plt.show()
plot_current_fit('Before training')
生成されるプロットは次のとおりです-
ディープラーニングは機械学習の一部門であり、ここ数十年で研究者が取った重要なステップと見なされています。ディープラーニングの実装例には、画像認識や音声認識などのアプリケーションが含まれます。
ディープニューラルネットワークの2つの重要なタイプを以下に示します-
- 畳み込みニューラルネットワーク
- リカレントニューラルネットワーク。
この章では、最初のタイプ、つまり畳み込みニューラルネットワーク(CNN)に焦点を当てます。
畳み込みニューラルネットワーク
畳み込みニューラルネットワークは、アレイの複数のレイヤーを介してデータを処理するように設計されています。このタイプのニューラルネットワークは、画像認識や顔認識などのアプリケーションで使用されます。
CNNと他の通常のニューラルネットワークの主な違いは、CNNは入力を2次元配列として受け取り、他のニューラルネットワークが焦点を当てている特徴抽出に焦点を合わせるのではなく、画像を直接操作することです。
CNNの主なアプローチには、認識の問題に対する解決策が含まれます。グーグルやフェイスブックのようなトップ企業は、活動をより迅速に行うために、認識プロジェクトの研究開発プロジェクトに投資してきました。
すべての畳み込みニューラルネットワークには、3つの基本的なアイデアが含まれています-
- ローカルのそれぞれのフィールド
- Convolution
- Pooling
これらの各用語を詳しく理解しましょう。
ローカルのそれぞれのフィールド
CNNは、入力データ内に存在する空間相関を利用します。ニューラルネットワークの同時層のそれぞれは、いくつかの入力ニューロンを接続します。この特定の領域は、ローカル受容野と呼ばれます。隠れたニューロンにのみ焦点を当てています。隠されたニューロンは、特定の境界の外側の変化を認識せずに、言及されたフィールド内の入力データを処理します。
ローカルのそれぞれのフィールドを生成する図表現を以下に示します-
畳み込み
上の図では、各接続が隠れニューロンの重みを学習し、ある層から別の層への移動に関連する接続があることを確認しています。ここでは、個々のニューロンが時々シフトを実行します。このプロセスは「畳み込み」と呼ばれます。
入力レイヤーから非表示のフィーチャマップへの接続のマッピングは「共有ウェイト」として定義され、含まれるバイアスは「共有バイアス」と呼ばれます。
プーリング
畳み込みニューラルネットワークは、CNN宣言の直後に配置されるプーリング層を使用します。ユーザーからの入力を畳み込みネットワークから出てくる特徴マップとして受け取り、凝縮された特徴マップを作成します。プーリングレイヤーは、前のレイヤーのニューロンを含むレイヤーを作成するのに役立ちます。
PyTorchの実装
次の手順は、PyTorchを使用して畳み込みニューラルネットワークを作成するために使用されます。
ステップ1
単純なニューラルネットワークを作成するために必要なパッケージをインポートします。
from torch.autograd import Variable
import torch.nn.functional as F
ステップ2
畳み込みニューラルネットワークのバッチ表現を使用してクラスを作成します。入力xのバッチ形状は、次元が(3、32、32)です。
class SimpleCNN(torch.nn.Module):
def __init__(self):
super(SimpleCNN, self).__init__()
#Input channels = 3, output channels = 18
self.conv1 = torch.nn.Conv2d(3, 18, kernel_size = 3, stride = 1, padding = 1)
self.pool = torch.nn.MaxPool2d(kernel_size = 2, stride = 2, padding = 0)
#4608 input features, 64 output features (see sizing flow below)
self.fc1 = torch.nn.Linear(18 * 16 * 16, 64)
#64 input features, 10 output features for our 10 defined classes
self.fc2 = torch.nn.Linear(64, 10)
ステップ3
(3、32、32)から(18、32、32)への最初の畳み込みサイズ変更のアクティブ化を計算します。
寸法のサイズが(18、32、32)から(18、16、16)に変わります。サイズが(18、16、16)から(1、4608)に変化するため、ニューラルネットの入力層のデータ次元を再形成します。
-1は、他の指定された次元からこの次元を推測することを思い出してください。
def forward(self, x):
x = F.relu(self.conv1(x))
x = self.pool(x)
x = x.view(-1, 18 * 16 *16)
x = F.relu(self.fc1(x))
#Computes the second fully connected layer (activation applied later)
#Size changes from (1, 64) to (1, 10)
x = self.fc2(x)
return(x)
リカレントニューラルネットワークは、シーケンシャルアプローチに従うディープラーニング指向のアルゴリズムの一種です。ニューラルネットワークでは、各入力と出力が他のすべての層から独立していると常に想定しています。これらのタイプのニューラルネットワークは、数学的な計算を順番に実行してタスクを次々に完了するため、リカレントと呼ばれます。
次の図は、リカレントニューラルネットワークの完全なアプローチと動作を示しています-
上の図では、c1、c2、c3、およびx1は、o1のそれぞれの出力を提供するいくつかの非表示の入力値(h1、h2、およびh3)を含む入力と見なされます。ここでは、リカレントニューラルネットワークの助けを借りて正弦波を作成するためのPyTorchの実装に焦点を当てます。
トレーニング中は、一度に1つのデータポイントを使用して、モデルへのトレーニングアプローチに従います。入力シーケンスxは20個のデータポイントで構成され、ターゲットシーケンスは入力シーケンスと同じであると見なされます。
ステップ1
以下のコードを使用して、リカレントニューラルネットワークを実装するために必要なパッケージをインポートします-
import torch
from torch.autograd import Variable
import numpy as np
import pylab as pl
import torch.nn.init as init
ステップ2
入力層のサイズを7に設定して、モデルのハイパーパラメーターを設定します。ターゲットシーケンスを作成するために、6つのコンテキストニューロンと1つの入力ニューロンがあります。
dtype = torch.FloatTensor
input_size, hidden_size, output_size = 7, 6, 1
epochs = 300
seq_length = 20
lr = 0.1
data_time_steps = np.linspace(2, 10, seq_length + 1)
data = np.sin(data_time_steps)
data.resize((seq_length + 1, 1))
x = Variable(torch.Tensor(data[:-1]).type(dtype), requires_grad=False)
y = Variable(torch.Tensor(data[1:]).type(dtype), requires_grad=False)
トレーニングデータを生成します。ここで、xは入力データシーケンス、yは必須のターゲットシーケンスです。
ステップ3
重みは、平均がゼロの正規分布を使用してリカレントニューラルネットワークで初期化されます。W1は入力変数の受け入れを表し、w2は以下に示すように生成される出力を表します-
w1 = torch.FloatTensor(input_size,
hidden_size).type(dtype)
init.normal(w1, 0.0, 0.4)
w1 = Variable(w1, requires_grad = True)
w2 = torch.FloatTensor(hidden_size, output_size).type(dtype)
init.normal(w2, 0.0, 0.3)
w2 = Variable(w2, requires_grad = True)
ステップ4
ここで、ニューラルネットワークを一意に定義するフィードフォワードの関数を作成することが重要です。
def forward(input, context_state, w1, w2):
xh = torch.cat((input, context_state), 1)
context_state = torch.tanh(xh.mm(w1))
out = context_state.mm(w2)
return (out, context_state)
ステップ5
次のステップは、リカレントニューラルネットワークの正弦波実装のトレーニング手順を開始することです。外側のループは各ループを反復処理し、内側のループはシーケンスの要素を反復処理します。ここでは、連続変数の予測に役立つ平均二乗誤差(MSE)も計算します。
for i in range(epochs):
total_loss = 0
context_state = Variable(torch.zeros((1, hidden_size)).type(dtype), requires_grad = True)
for j in range(x.size(0)):
input = x[j:(j+1)]
target = y[j:(j+1)]
(pred, context_state) = forward(input, context_state, w1, w2)
loss = (pred - target).pow(2).sum()/2
total_loss += loss
loss.backward()
w1.data -= lr * w1.grad.data
w2.data -= lr * w2.grad.data
w1.grad.data.zero_()
w2.grad.data.zero_()
context_state = Variable(context_state.data)
if i % 10 == 0:
print("Epoch: {} loss {}".format(i, total_loss.data[0]))
context_state = Variable(torch.zeros((1, hidden_size)).type(dtype), requires_grad = False)
predictions = []
for i in range(x.size(0)):
input = x[i:i+1]
(pred, context_state) = forward(input, context_state, w1, w2)
context_state = context_state
predictions.append(pred.data.numpy().ravel()[0])
ステップ6
次に、必要な方法で正弦波をプロットします。
pl.scatter(data_time_steps[:-1], x.data.numpy(), s = 90, label = "Actual")
pl.scatter(data_time_steps[1:], predictions, label = "Predicted")
pl.legend()
pl.show()
出力
上記のプロセスの出力は次のとおりです。
この章では、さらに焦点を当てます torchvision.datasetsとそのさまざまなタイプ。PyTorchには次のデータセットローダーが含まれています-
- MNIST
- COCO(キャプションと検出)
データセットには、以下に示す2種類の関数の大部分が含まれています-
Transform−画像を取り込んで、標準的なものの修正バージョンを返す関数。これらは、変換と一緒に構成できます。
Target_transform−ターゲットを取得して変換する関数。たとえば、キャプション文字列を取り込んで、ワールドインデックスのテンソルを返します。
MNIST
以下は、MNISTデータセットのサンプルコードです-
dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)
パラメータは次のとおりです-
root −処理されたデータが存在するデータセットのルートディレクトリ。
train − true =トレーニングセット、False =テストセット
download − true =インターネットからデータセットをダウンロードし、ルートに配置します。
COCO
これには、COCOAPIがインストールされている必要があります。次の例は、PyTorch −を使用したデータセットのCOCO実装を示すために使用されます。
import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)
達成される出力は次のとおりです-
Number of samples: 82783
Image Size: (3L, 427L, 640L)
Conventsは、CNNモデルを最初から構築することを目的としています。ネットワークアーキテクチャには、次の手順の組み合わせが含まれます-
- Conv2d
- MaxPool2d
- 正規化線形ユニット
- View
- 線形レイヤー
モデルのトレーニング
モデルのトレーニングは、画像分類の問題と同じプロセスです。次のコードスニペットは、提供されたデータセットでのトレーニングモデルの手順を完了します-
def fit(epoch,model,data_loader,phase
= 'training',volatile = False):
if phase == 'training':
model.train()
if phase == 'training':
model.train()
if phase == 'validation':
model.eval()
volatile=True
running_loss = 0.0
running_correct = 0
for batch_idx , (data,target) in enumerate(data_loader):
if is_cuda:
data,target = data.cuda(),target.cuda()
data , target = Variable(data,volatile),Variable(target)
if phase == 'training':
optimizer.zero_grad()
output = model(data)
loss = F.nll_loss(output,target)
running_loss + =
F.nll_loss(output,target,size_average =
False).data[0]
preds = output.data.max(dim = 1,keepdim = True)[1]
running_correct + =
preds.eq(target.data.view_as(preds)).cpu().sum()
if phase == 'training':
loss.backward()
optimizer.step()
loss = running_loss/len(data_loader.dataset)
accuracy = 100. * running_correct/len(data_loader.dataset)
print(f'{phase} loss is {loss:{5}.{2}} and {phase} accuracy is {running_correct}/{len(data_loader.dataset)}{accuracy:{return loss,accuracy}})
このメソッドには、トレーニングと検証のためのさまざまなロジックが含まれています。異なるモードを使用する主な理由は2つあります-
トレインモードでは、ドロップアウトによって値のパーセンテージが削除されます。これは、検証フェーズまたはテストフェーズでは発生しないはずです。
トレーニングモードでは、勾配を計算してモデルのパラメーター値を変更しますが、テストまたは検証フェーズではバックプロパゲーションは必要ありません。
この章では、最初から修道院を作成することに焦点を当てます。これは、トーチを使用してそれぞれの修道院またはサンプルニューラルネットワークを作成することを意味します。
ステップ1
それぞれのパラメータで必要なクラスを作成します。パラメータには、ランダムな値の重みが含まれます。
class Neural_Network(nn.Module):
def __init__(self, ):
super(Neural_Network, self).__init__()
self.inputSize = 2
self.outputSize = 1
self.hiddenSize = 3
# weights
self.W1 = torch.randn(self.inputSize,
self.hiddenSize) # 3 X 2 tensor
self.W2 = torch.randn(self.hiddenSize, self.outputSize) # 3 X 1 tensor
ステップ2
シグモイド関数を使用して関数のフィードフォワードパターンを作成します。
def forward(self, X):
self.z = torch.matmul(X, self.W1) # 3 X 3 ".dot"
does not broadcast in PyTorch
self.z2 = self.sigmoid(self.z) # activation function
self.z3 = torch.matmul(self.z2, self.W2)
o = self.sigmoid(self.z3) # final activation
function
return o
def sigmoid(self, s):
return 1 / (1 + torch.exp(-s))
def sigmoidPrime(self, s):
# derivative of sigmoid
return s * (1 - s)
def backward(self, X, y, o):
self.o_error = y - o # error in output
self.o_delta = self.o_error * self.sigmoidPrime(o) # derivative of sig to error
self.z2_error = torch.matmul(self.o_delta, torch.t(self.W2))
self.z2_delta = self.z2_error * self.sigmoidPrime(self.z2)
self.W1 + = torch.matmul(torch.t(X), self.z2_delta)
self.W2 + = torch.matmul(torch.t(self.z2), self.o_delta)
ステップ3
以下に説明するように、トレーニングおよび予測モデルを作成します-
def train(self, X, y):
# forward + backward pass for training
o = self.forward(X)
self.backward(X, y, o)
def saveWeights(self, model):
# Implement PyTorch internal storage functions
torch.save(model, "NN")
# you can reload model with all the weights and so forth with:
# torch.load("NN")
def predict(self):
print ("Predicted data based on trained weights: ")
print ("Input (scaled): \n" + str(xPredicted))
print ("Output: \n" + str(self.forward(xPredicted)))
畳み込みニューラルネットワークには、主要な機能が含まれています。 extraction。次の手順を使用して、畳み込みニューラルネットワークの特徴抽出を実装します。
ステップ1
それぞれのモデルをインポートして、「PyTorch」で特徴抽出モデルを作成します。
import torch
import torch.nn as nn
from torchvision import models
ステップ2
必要に応じて呼び出すことができる特徴抽出器のクラスを作成します。
class Feature_extractor(nn.module):
def forward(self, input):
self.feature = input.clone()
return input
new_net = nn.Sequential().cuda() # the new network
target_layers = [conv_1, conv_2, conv_4] # layers you want to extract`
i = 1
for layer in list(cnn):
if isinstance(layer,nn.Conv2d):
name = "conv_"+str(i)
art_net.add_module(name,layer)
if name in target_layers:
new_net.add_module("extractor_"+str(i),Feature_extractor())
i+=1
if isinstance(layer,nn.ReLU):
name = "relu_"+str(i)
new_net.add_module(name,layer)
if isinstance(layer,nn.MaxPool2d):
name = "pool_"+str(i)
new_net.add_module(name,layer)
new_net.forward(your_image)
print (new_net.extractor_3.feature)
この章では、修道院の助けを借りてデータ視覚化モデルに焦点を当てます。従来のニューラルネットワークで視覚化の全体像を把握するには、次の手順が必要です。
ステップ1
従来のニューラルネットワークの視覚化に重要な必要なモジュールをインポートします。
import os
import numpy as np
import pandas as pd
from scipy.misc import imread
from sklearn.metrics import accuracy_score
import keras
from keras.models import Sequential, Model
from keras.layers import Dense, Dropout, Flatten, Activation, Input
from keras.layers import Conv2D, MaxPooling2D
import torch
ステップ2
トレーニングおよびテストデータで潜在的なランダム性を停止するには、以下のコードで指定されているように、それぞれのデータセットを呼び出します。
seed = 128
rng = np.random.RandomState(seed)
data_dir = "../../datasets/MNIST"
train = pd.read_csv('../../datasets/MNIST/train.csv')
test = pd.read_csv('../../datasets/MNIST/Test_fCbTej3.csv')
img_name = rng.choice(train.filename)
filepath = os.path.join(data_dir, 'train', img_name)
img = imread(filepath, flatten=True)
ステップ3
以下のコードを使用して、トレーニングとテストのデータを完璧な方法で定義するために必要な画像をプロットします-
pylab.imshow(img, cmap ='gray')
pylab.axis('off')
pylab.show()
出力は以下のように表示されます-
この章では、代わりに両方のシーケンスにわたる単一の2D畳み込みニューラルネットワークに依存する代替アプローチを提案します。ネットワークの各レイヤーは、これまでに生成された出力シーケンスに基づいてソーストークンを再コード化します。したがって、注意のようなプロパティはネットワーク全体に浸透しています。
ここでは、焦点を当てます creating the sequential network with specific pooling from the values included in dataset。このプロセスは、「画像認識モジュール」にも最適です。
次の手順を使用して、PyTorch −を使用して修道院でシーケンス処理モデルを作成します。
ステップ1
修道院を使用してシーケンス処理を実行するために必要なモジュールをインポートします。
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
import numpy as np
ステップ2
以下のコードを使用して、それぞれの順序でパターンを作成するために必要な操作を実行します-
batch_size = 128
num_classes = 10
epochs = 12
# input image dimensions
img_rows, img_cols = 28, 28
# the data, split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(60000,28,28,1)
x_test = x_test.reshape(10000,28,28,1)
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)
ステップ3
モデルをコンパイルし、以下に示すように、前述の従来のニューラルネットワークモデルにパターンを適合させます-
model.compile(loss =
keras.losses.categorical_crossentropy,
optimizer = keras.optimizers.Adadelta(), metrics =
['accuracy'])
model.fit(x_train, y_train,
batch_size = batch_size, epochs = epochs,
verbose = 1, validation_data = (x_test, y_test))
score = model.evaluate(x_test, y_test, verbose = 0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
生成される出力は次のとおりです-
この章では、有名な単語埋め込みモデルであるword2vecについて理解します。Word2vecモデルは、関連するモデルのグループの助けを借りて単語の埋め込みを生成するために使用されます。Word2vecモデルは純粋なCコードで実装され、勾配は手動で計算されます。
PyTorchでのword2vecモデルの実装について、以下の手順で説明します。
ステップ1
以下に説明するように、単語埋め込みでライブラリを実装します-
import torch
from torch.autograd import Variable
import torch.nn as nn
import torch.nn.functional as F
ステップ2
word2vecというクラスで単語埋め込みのスキップグラムモデルを実装します。含まれていますemb_size, emb_dimension, u_embedding, v_embedding 属性のタイプ。
class SkipGramModel(nn.Module):
def __init__(self, emb_size, emb_dimension):
super(SkipGramModel, self).__init__()
self.emb_size = emb_size
self.emb_dimension = emb_dimension
self.u_embeddings = nn.Embedding(emb_size, emb_dimension, sparse=True)
self.v_embeddings = nn.Embedding(emb_size, emb_dimension, sparse = True)
self.init_emb()
def init_emb(self):
initrange = 0.5 / self.emb_dimension
self.u_embeddings.weight.data.uniform_(-initrange, initrange)
self.v_embeddings.weight.data.uniform_(-0, 0)
def forward(self, pos_u, pos_v, neg_v):
emb_u = self.u_embeddings(pos_u)
emb_v = self.v_embeddings(pos_v)
score = torch.mul(emb_u, emb_v).squeeze()
score = torch.sum(score, dim = 1)
score = F.logsigmoid(score)
neg_emb_v = self.v_embeddings(neg_v)
neg_score = torch.bmm(neg_emb_v, emb_u.unsqueeze(2)).squeeze()
neg_score = F.logsigmoid(-1 * neg_score)
return -1 * (torch.sum(score)+torch.sum(neg_score))
def save_embedding(self, id2word, file_name, use_cuda):
if use_cuda:
embedding = self.u_embeddings.weight.cpu().data.numpy()
else:
embedding = self.u_embeddings.weight.data.numpy()
fout = open(file_name, 'w')
fout.write('%d %d\n' % (len(id2word), self.emb_dimension))
for wid, w in id2word.items():
e = embedding[wid]
e = ' '.join(map(lambda x: str(x), e))
fout.write('%s %s\n' % (w, e))
def test():
model = SkipGramModel(100, 100)
id2word = dict()
for i in range(100):
id2word[i] = str(i)
model.save_embedding(id2word)
ステップ3
mainメソッドを実装して、単語埋め込みモデルを適切な方法で表示します。
if __name__ == '__main__':
test()
ディープニューラルネットワークには、自然言語のプロセスを理解する機械学習のブレークスルーを可能にする独自の機能があります。これらのモデルのほとんどは、言語を単語または文字のフラットシーケンスとして扱い、リカレントニューラルネットワークまたはRNNと呼ばれる一種のモデルを使用することが観察されています。
多くの研究者は、言語はフレーズの階層ツリーに関して最もよく理解されているという結論に達しました。このタイプは、特定の構造を考慮した再帰型ニューラルネットワークに含まれています。
PyTorchには、これらの複雑な自然言語処理モデルをはるかに簡単にするのに役立つ特定の機能があります。これは、コンピュータービジョンを強力にサポートする、あらゆる種類の深層学習のためのフル機能のフレームワークです。
再帰型ニューラルネットワークの機能
再帰型ニューラルネットワークは、構造のような異なるグラフで同じ重みのセットを適用することを含むように作成されます。
ノードはトポロジカル順序でトラバースされます。
このタイプのネットワークは、自動微分の逆モードによってトレーニングされます。
自然言語処理には、再帰型ニューラルネットワークの特殊なケースが含まれます。
この再帰型ニューラルテンソルネットワークには、ツリー内のさまざまな合成機能ノードが含まれています。
再帰型ニューラルネットワークの例を以下に示します-