ApacheMXNet-KVStoreと視覚化

この章では、PythonパッケージKVStoreと視覚化について説明します。

KVStoreパッケージ

KVストアはKey-Valueストアの略です。これは、マルチデバイストレーニングに使用される重要なコンポーネントです。単一のマシンおよび複数のマシン上のデバイス間でのパラメーターの通信は、パラメーター用のKVStoreを備えた1つ以上のサーバーを介して送信されるため重要です。

次の点を参考にして、KVStoreの動作を理解しましょう。

  • KVStoreの各値は、 keyvalue

  • ネットワーク内の各パラメータ配列には、 key そのパラメータ配列の重みは、によって参照されます。 value

  • その後、ワーカーノード pushバッチを処理した後の勾配。彼らもまたpull 新しいバッチを処理する前に重みを更新しました。

簡単に言えば、KVStoreは、各デバイスがデータをプッシュおよびプルできるデータ共有の場所であると言えます。

データのプッシュインとプルアウト

KVStoreは、GPUやコンピューターなどのさまざまなデバイス間で共有される単一のオブジェクトと考えることができます。各デバイスはデータをプッシュインおよびプルアウトできます。

以下は、データをプッシュおよびプルアウトするためにデバイスが従う必要のある実装手順です。

実装手順

Initialisation−最初のステップは、値を初期化することです。ここでは、この例では、ペア(int、NDArray)ペアをKVStroreに初期化し、その後、値を引き出します。

import mxnet as mx
kv = mx.kv.create('local') # create a local KVStore.
shape = (3,3)
kv.init(3, mx.nd.ones(shape)*2)
a = mx.nd.zeros(shape)
kv.pull(3, out = a)
print(a.asnumpy())

Output

これにより、次の出力が生成されます-

[[2. 2. 2.]
[2. 2. 2.]
[2. 2. 2.]]

Push, Aggregate, and Update −初期化すると、キーと同じ形状の新しい値をKVStoreにプッシュできます−

kv.push(3, mx.nd.ones(shape)*8)
kv.pull(3, out = a)
print(a.asnumpy())

Output

出力は以下のとおりです。

[[8. 8. 8.]
 [8. 8. 8.]
 [8. 8. 8.]]

プッシュに使用されるデータは、GPUやコンピューターなどの任意のデバイスに保存できます。同じキーに複数の値をプッシュすることもできます。この場合、KVStoreは最初にこれらすべての値を合計し、次に次のように集計値をプッシュします。

contexts = [mx.cpu(i) for i in range(4)]
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.push(3, b)
kv.pull(3, out = a)
print(a.asnumpy())

Output

次の出力が表示されます-

[[4. 4. 4.]
 [4. 4. 4.]
 [4. 4. 4.]]

適用したプッシュごとに、KVStoreはプッシュされた値をすでに保存されている値と結合します。それはアップデーターの助けを借りて行われます。ここで、デフォルトのアップデーターはASSIGNです。

def update(key, input, stored):
   print("update on key: %d" % key)
   
   stored += input * 2
kv.set_updater(update)
kv.pull(3, out=a)
print(a.asnumpy())

Output

上記のコードを実行すると、次の出力が表示されます-

[[4. 4. 4.]
 [4. 4. 4.]
 [4. 4. 4.]]

Example

kv.push(3, mx.nd.ones(shape))
kv.pull(3, out=a)
print(a.asnumpy())

Output

以下にコードの出力を示します-

update on key: 3
[[6. 6. 6.]
 [6. 6. 6.]
 [6. 6. 6.]]

Pull −プッシュと同様に、次のように1回の呼び出しで複数のデバイスに値をプルすることもできます。

b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.pull(3, out = b)
print(b[1].asnumpy())

Output

出力は以下のとおりです-

[[6. 6. 6.]
 [6. 6. 6.]
 [6. 6. 6.]]

完全な実装例

以下に完全な実装例を示します-

import mxnet as mx
kv = mx.kv.create('local')
shape = (3,3)
kv.init(3, mx.nd.ones(shape)*2)
a = mx.nd.zeros(shape)
kv.pull(3, out = a)
print(a.asnumpy())
kv.push(3, mx.nd.ones(shape)*8)
kv.pull(3, out = a) # pull out the value
print(a.asnumpy())
contexts = [mx.cpu(i) for i in range(4)]
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.push(3, b)
kv.pull(3, out = a)
print(a.asnumpy())
def update(key, input, stored):
   print("update on key: %d" % key)
   stored += input * 2
kv._set_updater(update)
kv.pull(3, out=a)
print(a.asnumpy())
kv.push(3, mx.nd.ones(shape))
kv.pull(3, out=a)
print(a.asnumpy())
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.pull(3, out = b)
print(b[1].asnumpy())

キーと値のペアの処理

上記で実装したすべての操作には単一のキーが含まれますが、KVStoreは a list of key-value pairs

単一のデバイスの場合

以下は、単一デバイスのキーと値のペアのリストのKVStoreインターフェイスを示す例です。

keys = [5, 7, 9]
kv.init(keys, [mx.nd.ones(shape)]*len(keys))
kv.push(keys, [mx.nd.ones(shape)]*len(keys))
b = [mx.nd.zeros(shape)]*len(keys)
kv.pull(keys, out = b)
print(b[1].asnumpy())

Output

次の出力が表示されます-

update on key: 5
update on key: 7
update on key: 9
[[3. 3. 3.]
 [3. 3. 3.]
 [3. 3. 3.]]

複数のデバイスの場合

以下は、複数のデバイスのキーと値のペアのリストのKVStoreインターフェイスを示す例です。

b = [[mx.nd.ones(shape, ctx) for ctx in contexts]] * len(keys)
kv.push(keys, b)
kv.pull(keys, out = b)
print(b[1][1].asnumpy())

Output

次の出力が表示されます-

update on key: 5
update on key: 7
update on key: 9
[[11. 11. 11.]
 [11. 11. 11.]
 [11. 11. 11.]]

視覚化パッケージ

視覚化パッケージは、ノードとエッジで構成される計算グラフとしてニューラルネットワーク(NN)を表すために使用されるApacheMXNetパッケージです。

ニューラルネットワークを視覚化する

以下の例では、 mx.viz.plot_networkニューラルネットワークを視覚化する。以下はこれの前提条件です-

Prerequisites

  • Jupyterノートブック

  • Graphvizライブラリ

実装例

以下の例では、線形行列因数分解のサンプルNNを視覚化します。

import mxnet as mx
user = mx.symbol.Variable('user')
item = mx.symbol.Variable('item')
score = mx.symbol.Variable('score')

# Set the dummy dimensions
k = 64
max_user = 100
max_item = 50

# The user feature lookup
user = mx.symbol.Embedding(data = user, input_dim = max_user, output_dim = k)

# The item feature lookup
item = mx.symbol.Embedding(data = item, input_dim = max_item, output_dim = k)

# predict by the inner product and then do sum
N_net = user * item
N_net = mx.symbol.sum_axis(data = N_net, axis = 1)
N_net = mx.symbol.Flatten(data = N_net)

# Defining the loss layer
N_net = mx.symbol.LinearRegressionOutput(data = N_net, label = score)

# Visualize the network
mx.viz.plot_network(N_net)