Apache MXNet-Python API 글루온

이전 장에서 이미 논의했듯이 MXNet Gluon은 DL 프로젝트를위한 명확하고 간결하며 간단한 API를 제공합니다. 이를 통해 Apache MXNet은 교육 속도를 잃지 않고 DL 모델을 프로토 타입, 구축 및 교육 할 수 있습니다.

핵심 모듈

Apache MXNet Python API (응용 프로그래밍 인터페이스) gluon의 핵심 모듈에 대해 알아 보겠습니다.

gluon.nn

Gluon은 gluon.nn 모듈에서 많은 수의 내장 NN 레이어를 제공합니다. 이것이 핵심 모듈이라고 불리는 이유입니다.

방법 및 매개 변수

다음은 몇 가지 중요한 방법과 해당 매개 변수입니다. mxnet.gluon.nn 핵심 모듈-

방법 및 매개 변수 정의
활성화 (활성화, ** ​​kwargs) 이름에서 알 수 있듯이이 방법은 입력에 활성화 함수를 적용합니다.
AvgPool1D ([풀 _ 크기, 스트라이드, 패딩,…]) 이것은 시간 데이터에 대한 평균 풀링 작업입니다.
AvgPool2D ([pool_size, strides, padding,…]) 이것은 공간 데이터에 대한 평균 풀링 작업입니다.
AvgPool3D ([풀 _ 크기, 스트라이드, 패딩,…]) 3D 데이터에 대한 평균 풀링 작업입니다. 데이터는 공간적이거나 시공간적 일 수 있습니다.
BatchNorm ([축, 운동량, 엡실론, 중심,…]) 배치 정규화 계층을 나타냅니다.
BatchNormReLU ([축, 운동량, 엡실론,…]) 또한 배치 정규화 계층을 나타내지 만 Relu 활성화 기능이 있습니다.
블록 ([접두사, 매개 변수]) 모든 신경망 계층 및 모델에 대한 기본 클래스를 제공합니다.
Conv1D (채널, 커널 _ 크기 [, 스트라이드,…]) 이 방법은 1 차원 컨볼 루션 계층에 사용됩니다. 예를 들어 시간 컨볼 루션입니다.
Conv1DTranspose (채널, 커널 _ 크기 [,…]) 이 방법은 Transposed 1D convolution layer에 사용됩니다.
Conv2D (채널, 커널 _ 크기 [, 스트라이드,…]) 이 방법은 2D convolution 레이어에 사용됩니다. 예를 들어, 이미지에 대한 공간적 회선).
Conv2DTranspose (채널, 커널 _ 크기 [,…]) 이 방법은 Transposed 2D convolution layer에 사용됩니다.
Conv3D (채널, 커널 _ 크기 [, 스트라이드,…]) 이 방법은 3D 컨볼 루션 레이어에 사용됩니다. 예를 들어, 볼륨에 대한 공간 컨볼 루션입니다.
Conv3DTranspose (채널, 커널 _ 크기 [,…]) 이 방법은 Transposed 3D convolution layer에 사용됩니다.
밀도 (units [, activation, use_bias,…]) 이 방법은 조밀하게 연결된 일반 NN 레이어를 나타냅니다.
드롭 아웃 (속도 [, 축]) 이름에서 알 수 있듯이이 메서드는 Dropout을 입력에 적용합니다.
ELU (α) 이 방법은 지수 선형 단위 (ELU)에 사용됩니다.
임베딩 (input_dim, output_dim [, dtype,…]) 음이 아닌 정수를 고정 된 크기의 조밀 한 벡터로 변환합니다.
평평하게 (** kwargs) 이 방법은 입력을 2 차원으로 평면화합니다.
GELU (** kwargs) 이 방법은 GELU (Gaussian Exponential Linear Unit)에 사용됩니다.
GlobalAvgPool1D ([레이아웃]) 이 방법의 도움으로 시간 데이터에 대한 글로벌 평균 풀링 작업을 수행 할 수 있습니다.
GlobalAvgPool2D ([레이아웃]) 이 방법의 도움으로 공간 데이터에 대한 글로벌 평균 풀링 작업을 수행 할 수 있습니다.
GlobalAvgPool3D ([레이아웃]) 이 방법의 도움으로 3D 데이터에 대한 글로벌 평균 풀링 작업을 수행 할 수 있습니다.
GlobalMaxPool1D ([레이아웃]) 이 방법의 도움으로 1D 데이터에 대한 전역 최대 풀링 작업을 수행 할 수 있습니다.
GlobalMaxPool2D ([레이아웃]) 이 방법의 도움으로 2D 데이터에 대한 전역 최대 풀링 작업을 수행 할 수 있습니다.
GlobalMaxPool3D ([레이아웃]) 이 방법의 도움으로 3D 데이터에 대한 전역 최대 풀링 작업을 수행 할 수 있습니다.
GroupNorm ([그룹 수, 엡실론, 중심,…]) 이 방법은 nD 입력 배열에 그룹 정규화를 적용합니다.
HybridBlock ([접두사, 매개 변수]) 이 방법은 SymbolNDArray.
HybridLambda(함수 [, 접두사]) 이 메서드의 도움으로 연산자 또는 표현식을 HybridBlock 개체로 래핑 할 수 있습니다.
HybridSequential ([접두사, 매개 변수]) HybridBlock을 순차적으로 스택합니다.
InstanceNorm ([축, 입실론, 중심, 배율,…]) 이 방법은 인스턴스 정규화를 nD 입력 배열에 적용합니다.

구현 예

아래 예제에서는 모든 신경망 계층과 모델에 대한 기본 클래스를 제공하는 Block ()을 사용할 것입니다.

from mxnet.gluon import Block, nn
class Model(Block):
   def __init__(self, **kwargs):
      super(Model, self).__init__(**kwargs)
      # use name_scope to give child Blocks appropriate names.
      with self.name_scope():
         self.dense0 = nn.Dense(20)
         self.dense1 = nn.Dense(20)
   def forward(self, x):

      x = mx.nd.relu(self.dense0(x))
      return mx.nd.relu(self.dense1(x))

model = Model()
model.initialize(ctx=mx.cpu(0))
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))

Output

다음 출력이 표시됩니다.

[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)*gt;

아래 예에서는 Symbol과 NDArray 모두 포워딩을 지원하는 HybridBlock ()을 사용할 것입니다.

import mxnet as mx
from mxnet.gluon import HybridBlock, nn


class Model(HybridBlock):
   def __init__(self, **kwargs):
      super(Model, self).__init__(**kwargs)
      # use name_scope to give child Blocks appropriate names.
      with self.name_scope():
         self.dense0 = nn.Dense(20)
         self.dense1 = nn.Dense(20)

   def forward(self, x):
      x = nd.relu(self.dense0(x))
      return nd.relu(self.dense1(x))
model = Model()
model.initialize(ctx=mx.cpu(0))

model.hybridize()
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))

Output

출력은 아래에 언급되어 있습니다.

[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)>

gluon.rnn

Gluon은 많은 내장 기능을 제공합니다. recurrent neural networkgluon.rnn 모듈의 (RNN) 레이어. 그것이 바로 핵심 모듈이라고 불리는 이유입니다.

방법 및 매개 변수

다음은 몇 가지 중요한 방법과 해당 매개 변수입니다. mxnet.gluon.nn 핵심 모듈 :

방법 및 매개 변수 정의
양방향 셀 (l_cell, r_cell [,…]) 양방향 RNN (Recurrent Neural Network) 셀에 사용됩니다.
DropoutCell (rate [, 축, 접두사, 매개 변수]) 이 방법은 주어진 입력에 드롭 아웃을 적용합니다.
GRU (hidden_size [, num_layers, 레이아웃,…]) 주어진 입력 시퀀스에 다 계층 게이트 순환 단위 (GRU) RNN을 적용합니다.
GRUCell (hidden_size [,…]) GRU (Gated Rectified Unit) 네트워크 셀에 사용됩니다.
HybridRecurrentCell ([접두사, 매개 변수]) 이 방법은 하이브리드 화를 지원합니다.
HybridSequentialRNNCell ([접두사, 매개 변수]) 이 방법의 도움으로 여러 HybridRNN 셀을 순차적으로 쌓을 수 있습니다.
LSTM (hidden_size [, num_layers, 레이아웃,…]) 0 주어진 입력 시퀀스에 다층 장단기 기억 (LSTM) RNN을 적용합니다.
LSTMCell (hidden_size [,…]) LSTM (Long-Short Term Memory) 네트워크 셀에 사용됩니다.
ModifierCell (base_cell) 수정 자 셀의 기본 클래스입니다.
RNN (hidden_size [, num_layers, activation,…]) 다층 Elman RNN을 다음과 같이 적용합니다. tanh 또는 ReLU 주어진 입력 시퀀스에 대한 비선형 성.
RNNCell (hidden_size [, 활성화,…]) Elman RNN 순환 신경망 셀에 사용됩니다.
RecurrentCell ([접두사, 매개 변수]) RNN 셀의 추상 기본 클래스를 나타냅니다.
SequentialRNNCell ([접두사, 매개 변수]) 이 방법의 도움으로 여러 RNN 셀을 순차적으로 쌓을 수 있습니다.
ZoneoutCell (base_cell [, zoneout_outputs,…]) 이 방법은 기본 셀에 Zoneout을 적용합니다.

구현 예

아래 예에서는 주어진 입력 시퀀스에 다층 게이트 순환 단위 (GRU) RNN을 적용하는 GRU ()를 사용할 것입니다.

layer = mx.gluon.rnn.GRU(100, 3)
layer.initialize()
input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq, h0)
out_seq

Output

이것은 다음과 같은 출력을 생성합니다-

[[[ 1.50152072e-01 5.19012511e-01 1.02390535e-01 ... 4.35803324e-01
1.30406499e-01 3.30152437e-02]
[ 2.91542172e-01 1.02243155e-01 1.73325196e-01 ... 5.65296151e-02
1.76546033e-02 1.66693389e-01]
[ 2.22257316e-01 3.76294643e-01 2.11277917e-01 ... 2.28903517e-01
3.43954474e-01 1.52770668e-01]]


[[ 1.40634328e-01 2.93247789e-01 5.50393537e-02 ... 2.30207980e-01
6.61415309e-02 2.70989928e-02]
[ 1.11081995e-01 7.20834285e-02 1.08342394e-01 ... 2.28330195e-02
6.79589901e-03 1.25501186e-01]
[ 1.15944080e-01 2.41565228e-01 1.18612610e-01 ... 1.14908054e-01
1.61080107e-01 1.15969211e-01]]
………………………….

Example

hn

Output

이것은 다음과 같은 출력을 생성합니다-

[[[-6.08105101e-02 3.86217088e-02   6.64453954e-03 8.18805695e-02
3.85607071e-02 -1.36945639e-02 7.45836645e-03 -5.46515081e-03
9.49622393e-02 6.39371723e-02 -6.37890724e-03 3.82240303e-02
9.11015049e-02 -2.01375950e-02 -7.29381144e-02 6.93765879e-02
2.71829776e-02 -6.64435029e-02 -8.45306814e-02 -1.03075653e-01
6.72040805e-02 -7.06537142e-02 -3.93818803e-02 5.16211614e-03
-4.79770005e-02 1.10734522e-01 1.56721435e-02 -6.93409378e-03
1.16915874e-01 -7.95962065e-02 -3.06530762e-02 8.42394680e-02
7.60370195e-02 2.17055440e-01 9.85361822e-03 1.16660878e-01
4.08297703e-02 1.24978097e-02 8.25245082e-02 2.28673983e-02
-7.88266212e-02 -8.04114193e-02 9.28791538e-02 -5.70827350e-03
-4.46166918e-02 -6.41122833e-02 1.80885363e-02 -2.37745279e-03
4.37298454e-02 1.28888980e-01 -3.07202265e-02 2.50503756e-02
4.00907174e-02 3.37077095e-03 -1.78839862e-02 8.90695080e-02
6.30150884e-02 1.11416787e-01 2.12221760e-02 -1.13236710e-01
5.39616570e-02 7.80710578e-02 -2.28817668e-02 1.92073174e-02
………………………….

아래 예제에서 우리는 주어진 입력 시퀀스에 장기 단기 기억 (LSTM) RNN을 적용하는 LSTM ()을 사용할 것입니다.

layer = mx.gluon.rnn.LSTM(100, 3)
layer.initialize()

input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
c0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq,[h0,c0])
out_seq

Output

출력은 아래에 언급되어 있습니다.

[[[ 9.00025964e-02 3.96071747e-02 1.83841765e-01 ... 3.95872220e-02
1.25569820e-01 2.15555862e-01]
[ 1.55962542e-01 -3.10300849e-02 1.76772922e-01 ... 1.92474753e-01
2.30574399e-01 2.81707942e-02]
[ 7.83204585e-02 6.53361529e-03 1.27262697e-01 ... 9.97719541e-02
1.28254429e-01 7.55299702e-02]]
[[ 4.41036932e-02 1.35250352e-02 9.87644792e-02 ... 5.89378644e-03
5.23949116e-02 1.00922674e-01]
[ 8.59075040e-02 -1.67027581e-02 9.69351009e-02 ... 1.17763653e-01
9.71239135e-02 2.25218050e-02]
[ 4.34580036e-02 7.62207608e-04 6.37005866e-02 ... 6.14888743e-02
5.96345589e-02 4.72368896e-02]]
……………

Example

hn

Output

코드를 실행하면 다음 출력이 표시됩니다.

[
[[[ 2.21408084e-02 1.42750628e-02 9.53067932e-03 -1.22849066e-02
1.78788435e-02 5.99269159e-02 5.65306023e-02 6.42553642e-02
6.56616641e-03 9.80876666e-03 -1.15729487e-02 5.98640442e-02
-7.21173314e-03 -2.78371759e-02 -1.90690923e-02 2.21447181e-02
8.38765781e-03 -1.38521893e-02 -9.06938594e-03 1.21346042e-02
6.06449470e-02 -3.77471633e-02 5.65885007e-02 6.63008019e-02
-7.34188128e-03 6.46054149e-02 3.19911093e-02 4.11194898e-02
4.43960279e-02 4.92892228e-02 1.74766723e-02 3.40303481e-02
-5.23341820e-03 2.68163737e-02 -9.43402853e-03 -4.11836170e-02
1.55221792e-02 -5.05655073e-02 4.24557598e-03 -3.40388380e-02
……………………

교육 모듈

Gluon의 교육 모듈은 다음과 같습니다.

gluon.loss

mxnet.gluon.loss모듈, Gluon은 미리 정의 된 손실 기능을 제공합니다. 기본적으로 신경망 훈련에 손실이 있습니다. 그것이 교육 모듈이라고 불리는 이유입니다.

방법 및 매개 변수

다음은 몇 가지 중요한 방법과 해당 매개 변수입니다. mxnet.gluon.loss 교육 모듈 :

방법 및 매개 변수 정의
손실 (weight, batch_axis, ** kwargs) 이것은 손실에 대한 기본 클래스 역할을합니다.
L2Loss ([weight, batch_axis]) 다음 사이의 평균 제곱 오차 (MSE)를 계산합니다. labelprediction(pred).
L1Loss ([weight, batch_axis]) 평균 절대 오차 (MAE)를 계산합니다. labelpred.
SigmoidBinaryCrossEntropyLoss ([…]) 이 방법은 이진 분류를위한 교차 엔트로피 손실에 사용됩니다.
SigmoidBCELoss 이 방법은 이진 분류를위한 교차 엔트로피 손실에 사용됩니다.
SoftmaxCrossEntropyLoss ([축,…]) 소프트 맥스 교차 엔트로피 손실 (CEL)을 계산합니다.
SoftmaxCELoss 또한 소프트 맥스 교차 엔트로피 손실을 계산합니다.
KLDivLoss ([from_logits, 축, 무게,…]) Kullback-Leibler 분기 손실에 사용됩니다.
CTCLoss ([레이아웃, 레이블 _ 레이아웃, 가중치]) 연결 주의자 시간 분류 손실 (TCL)에 사용됩니다.
HuberLoss ([rho, weight, batch_axis]) 평활화 된 L1 손실을 계산합니다. 평활화 된 L1 손실은 절대 오차가 rho를 초과하면 L1 손실과 같고 그렇지 않으면 L2 손실과 같습니다.
HingeLoss ([margin, weight, batch_axis]) 이 방법은 SVM에서 자주 사용되는 힌지 손실 함수를 계산합니다.
SquaredHingeLoss ([margin, weight, batch_axis]) 이 방법은 SVM에서 사용되는 소프트 마진 손실 함수를 계산합니다.
LogisticLoss ([weight, batch_axis, label_format]) 이 방법은 로지스틱 손실을 계산합니다.
TripletLoss ([margin, weight, batch_axis]) 이 방법은 3 개의 입력 텐서와 양의 마진이 주어지면 3 중 손실을 계산합니다.
PoissonNLLLoss ([weight, from_logits,…]) 이 함수는 음의 로그 우도 손실을 계산합니다.
CosineEmbeddingLoss ([weight, batch_axis, margin]) 이 함수는 벡터 간의 코사인 거리를 계산합니다.
SDMLLoss ([smoothing_parameter, weight,…]) 이 방법은 두 개의 입력 텐서와 평활 가중치 SDM 손실이 주어지면 배치 별 평활 심층 측정 학습 (SDML) 손실을 계산합니다. 미니 배치에서 짝을 이루지 않은 샘플을 잠재적 인 부정적인 예로 사용하여 짝을 이룬 샘플 간의 유사성을 학습합니다.

우리가 알고 있듯이 mxnet.gluon.loss.loss레이블과 예측 (pred) 사이의 MSE (Mean Squared Error)를 계산합니다. 다음 공식의 도움으로 수행됩니다.

gluon.parameter

mxnet.gluon.parameter 매개 변수, 즉 블록의 가중치를 보유하는 컨테이너입니다.

방법 및 매개 변수

다음은 몇 가지 중요한 방법과 해당 매개 변수입니다. mxnet.gluon.parameter 교육 모듈 −

방법 및 매개 변수 정의
캐스트 (dtype) 이 메소드는이 매개 변수의 데이터 및 그라디언트를 새 데이터 유형으로 캐스트합니다.
데이터 ([ctx]) 이 메소드는 한 컨텍스트에서이 매개 변수의 사본을 리턴합니다.
grad ([ctx]) 이 메서드는 한 컨텍스트에서이 매개 변수에 대한 그래디언트 버퍼를 반환합니다.
initialize ([init, ctx, default_init,…]) 이 메서드는 매개 변수 및 기울기 배열을 초기화합니다.
list_ctx () 이 메소드는이 매개 변수가 초기화 된 컨텍스트 목록을 리턴합니다.
list_data () 이 메서드는 모든 컨텍스트에서이 매개 변수의 복사본을 반환합니다. 생성과 동일한 순서로 진행됩니다.
list_grad () 이 메서드는 모든 컨텍스트에서 그래디언트 버퍼를 반환합니다. 이 작업은 다음과 같은 순서로 수행됩니다.values().
list_row_sparse_data (row_id) 이 메서드는 모든 컨텍스트에서 'row_sparse'매개 변수의 복사본을 반환합니다. 이것은 생성과 동일한 순서로 수행됩니다.
reset_ctx (ctx) 이 메서드는 매개 변수를 다른 컨텍스트에 다시 할당합니다.
row_sparse_data (row_id) 이 메서드는 row_id와 동일한 컨텍스트에서 'row_sparse'매개 변수의 복사본을 반환합니다.
set_data (데이터) 이 메소드는 모든 컨텍스트에서이 매개 변수의 값을 설정합니다.
var () 이 메소드는이 매개 변수를 나타내는 기호를 리턴합니다.
zero_grad () 이 메서드는 모든 컨텍스트의 그래디언트 버퍼를 0으로 설정합니다.

구현 예

아래 예제에서는 다음과 같이 initialize () 메서드를 사용하여 매개 변수와 그라디언트 배열을 초기화합니다.

weight = mx.gluon.Parameter('weight', shape=(2, 2))
weight.initialize(ctx=mx.cpu(0))
weight.data()

Output

출력은 아래에 언급되어 있습니다.

[[-0.0256899 0.06511251]
[-0.00243821 -0.00123186]]
<NDArray 2x2 @cpu(0)>

Example

weight.grad()

Output

출력은 다음과 같습니다.

[[0. 0.]
[0. 0.]]
<NDArray 2x2 @cpu(0)>

Example

weight.initialize(ctx=[mx.gpu(0), mx.gpu(1)])
weight.data(mx.gpu(0))

Output

다음 출력이 표시됩니다.

[[-0.00873779 -0.02834515]
 [ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(0)>

Example

weight.data(mx.gpu(1))

Output

위의 코드를 실행하면 다음 출력이 표시됩니다.

[[-0.00873779 -0.02834515]
 [ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(1)>

gluon.trainer

mxnet.gluon.trainer는 매개 변수 세트에 Optimizer를 적용합니다. autograd와 함께 사용해야합니다.

방법 및 매개 변수

다음은 몇 가지 중요한 방법과 해당 매개 변수입니다. mxnet.gluon.trainer 교육 모듈 −

방법 및 매개 변수 정의
allreduce_grads () 이 방법은 각 매개 변수 (가중치)에 대해 서로 다른 컨텍스트의 그라디언트를 줄입니다.
load_states (fname) 이름에서 알 수 있듯이이 메서드는 트레이너 상태를로드합니다.
save_states (fname) 이름에서 알 수 있듯이이 방법은 트레이너 상태를 저장합니다.
set_learning_rate (lr) 이 방법은 최적화 프로그램의 새로운 학습 속도를 설정합니다.
step (batch_size [, ignore_stale_grad]) 이 방법은 매개 변수 업데이트의 한 단계를 만듭니다. 이후에 호출해야합니다.autograd.backward() 그리고 외부 record() 범위.
update (batch_size [, ignore_stale_grad]) 이 방법은 또한 매개 변수 업데이트의 한 단계를 만듭니다. 이후에 호출해야합니다.autograd.backward() 그리고 외부 record() 범위 및 trainer.update () 이후.

데이터 모듈

Gluon의 데이터 모듈은 아래에 설명되어 있습니다.

gluon.data

Gluon은 gluon.data 모듈에서 많은 수의 내장 데이터 세트 유틸리티를 제공합니다. 그것이 데이터 모듈이라고 불리는 이유입니다.

클래스 및 매개 변수

다음은 mxnet.gluon.data 코어 모듈에서 다루는 몇 가지 중요한 메소드와 매개 변수입니다. 이러한 메서드는 일반적으로 데이터 세트, 샘플링 및 DataLoader와 관련이 있습니다.

데이터 세트
방법 및 매개 변수 정의
ArrayDataset (* args) 이 메서드는 두 개 이상의 데이터 집합과 유사한 개체를 결합하는 데이터 집합을 나타냅니다. 예 : 데이터 세트, 목록, 배열 등
BatchSampler (샘플러, batch_size [, last_batch]) 이 방법은 다른 방법으로 래핑됩니다. Sampler. 포장되면 샘플의 미니 배치를 반환합니다.
DataLoader (dataset [, batch_size, shuffle,…]) BatchSampler와 비슷하지만이 메서드는 데이터 세트에서 데이터를로드합니다. 로드되면 데이터의 미니 배치를 반환합니다.
이것은 추상 데이터 세트 클래스를 나타냅니다.
FilterSampler (fn, 데이터 셋) 이 메서드는 fn (함수)이 반환하는 데이터 집합의 샘플 요소를 나타냅니다. True.
RandomSampler (길이) 이 방법은 [0, 길이)의 샘플 요소를 대체하지 않고 무작위로 나타냅니다.
RecordFileDataset (파일 이름) RecordIO 파일을 감싸는 데이터 세트를 나타냅니다. 파일 확장자는.rec.
샘플러 이것은 샘플러의 기본 클래스입니다.
SequentialSampler (길이 [, 시작]) 집합 [시작, 시작 + 길이)의 샘플 요소를 순차적으로 나타냅니다.
집합 [시작, 시작 + 길이)의 샘플 요소를 순차적으로 나타냅니다. 이것은 특히 목록과 배열에 대한 간단한 데이터 세트 래퍼를 나타냅니다.

구현 예

아래 예에서 우리는 gluon.data.BatchSampler()다른 샘플러를 래핑하는 API. 샘플의 미니 배치를 반환합니다.

import mxnet as mx
from mxnet.gluon import data
sampler = mx.gluon.data.SequentialSampler(15)
batch_sampler = mx.gluon.data.BatchSampler(sampler, 4, 'keep')
list(batch_sampler)

Output

출력은 아래에 언급되어 있습니다.

[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11], [12, 13, 14]]

gluon.data.vision.datasets

Gluon은 다양한 사전 정의 비전 데이터 세트 기능을 제공합니다. gluon.data.vision.datasets 기준 치수.

클래스 및 매개 변수

MXNet은 유용하고 중요한 데이터 세트를 제공하며, 클래스와 매개 변수는 다음과 같습니다.

클래스 및 매개 변수 정의
MNIST ([루트, 훈련, 변환]) 이것은 손으로 쓴 숫자를 제공하는 유용한 데이터 세트입니다. MNIST 데이터 세트의 URL은 http://yann.lecun.com/exdb/mnist입니다.
FashionMNIST ([root, train, transform]) 이 데이터 세트는 패션 제품으로 구성된 Zalando의 기사 이미지로 구성됩니다. 원래 MNIST 데이터 세트의 드롭 인 대체입니다. 이 데이터 세트는 https://github.com/zalandoresearch/fashion-mnist에서 얻을 수 있습니다.
CIFAR10 ([root, train, transform]) 이것은 https://www.cs.toronto.edu/~kriz/cifar.html의 이미지 분류 데이터 세트입니다. 이 데이터 세트에서 각 샘플은 모양 (32, 32, 3)의 이미지입니다.
CIFAR100 ([root, fine_label, train, transform]) https://www.cs.toronto.edu/~kriz/cifar.html의 CIFAR100 이미지 분류 데이터 세트입니다. 또한 각 샘플은 모양 (32, 32, 3)의 이미지입니다.
ImageRecordDataset (파일 이름 [, 플래그, 변환]) 이 데이터 세트는 이미지가 포함 된 RecordIO 파일을 래핑합니다. 이 각 샘플은 해당 레이블이있는 이미지입니다.
ImageFolderDataset (루트 [, 플래그, 변환]) 폴더 구조에 저장된 이미지 파일을로드하기위한 데이터 세트입니다.
ImageListDataset ([root, imglist, flag]) 항목 목록에 지정된 이미지 파일을로드하기위한 데이터 세트입니다.

아래 예제에서 우리는 항목 목록에 의해 지정된 이미지 파일을로드하는 데 사용되는 ImageListDataset ()의 사용을 보여줄 것입니다.

# written to text file *.lst

0 0 root/cat/0001.jpg
1 0 root/cat/xxxa.jpg
2 0 root/cat/yyyb.jpg
3 1 root/dog/123.jpg
4 1 root/dog/023.jpg
5 1 root/dog/wwww.jpg

# A pure list, each item is a list [imagelabel: float or list of float, imgpath]

[[0, root/cat/0001.jpg]
[0, root/cat/xxxa.jpg]
[0, root/cat/yyyb.jpg]
[1, root/dog/123.jpg]
[1, root/dog/023.jpg]
[1, root/dog/wwww.jpg]]

유틸리티 모듈

Gluon의 유틸리티 모듈은 다음과 같습니다.

gluon.utils

Gluon은 gluon.utils 모듈에서 많은 내장 병렬화 유틸리티 최적화 프로그램을 제공합니다. 교육을위한 다양한 유틸리티를 제공합니다. 그것이 유틸리티 모듈이라고 불리는 이유입니다.

기능 및 매개 변수

다음은이 유틸리티 모듈에서 구성되는 기능과 해당 매개 변수입니다. gluon.utils −

기능 및 매개 변수 정의
split_data (data, num_slice [, batch_axis,…]) 이 함수는 일반적으로 데이터 병렬 처리에 사용되며 각 슬라이스는 GPU와 같은 하나의 장치로 전송됩니다. NDArray를num_slice 함께 슬라이스 batch_axis.
split_and_load (데이터, ctx_list [, batch_axis,…]) 이 함수는 NDArray를 len(ctx_list) 함께 슬라이스 batch_axis. 위의 split_data () 함수와의 유일한 차이점은 각 슬라이스를 하나의 컨텍스트로로드한다는 것입니다. ctx_list.
clip_global_norm (배열, max_norm [,…]) 이 함수의 역할은 2- 노름의 합이 다음보다 작은 방식으로 NDArray의 크기를 조정하는 것입니다. max_norm.
check_sha1 (파일 이름, sha1_hash) 이 함수는 파일 콘텐츠의 sha1 해시가 예상 해시와 일치하는지 여부를 확인합니다.
다운로드 (URL [, 경로, 덮어 쓰기, sha1_hash,…]) 이름이 지정한대로이 함수는 주어진 URL을 다운로드합니다.
대체 _ 파일 (src, dst) 이 함수는 원 자성을 구현합니다. os.replace. Linux 및 OSX에서 수행됩니다.