Apache MXNet - Kurzanleitung

In diesem Kapitel werden die Funktionen von Apache MXNet vorgestellt und die neueste Version dieses Deep-Learning-Software-Frameworks vorgestellt.

Was ist MXNet?

Apache MXNet ist ein leistungsstarkes Open-Source-Framework-Instrument für Deep-Learning-Software, mit dem Entwickler Deep-Learning-Modelle erstellen, trainieren und bereitstellen können. In den letzten Jahren waren die Auswirkungen des tiefen Lernens von der Gesundheitsversorgung über den Transport bis zur Herstellung und in der Tat in allen Bereichen unseres täglichen Lebens weit verbreitet. Heutzutage suchen Unternehmen nach tiefem Lernen, um einige schwierige Probleme wie Gesichtserkennung, Objekterkennung, optische Zeichenerkennung (OCR), Spracherkennung und maschinelle Übersetzung zu lösen.

Aus diesem Grund wird Apache MXNet unterstützt von:

  • Einige große Unternehmen wie Intel, Baidu, Microsoft, Wolfram Research usw.

  • Öffentliche Cloud-Anbieter, einschließlich Amazon Web Services (AWS) und Microsoft Azure

  • Einige große Forschungsinstitute wie Carnegie Mellon, MIT, die University of Washington und die Hong Kong University of Science & Technology.

Warum Apache MXNet?

Es gibt verschiedene Deep-Learning-Plattformen wie Torch7, Caffe, Theano, TensorFlow, Keras, Microsoft Cognitive Toolkit usw. Dann fragen Sie sich vielleicht, warum Apache MXNet? Schauen wir uns einige der Gründe dafür an:

  • Apache MXNet löst eines der größten Probleme bestehender Deep-Learning-Plattformen. Das Problem ist, dass man, um Deep-Learning-Plattformen nutzen zu können, ein anderes System für eine andere Programmiervariante lernen muss.

  • Mit Hilfe von Apache MXNet können Entwickler die vollen Funktionen von GPUs sowie Cloud Computing nutzen.

  • Apache MXNet kann jede numerische Berechnung beschleunigen und legt besonderen Wert darauf, die Entwicklung und Bereitstellung von DNN (Deep Neural Networks) in großem Maßstab zu beschleunigen.

  • Es bietet den Benutzern die Möglichkeiten der imperativen und symbolischen Programmierung.

Verschiedene Funktionen

Wenn Sie nach einer flexiblen Deep-Learning-Bibliothek suchen, um schnell aktuelle Deep-Learning-Forschung zu entwickeln, oder nach einer robusten Plattform, um die Produktionsarbeitslast zu steigern, endet Ihre Suche bei Apache MXNet. Dies liegt an den folgenden Merkmalen:

Verteiltes Training

Ob Multi-GPU- oder Multi-Host-Training mit nahezu linearer Skalierungseffizienz - mit Apache MXNet können Entwickler das Beste aus ihrer Hardware herausholen. MXNet unterstützt auch die Integration mit Horovod, einem Open Source-Framework für verteiltes Deep Learning, das bei Uber erstellt wurde.

Für diese Integration sind im Folgenden einige der in Horovod definierten gängigen verteilten APIs aufgeführt:

  • horovod.broadcast()

  • horovod.allgather()

  • horovod.allgather()

In dieser Hinsicht bietet uns MXNet die folgenden Funktionen:

  • Device Placement - Mit Hilfe von MXNet können wir einfach jede Datenstruktur (DS) spezifizieren.

  • Automatic Differentiation - Apache MXNet automatisiert die Differenzierung, dh Ableitungsberechnungen.

  • Multi-GPU training - Mit MXNet können wir mit der Anzahl der verfügbaren GPUs eine Skalierungseffizienz erzielen.

  • Optimized Predefined Layers - Wir können unsere eigenen Layer in MXNet codieren sowie die vordefinierten Layer auch auf Geschwindigkeit optimieren.

Hybridisierung

Apache MXNet bietet seinen Benutzern ein hybrides Front-End. Mit Hilfe der Gluon Python API kann es die Lücke zwischen seinen imperativen und symbolischen Fähigkeiten schließen. Dies kann durch Aufrufen der Hybridisierungsfunktionalität erfolgen.

Schnellere Berechnung

Die linearen Operationen wie Dutzende oder Hunderte von Matrixmultiplikationen sind der rechnerische Engpass für tiefe neuronale Netze. Um diesen Engpass zu beheben, bietet MXNet -

  • Optimierte numerische Berechnung für GPUs

  • Optimierte numerische Berechnung für verteilte Ökosysteme

  • Automatisierung gängiger Workflows, mit deren Hilfe der Standard-NN kurz ausgedrückt werden kann.

Sprachbindungen

MXNet ist tief in Hochsprachen wie Python und R integriert. Es bietet auch Unterstützung für andere Programmiersprachen wie z.

  • Scala

  • Julia

  • Clojure

  • Java

  • C/C++

  • Perl

Wir müssen keine neue Programmiersprache lernen, stattdessen ermöglicht MXNet in Kombination mit der Hybridisierungsfunktion einen außergewöhnlich reibungslosen Übergang von Python zur Bereitstellung in der Programmiersprache unserer Wahl.

Neueste Version MXNet 1.6.0

Die Apache Software Foundation (ASF) hat am 21. Februar 2020 die stabile Version 1.6.0 von Apache MXNet unter Apache License 2.0 veröffentlicht. Dies ist die letzte MXNet-Version, die Python 2 unterstützt, da die MXNet-Community dafür gestimmt hat, Python 2 in weiteren Versionen nicht mehr zu unterstützen. Schauen wir uns einige der neuen Funktionen an, die diese Version für ihre Benutzer bietet.

NumPy-kompatible Schnittstelle

Aufgrund seiner Flexibilität und Allgemeingültigkeit wurde NumPy von Praktikern, Wissenschaftlern und Studenten des maschinellen Lernens häufig verwendet. Da wir jedoch wissen, dass heutzutage Hardwarebeschleuniger wie GPUs (Graphical Processing Units) zunehmend in verschiedene Toolkits für maschinelles Lernen (ML) integriert werden, müssen die NumPy-Benutzer auf neue Frameworks umsteigen, um die Geschwindigkeit von GPUs nutzen zu können mit unterschiedlicher Syntax.

Mit MXNet 1.6.0 entwickelt sich Apache MXNet zu einem NumPy-kompatiblen Programmiererlebnis. Die neue Benutzeroberfläche bietet Anwendern, die mit der NumPy-Syntax vertraut sind, eine gleichwertige Benutzerfreundlichkeit und Ausdruckskraft. Zusammen mit diesem MXNet 1.6.0 kann das vorhandene Numpy-System auch Hardwarebeschleuniger wie GPUs verwenden, um umfangreiche Berechnungen zu beschleunigen.

Integration mit Apache TVM

Apache TVM, ein Open-Source-End-to-End-Deep-Learning-Compiler-Stack für Hardware-Backends wie CPUs, GPUs und spezialisierte Beschleuniger, soll die Lücke zwischen produktivitätsorientierten Deep-Learning-Frameworks und leistungsorientierten Hardware-Backends schließen . Mit der neuesten Version MXNet 1.6.0 können Benutzer Apache (Inkubation) TVM nutzen, um leistungsstarke Operator-Kernel in der Programmiersprache Python zu implementieren. Zwei Hauptvorteile dieser neuen Funktion sind folgende:

  • Vereinfacht den früheren C ++ - basierten Entwicklungsprozess.

  • Ermöglicht die gemeinsame Nutzung derselben Implementierung für mehrere Hardware-Backends wie CPUs, GPUs usw.

Verbesserungen an vorhandenen Funktionen

Neben den oben aufgeführten Funktionen von MXNet 1.6.0 bietet es auch einige Verbesserungen gegenüber den vorhandenen Funktionen. Die Verbesserungen sind wie folgt:

Elementweise Operation für GPU gruppieren

Wie wir wissen, ist die Leistung von elementweisen Operationen die Speicherbandbreite, und das ist der Grund, warum das Verketten solcher Operationen die Gesamtleistung verringern kann. Apache MXNet 1.6.0 führt eine elementweise Operationsfusion durch, die nach Möglichkeit Just-in-Time-Fusionsoperationen generiert. Eine solche elementweise Betriebsfusion reduziert auch den Speicherbedarf und verbessert die Gesamtleistung.

Gemeinsame Ausdrücke vereinfachen

MXNet 1.6.0 eliminiert die redundanten Ausdrücke und vereinfacht die allgemeinen Ausdrücke. Eine solche Verbesserung verbessert auch die Speichernutzung und die Gesamtausführungszeit.

Optimierungen

MXNet 1.6.0 bietet außerdem verschiedene Optimierungen für vorhandene Funktionen und Operatoren:

  • Automatische gemischte Präzision

  • Gluon Fit API

  • MKL-DNN

  • Große Tensorunterstützung

  • TensorRT Integration

  • Gradientenunterstützung höherer Ordnung

  • Operators

  • Operator Performance Profiler

  • ONNX Import / Export

  • Verbesserungen an Gluon-APIs

  • Verbesserungen an Symbol-APIs

  • Mehr als 100 Fehlerkorrekturen

Um mit MXNet zu beginnen, müssen wir es zunächst auf unserem Computer installieren. Apache MXNet funktioniert auf nahezu allen verfügbaren Plattformen, einschließlich Windows, Mac und Linux.

Linux-Betriebssystem

Wir können MXNet unter Linux auf folgende Weise installieren:

Grafische Verarbeitungseinheit (GPU)

Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir GPU für die Verarbeitung verwenden -

Mit der Pip-Methode

Mit dem folgenden Befehl können Sie MXNet auf Ihrem Linus-Betriebssystem installieren:

pip install mxnet

Apache MXNet bietet auch MKL-Pip-Pakete an, die auf Intel-Hardware viel schneller sind. Hier zum Beispielmxnet-cu101mkl bedeutet, dass -

  • Das Paket wird mit CUDA / cuDNN erstellt

  • Das Paket ist MKL-DNN-fähig

  • Die CUDA-Version ist 10.1

Für andere Optionen können Sie auch verweisen https://pypi.org/project/mxnet/.

Mit Docker

Sie finden die Docker-Images mit MXNet bei DockerHub, das unter verfügbar ist https://hub.docker.com/u/mxnet Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit GPU zu installieren.

Step 1- Befolgen Sie zunächst die Docker-Installationsanweisungen, die unter verfügbar sind https://docs.docker.com/engine/install/ubuntu/. Wir müssen Docker auf unserem Computer installieren.

Step 2- Um die Verwendung von GPUs aus den Docker-Containern zu ermöglichen, müssen wir als nächstes das nvidia-Docker-Plugin installieren. Sie können den Installationsanweisungen unter folgenhttps://github.com/NVIDIA/nvidia-docker/wiki.

Step 3- Mit dem folgenden Befehl können Sie das MXNet-Docker-Image abrufen. -

$ sudo docker pull mxnet/python:gpu

Um zu sehen, ob das Abrufen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:

$ sudo docker images

Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden. Überprüfen Sie die folgenden Befehle -

$ sudo docker pull mxnet/python:1.3.0_cpu_mkl $ sudo docker images

Aus der Quelle

Um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode mit der GPU zu erstellen, müssen Sie zunächst die Umgebung für CUDA und cuDNN wie folgt einrichten

  • Laden Sie das CUDA-Toolkit herunter und installieren Sie es. Hier wird CUDA 9.2 empfohlen.

  • Nächster Download cuDNN 7.1.4.

  • Jetzt müssen wir die Datei entpacken. Es ist auch erforderlich, in das Stammverzeichnis cuDNN zu wechseln. Verschieben Sie außerdem den Header und die Bibliotheken wie folgt in den lokalen CUDA Toolkit-Ordner:

tar xvzf cudnn-9.2-linux-x64-v7.1
sudo cp -P cuda/include/cudnn.h /usr/local/cuda/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
sudo ldconfig

Führen Sie nach dem Einrichten der Umgebung für CUDA und cuDNN die folgenden Schritte aus, um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode zu erstellen.

Step 1- Zuerst müssen wir die erforderlichen Pakete installieren. Diese Abhängigkeiten sind ab Ubuntu Version 16.04 erforderlich.

sudo apt-get update
sudo apt-get install -y build-essential git ninja-build ccache libopenblas-dev 
libopencv-dev cmake

Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zuerst das Repository mit dem folgenden Befehl klonen

git clone –recursive https://github.com/apache/incubator-mxnet.git mxnet
cd mxnet
cp config/linux_gpu.cmake #for build with CUDA

Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen

rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .

Two important points regarding the above step is as follows−

Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:

cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..

Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen:

cmake --build . --parallel N

Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Ordner in Ihrem MXNet project root, du wirst finden libmxnet.so Dies ist erforderlich, um Sprachbindungen zu installieren (optional).

Central Processing Unit (CPU)

Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir CPU für die Verarbeitung verwenden -

Mit der Pip-Methode

Mit dem folgenden Befehl können Sie MXNet auf Ihrem Linus OS installieren

pip install mxnet

Apache MXNet bietet auch MKL-DNN-fähige Pip-Pakete an, die viel schneller sind, wenn sie auf Intel-Hardware ausgeführt werden.

pip install mxnet-mkl

Mit Docker

Sie finden die Docker-Images mit MXNet bei DockerHub, das unter verfügbar ist https://hub.docker.com/u/mxnet. Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit CPU zu installieren.

Step 1- Befolgen Sie zunächst die Docker-Installationsanweisungen, die unter verfügbar sind https://docs.docker.com/engine/install/ubuntu/. Wir müssen Docker auf unserem Computer installieren.

Step 2- Mit dem folgenden Befehl können Sie das Docker-Image von MXNet abrufen:

$ sudo docker pull mxnet/python

Um zu sehen, ob das Abrufen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:

$ sudo docker images

Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden.

Überprüfen Sie die folgenden Befehle -

$ sudo docker pull mxnet/python:1.3.0_cpu_mkl $ sudo docker images

Aus der Quelle

Führen Sie die folgenden Schritte aus, um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode mit der CPU zu erstellen:

Step 1- Zuerst müssen wir die erforderlichen Pakete installieren. Diese Abhängigkeiten sind ab Ubuntu Version 16.04 erforderlich.

sudo apt-get update

sudo apt-get install -y build-essential git ninja-build ccache libopenblas-dev libopencv-dev cmake

Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zuerst das Repository mit dem folgenden Befehl klonen:

git clone –recursive https://github.com/apache/incubator-mxnet.git mxnet

cd mxnet
cp config/linux.cmake config.cmake

Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen:

rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .

Two important points regarding the above step is as follows−

Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:

cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..

Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen

cmake --build . --parallel N

Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Im Ordner in Ihrem MXNet-Projektstamm finden Sie libmxnet.so, das zum Installieren von Sprachbindungen erforderlich ist (optional).

Mac OS

Wir können MXNet unter MacOS auf folgende Arten installieren:

Grafische Verarbeitungseinheit (GPU)

Wenn Sie MXNet unter MacOS mit GPU erstellen möchten, steht KEINE Pip- und Docker-Methode zur Verfügung. Die einzige Methode in diesem Fall besteht darin, es aus dem Quellcode zu erstellen.

Aus der Quelle

Um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode mit der GPU zu erstellen, müssen Sie zuerst die Umgebung für CUDA und cuDNN einrichten. Sie müssen dem folgenNVIDIA CUDA Installation Guide welches bei erhältlich ist https://docs.nvidia.com und cuDNN Installation Guide, welches bei erhältlich ist https://docs.nvidia.com/deeplearning für Mac OS.

Bitte beachten Sie, dass CUDA 2019 die Unterstützung von macOS eingestellt hat. Zukünftige Versionen von CUDA unterstützen möglicherweise auch nicht macOS.

Führen Sie nach dem Einrichten der Umgebung für CUDA und cuDNN die folgenden Schritte aus, um MXNet von der Quelle unter OS X (Mac) zu installieren.

Step 1- Da wir einige Abhängigkeiten von OS x benötigen, müssen wir zuerst die erforderlichen Pakete installieren.

xcode-select –-install #Install OS X Developer Tools

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" #Install Homebrew

brew install cmake ninja ccache opencv # Install dependencies

Wir können MXNet auch ohne OpenCV erstellen, da opencv eine optionale Abhängigkeit ist.

Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zuerst das Repository mit dem folgenden Befehl klonen

git clone –-recursive https://github.com/apache/incubator-mxnet.git mxnet

cd mxnet
cp config/linux.cmake config.cmake

Bei einer GPU-fähigen Version müssen zuerst die CUDA-Abhängigkeiten installiert werden, da MXNet-Build Ihre GPU-Architektur nicht automatisch erkennen kann, wenn versucht wird, einen GPU-fähigen Build auf einem Computer ohne GPU zu erstellen. In solchen Fällen zielt MXNet auf alle verfügbaren GPU-Architekturen ab.

Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen

rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .

Zwei wichtige Punkte in Bezug auf den obigen Schritt sind wie folgt:

Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:

cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..

Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen:

cmake --build . --parallel N

Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Ordner in Ihrem MXNet project root, du wirst finden libmxnet.dylib, Dies ist erforderlich, um Sprachbindungen zu installieren (optional).

Central Processing Unit (CPU)

Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir CPU für die Verarbeitung verwenden

Mit der Pip-Methode

Mit dem folgenden Befehl können Sie MXNet auf Ihrem Linus-Betriebssystem installieren

pip install mxnet

Mit Docker

Sie finden die Docker-Images mit MXNet bei DockerHub, das unter verfügbar ist https://hub.docker.com/u/mxnet. Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit CPU− zu installieren

Step 1- Folgen Sie zunächst den Anweisungen docker installation instructions welche verfügbar sind bei https://docs.docker.com/docker-for-mac Wir müssen Docker auf unserem Computer installieren.

Step 2- Mit dem folgenden Befehl können Sie das MXNet-Docker-Image abrufen

$ docker pull mxnet/python

Um zu sehen, ob das Ziehen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:

$ docker images

Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden. Überprüfen Sie die folgenden Befehle

$ docker pull mxnet/python:1.3.0_cpu_mkl
$ docker images

Aus der Quelle

Führen Sie die folgenden Schritte aus, um MXNet von der Quelle unter OS X (Mac) zu installieren.

Step 1- Da wir einige Abhängigkeiten von OS x benötigen, müssen wir zuerst die erforderlichen Pakete installieren.

xcode-select –-install #Install OS X Developer Tools
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" #Install Homebrew
brew install cmake ninja ccache opencv # Install dependencies

Wir können MXNet auch ohne OpenCV erstellen, da opencv eine optionale Abhängigkeit ist.

Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zunächst das Repository mit dem folgenden Befehl klonen

git clone –-recursive https://github.com/apache/incubator-mxnet.git mxnet

cd mxnet

cp config/linux.cmake config.cmake

Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen:

rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .

Two important points regarding the above step is as follows−

Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:

cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..

Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen

cmake --build . --parallel N

Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Ordner in Ihrem MXNet project root, du wirst finden libmxnet.dylib, Dies ist erforderlich, um Sprachbindungen zu installieren (optional).

Windows-Betriebssystem

Für die Installation von MXNet unter Windows gelten folgende Voraussetzungen:

Minimale Systemvoraussetzungen

  • Windows 7, 10, Server 2012 R2 oder Server 2016

  • Visual Studio 2015 oder 2017 (beliebiger Typ)

  • Python 2.7 oder 3.6

  • pip

Empfohlene Systemanforderungen

  • Windows 10, Server 2012 R2 oder Server 2016

  • Visual Studio 2017

  • Mindestens eine NVIDIA CUDA-fähige GPU

  • MKL-fähige CPU: Intel® Xeon®-Prozessor, Intel® Core ™ -Prozessorfamilie, Intel Atom®-Prozessor oder Intel® Xeon Phi ™ -Prozessor

  • Python 2.7 oder 3.6

  • pip

Grafische Verarbeitungseinheit (GPU)

Mit der Pip-Methode−

Wenn Sie MXNet unter Windows mit NVIDIA-GPUs erstellen möchten, gibt es zwei Möglichkeiten, MXNet mit CUDA-Unterstützung mit einem Python-Paket zu installieren

Installation mit CUDA-Unterstützung

Im Folgenden sind die Schritte aufgeführt, mit deren Hilfe wir MXNet mit CUDA einrichten können.

Step 1- Installieren Sie zuerst Microsoft Visual Studio 2017 oder Microsoft Visual Studio 2015.

Step 2- Laden Sie als Nächstes NVIDIA CUDA herunter und installieren Sie es. Es wird empfohlen, CUDA-Versionen 9.2 oder 9.0 zu verwenden, da in der Vergangenheit einige Probleme mit CUDA 9.1 festgestellt wurden.

Step 3- Laden Sie jetzt NVIDIA_CUDA_DNN herunter und installieren Sie es.

Step 4- Installieren Sie schließlich mit dem folgenden Befehl pip MXNet mit CUDA−

pip install mxnet-cu92

Installation mit CUDA- und MKL-Unterstützung

Im Folgenden sind die Schritte aufgeführt, mit deren Hilfe wir MXNet mit CUDA und MKL einrichten können.

Step 1- Installieren Sie zuerst Microsoft Visual Studio 2017 oder Microsoft Visual Studio 2015.

Step 2- Laden Sie als Nächstes Intel MKL herunter und installieren Sie es

Step 3- Laden Sie jetzt NVIDIA CUDA herunter und installieren Sie es.

Step 4- Laden Sie jetzt NVIDIA_CUDA_DNN herunter und installieren Sie es.

Step 5- Installieren Sie schließlich mit dem folgenden Befehl pip MXNet mit MKL.

pip install mxnet-cu92mkl

Aus der Quelle

Um die MXNet-Kernbibliothek aus dem Quellcode mit der GPU zu erstellen, haben wir die folgenden zwei Optionen:

Option 1− Build with Microsoft Visual Studio 2017

Um MXNet mithilfe von Microsoft Visual Studio 2017 selbst zu erstellen und zu installieren, benötigen Sie die folgenden Abhängigkeiten.

Install/update Microsoft Visual Studio.

  • Wenn Microsoft Visual Studio noch nicht auf Ihrem Computer installiert ist, laden Sie es zuerst herunter und installieren Sie es.

  • Sie werden aufgefordert, Git zu installieren. Installieren Sie es auch.

  • Wenn Microsoft Visual Studio bereits auf Ihrem Computer installiert ist, Sie es jedoch aktualisieren möchten, fahren Sie mit dem nächsten Schritt fort, um Ihre Installation zu ändern. Hier haben Sie die Möglichkeit, auch Microsoft Visual Studio zu aktualisieren.

Befolgen Sie die Anweisungen zum Öffnen des Visual Studio-Installationsprogramms unter https://docs.microsoft.com/en-us Einzelne Komponenten ändern.

Aktualisieren Sie in der Visual Studio Installer-Anwendung nach Bedarf. Danach suchen und überprüfenVC++ 2017 version 15.4 v14.11 toolset und klicken Sie auf Modify.

Ändern Sie nun mit dem folgenden Befehl die Version von Microsoft VS2017 in v14.11−

"C:\Program Files (x86)\Microsoft Visual Studio\2017\Community\VC\Auxiliary\Build\vcvars64.bat" -vcvars_ver=14.11

Als nächstes müssen Sie herunterladen und installieren CMake verfügbar um https://cmake.org/download/ Es wird empfohlen, zu verwenden CMake v3.12.2 welches bei erhältlich ist https://cmake.org/download/ weil es mit MXNet getestet wird.

Laden Sie jetzt das herunter und führen Sie es aus OpenCV Paket erhältlich bei https://sourceforge.net/projects/opencvlibrary/Dadurch werden mehrere Dateien entpackt. Es liegt an Ihnen, ob Sie sie in einem anderen Verzeichnis ablegen möchten oder nicht. Hier werden wir den Pfad verwendenC:\utils(mkdir C:\utils) als unser Standardpfad.

Als Nächstes müssen wir die Umgebungsvariable OpenCV_DIR so einstellen, dass sie auf das OpenCV-Buildverzeichnis verweist, das wir gerade entpackt haben. Öffnen Sie dazu die Eingabeaufforderung und geben Sie einset OpenCV_DIR=C:\utils\opencv\build.

Ein wichtiger Punkt ist, dass Sie die Intel MKL (Math Kernel Library) installieren können, wenn Sie sie nicht installiert haben.

Ein weiteres Open Source-Paket, das Sie verwenden können, ist OpenBLAS. Hier für die weiteren Anweisungen gehen wir davon aus, dass Sie verwendenOpenBLAS.

Laden Sie also die OpenBlas Paket, das verfügbar ist bei https://sourceforge.net und entpacken Sie die Datei, benennen Sie sie in um OpenBLAS und lege es unter C:\utils.

Als nächstes müssen wir die Umgebungsvariable setzen OpenBLAS_HOME um auf das OpenBLAS-Verzeichnis zu verweisen, das das enthält include und libVerzeichnisse. Öffnen Sie dazu die Eingabeaufforderung und geben Sie einset OpenBLAS_HOME=C:\utils\OpenBLAS.

Laden Sie jetzt CUDA herunter und installieren Sie es unter https://developer.nvidia.com. Beachten Sie, dass Sie CUDA jetzt neu installieren müssen, wenn Sie bereits CUDA hatten und dann Microsoft VS2017 installiert haben, damit Sie die CUDA-Toolkit-Komponenten für die Microsoft VS2017-Integration erhalten können.

Als nächstes müssen Sie cuDNN herunterladen und installieren.

Als nächstes müssen Sie git herunterladen und installieren, das sich bei befindet https://gitforwindows.org/ ebenfalls.

Nachdem Sie alle erforderlichen Abhängigkeiten installiert haben, führen Sie die folgenden Schritte aus, um den MXNet-Quellcode zu erstellen

Step 1- Öffnen Sie die Eingabeaufforderung in Windows.

Step 2- Laden Sie jetzt mit dem folgenden Befehl den MXNet-Quellcode von GitHub herunter:

cd C:\

git clone https://github.com/apache/incubator-mxnet.git --recursive

Step 3- Überprüfen Sie als Nächstes Folgendes -

DCUDNN_INCLUDE and DCUDNN_LIBRARY Umgebungsvariablen zeigen auf die include Ordner und cudnn.lib Datei Ihres CUDA-Installationsorts

C:\incubator-mxnet ist der Speicherort des Quellcodes, den Sie gerade im vorherigen Schritt geklont haben.

Step 4- Erstellen Sie als Nächstes mit dem folgenden Befehl einen Build directory und gehen Sie auch in das Verzeichnis, zum Beispiel -

mkdir C:\incubator-mxnet\build
cd C:\incubator-mxnet\build

Step 5- Kompilieren Sie nun mithilfe von cmake den MXNet-Quellcode wie folgt:

cmake -G "Visual Studio 15 2017 Win64" -T cuda=9.2,host=x64 -DUSE_CUDA=1 -DUSE_CUDNN=1 -DUSE_NVRTC=1 -DUSE_OPENCV=1 -DUSE_OPENMP=1 -DUSE_BLAS=open -DUSE_LAPACK=1 -DUSE_DIST_KVSTORE=0 -DCUDA_ARCH_LIST=Common -DCUDA_TOOLSET=9.2 -DCUDNN_INCLUDE=C:\cuda\include -DCUDNN_LIBRARY=C:\cuda\lib\x64\cudnn.lib "C:\incubator-mxnet"

Step 6- Verwenden Sie nach erfolgreichem Abschluss des CMake den folgenden Befehl, um den MXNet-Quellcode zu kompilieren

msbuild mxnet.sln /p:Configuration=Release;Platform=x64 /maxcpucount

Option 2: Build with Microsoft Visual Studio 2015

Um MXNet mithilfe von Microsoft Visual Studio 2015 selbst zu erstellen und zu installieren, benötigen Sie die folgenden Abhängigkeiten.

Installieren / Aktualisieren von Microsoft Visual Studio 2015. Die Mindestanforderung zum Erstellen von MXnet aus dem Quellcode ist Update 3 von Microsoft Visual Studio 2015. Sie können es verwenden Tools -> Extensions and Updates... | Product Updates Menü, um es zu aktualisieren.

Als nächstes müssen Sie herunterladen und installieren CMake welches bei erhältlich ist https://cmake.org/download/. Es wird empfohlen, zu verwendenCMake v3.12.2 das ist bei https://cmake.org/download/, weil es mit MXNet getestet wird.

Laden Sie jetzt das OpenCV-Paket herunter und führen Sie es aus, das unter verfügbar ist https://excellmedia.dl.sourceforge.netDadurch werden mehrere Dateien entpackt. Es liegt an Ihnen, ob Sie sie in einem anderen Verzeichnis ablegen möchten oder nicht.

Als nächstes müssen wir die Umgebungsvariable setzen OpenCV_DIR auf die zeigen OpenCVBuild-Verzeichnis, das wir gerade entpackt haben. Öffnen Sie dazu die Eingabeaufforderung und geben Sie set einOpenCV_DIR=C:\opencv\build\x64\vc14\bin.

Ein wichtiger Punkt ist, dass Sie die Intel MKL (Math Kernel Library) installieren können, wenn Sie sie nicht installiert haben.

Ein weiteres Open Source-Paket, das Sie verwenden können, ist OpenBLAS. Hier für die weiteren Anweisungen gehen wir davon aus, dass Sie verwendenOpenBLAS.

Laden Sie also die OpenBLAS Paket erhältlich bei https://excellmedia.dl.sourceforge.net und entpacken Sie die Datei, benennen Sie sie in OpenBLAS um und legen Sie sie unter C: \ utils ab.

Als nächstes müssen wir die Umgebungsvariable OpenBLAS_HOME so einstellen, dass sie auf das OpenBLAS-Verzeichnis verweist, das die Verzeichnisse include und lib enthält. Sie finden das Verzeichnis inC:\Program files (x86)\OpenBLAS\

Wenn Sie bereits CUDA hatten und dann Microsoft VS2015 installiert haben, müssen Sie CUDA jetzt neu installieren, damit Sie die CUDA-Toolkit-Komponenten für die Microsoft VS2017-Integration erhalten.

Als nächstes müssen Sie cuDNN herunterladen und installieren.

Jetzt müssen wir die Umgebungsvariable CUDACXX so einstellen, dass sie auf die zeigt CUDA Compiler(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.1\bin\nvcc.exe zum Beispiel).

In ähnlicher Weise müssen wir auch die Umgebungsvariable festlegen CUDNN_ROOT auf die zeigen cuDNN Verzeichnis, das das enthält include, lib und bin Verzeichnisse (C:\Downloads\cudnn-9.1-windows7-x64-v7\cuda zum Beispiel).

Nachdem Sie alle erforderlichen Abhängigkeiten installiert haben, führen Sie die folgenden Schritte aus, um den MXNet-Quellcode zu erstellen

Step 1- Laden Sie zunächst den MXNet-Quellcode von GitHub− herunter

cd C:\
git clone https://github.com/apache/incubator-mxnet.git --recursive

Step 2- Verwenden Sie als Nächstes CMake, um ein Visual Studio in ./build zu erstellen.

Step 3- In Visual Studio müssen wir jetzt die Lösungsdatei öffnen..slnund kompiliere es. Diese Befehle erzeugen eine Bibliothek namensmxnet.dll in dem ./build/Release/ or ./build/Debug Mappe

Step 4- Verwenden Sie nach erfolgreichem Abschluss von CMake den folgenden Befehl, um den MXNet-Quellcode zu kompilieren

msbuild mxnet.sln /p:Configuration=Release;Platform=x64 /maxcpucount

Central Processing Unit (CPU)

Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir CPU für die Verarbeitung verwenden

Mit der Pip-Methode

Wenn Sie MXNet unter Windows mit CPUs erstellen möchten, gibt es zwei Möglichkeiten, MXNet mithilfe eines Python-Pakets zu installieren

Install with CPUs

Verwenden Sie den folgenden Befehl, um MXNet mit CPU mit Python− zu installieren

pip install mxnet

Install with Intel CPUs

Wie oben erläutert, bietet MXNet experimentelle Unterstützung für Intel MKL sowie MKL-DNN. Verwenden Sie den folgenden Befehl, um MXNet mit Intel CPU mit Python− zu installieren

pip install mxnet-mkl

Mit Docker

Sie finden die Docker-Bilder mit MXNet unter DockerHub, verfügbar um https://hub.docker.com/u/mxnet Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit CPU− zu installieren

Step 1- Befolgen Sie zunächst die Docker-Installationsanweisungen, die unter gelesen werden können https://docs.docker.com/docker-for-mac/install. Wir müssen Docker auf unserem Computer installieren.

Step 2- Mit dem folgenden Befehl können Sie das MXNet-Docker-Image abrufen

$ docker pull mxnet/python

Um zu sehen, ob das Ziehen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:

$ docker images

Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden.

Überprüfen Sie die folgenden Befehle

$ docker pull mxnet/python:1.3.0_cpu_mkl $ docker images

Installieren von MXNet in der Cloud und auf Geräten

In diesem Abschnitt wird erläutert, wie Sie Apache MXNet in der Cloud und auf Geräten installieren. Beginnen wir mit der Installation von MXNet in der Cloud.

MXNet in der Cloud installieren

Sie können Apache MXNet auch bei mehreren Cloud-Anbietern mit herunterladen Graphical Processing Unit (GPU)Unterstützung. Zwei andere Arten von Unterstützung, die Sie finden können, sind wie folgt:

  • GPU / CPU-Hybrid-Unterstützung für Anwendungsfälle wie skalierbare Inferenz.
  • Faktorielle GPU-Unterstützung mit AWS Elastic Inference.

Im Folgenden finden Sie Cloud-Anbieter, die GPU-Unterstützung mit verschiedenen virtuellen Maschinen für Apache MXNet− anbieten

Die Alibaba-Konsole

Sie können die erstellen NVIDIA GPU Cloud Virtual Machine (VM) verfügbar um https://docs.nvidia.com/ngc mit der Alibaba-Konsole und verwenden Sie Apache MXNet.

Amazon Web Services

Es bietet auch GPU-Unterstützung und bietet die folgenden Dienste für Apache MXNet−

Amazon SageMaker

Es verwaltet die Schulung und Bereitstellung von Apache MXNet-Modellen.

AWS Deep Learning AMI

Es bietet eine vorinstallierte Conda-Umgebung für Python 2 und Python 3 mit Apache MXNet, CUDA, cuDNN, MKL-DNN und AWS Elastic Inference.

Dynamisches Training auf AWS

Es bietet Schulungen für das experimentelle manuelle EC2-Setup sowie für das halbautomatische CloudFormation-Setup.

Sie können verwenden NVIDIA VM verfügbar um https://aws.amazon.com mit Amazon Web Services.

Google Cloud Platform

Google bietet auch NVIDIA GPU cloud image welches bei erhältlich ist https://console.cloud.google.com mit Apache MXNet arbeiten.

Microsoft Azure

Microsoft Azure Marketplace bietet ebenfalls NVIDIA GPU cloud image verfügbar um https://azuremarketplace.microsoft.com mit Apache MXNet arbeiten.

Oracle Cloud

Oracle bietet auch NVIDIA GPU cloud image verfügbar um https://docs.cloud.oracle.com mit Apache MXNet arbeiten.

Central Processing Unit (CPU)

Apache MXNet funktioniert auf der Nur-CPU-Instanz jedes Cloud-Anbieters. Es gibt verschiedene Methoden zur Installation, wie z

  • Installationsanweisungen für Python Pip.

  • Docker-Anweisungen.

  • Vorinstallierte Option wie Amazon Web Services, die AWS Deep Learning AMI bereitstellt (mit vorinstallierter Conda-Umgebung für Python 2 und Python 3 mit MXNet und MKL-DNN).

MXNet auf Geräten installieren

Lassen Sie uns lernen, wie Sie MXNet auf Geräten installieren.

Himbeer-Pi

Sie können Apache MXNet auch auf Raspberry Pi 3B-Geräten ausführen, da MXNet auch das auf Respbian ARM basierende Betriebssystem unterstützt. Um MXNet reibungslos auf dem Raspberry Pi3 ausführen zu können, wird empfohlen, ein Gerät mit mehr als 1 GB RAM und eine SD-Karte mit mindestens 4 GB freiem Speicherplatz zu verwenden.

Im Folgenden finden Sie die Möglichkeiten, mit denen Sie MXNet für den Raspberry Pi erstellen und die Python-Bindungen auch für die Bibliothek installieren können

Schnelle Installation

Das vorgefertigte Python-Rad kann für eine schnelle Installation auf einem Raspberry Pi 3B mit Stretch verwendet werden. Eines der wichtigen Probleme bei dieser Methode ist, dass wir mehrere Abhängigkeiten installieren müssen, damit Apache MXNet funktioniert.

Docker-Installation

Sie können den Docker-Installationsanweisungen folgen, die unter verfügbar sind https://docs.docker.com/engine/install/ubuntu/um Docker auf Ihrem Computer zu installieren. Zu diesem Zweck können wir auch die Community Edition (CE) installieren und verwenden.

Native Build (aus der Quelle)

Um MXNet von der Quelle aus zu installieren, müssen Sie die folgenden zwei Schritte ausführen:

Schritt 1

Build the shared library from the Apache MXNet C++ source code

Um die gemeinsam genutzte Bibliothek auf Raspberry-Version Wheezy und höher aufzubauen, benötigen wir die folgenden Abhängigkeiten:

  • Git- Es ist erforderlich, Code von GitHub abzurufen.

  • Libblas- Es ist für lineare algebraische Operationen erforderlich.

  • Libopencv- Es ist für Operationen im Zusammenhang mit Computer Vision erforderlich. Es ist jedoch optional, wenn Sie RAM und Speicherplatz sparen möchten.

  • C++ Compiler- Es ist erforderlich, MXNet-Quellcode zu kompilieren und zu erstellen. Im Folgenden sind die unterstützten Compiler aufgeführt, die C ++ 11− unterstützen

    • G ++ (Version 4.8 oder höher)

    • Clang(3.9-6)

Verwenden Sie die folgenden Befehle, um die oben genannten Abhängigkeiten zu installieren

sudo apt-get update
sudo apt-get -y install git cmake ninja-build build-essential g++-4.9 c++-4.9 liblapack*
libblas* libopencv*
libopenblas* python3-dev python-dev virtualenv

Als nächstes müssen wir das MXNet-Quellcode-Repository klonen. Verwenden Sie dazu den folgenden Befehl git in Ihrem Home-Verzeichnis

git clone https://github.com/apache/incubator-mxnet.git --recursive

cd incubator-mxnet

Erstellen Sie nun mithilfe der folgenden Befehle die gemeinsam genutzte Bibliothek:

mkdir -p build && cd build
cmake \
-DUSE_SSE=OFF \
-DUSE_CUDA=OFF \
-DUSE_OPENCV=ON \
-DUSE_OPENMP=ON \
-DUSE_MKL_IF_AVAILABLE=OFF \
-DUSE_SIGNAL_HANDLER=ON \

-DCMAKE_BUILD_TYPE=Release \
-GNinja ..
ninja -j$(nproc)

Sobald Sie die obigen Befehle ausgeführt haben, wird der Erstellungsprozess gestartet, dessen Abschluss einige Stunden dauern wird. Sie erhalten eine Datei mit dem Namenlibmxnet.so im Erstellungsverzeichnis.

Schritt 2

Install the supported language-specific packages for Apache MXNet

In diesem Schritt installieren wir MXNet Pythin-Bindungen. Dazu müssen wir den folgenden Befehl im MXNet-Verzeichnis ausführen

cd python
pip install --upgrade pip
pip install -e .

Alternativ können Sie mit dem folgenden Befehl auch eine erstellen whl package installierbar mit pip- -

ci/docker/runtime_functions.sh build_wheel python/ $(realpath build)

NVIDIA Jetson-Geräte

Sie können Apache MXNet auch auf NVIDIA Jetson-Geräten ausführen, z TX2 oder Nanoals MXNet unterstützt auch das Ubuntu Arch64-basierte Betriebssystem. Damit MXNet reibungslos auf den NVIDIA Jetson-Geräten ausgeführt werden kann, muss CUDA auf Ihrem Jetson-Gerät installiert sein.

Im Folgenden finden Sie die Möglichkeiten, mit denen Sie MXNet für NVIDIA Jetson-Geräte erstellen können:

  • Mit einem Jetson MXNet Pip Wheel für die Python-Entwicklung

  • Aus der Quelle

Bevor Sie MXNet jedoch auf eine der oben genannten Arten erstellen, müssen Sie die folgenden Abhängigkeiten von Ihren Jetson-Geräten installieren

Python-Abhängigkeiten

Um die Python-API verwenden zu können, benötigen wir die folgenden Abhängigkeiten

sudo apt update
sudo apt -y install \
   build-essential \
   git \
   graphviz \
   libatlas-base-dev \
   libopencv-dev \
   python-pip
sudo pip install --upgrade \
   pip \
   setuptools
sudo pip install \
   graphviz==0.8.4 \
   jupyter \
   numpy==1.15.2

Klonen Sie das MXNet-Quellcode-Repository

Klonen Sie das MXNet-Quellcode-Repository mit dem folgenden Befehl git in Ihrem Home-Verzeichnis

git clone --recursive https://github.com/apache/incubator-mxnet.git mxnet

Umgebungsvariablen einrichten

Fügen Sie Folgendes in Ihr .profile Datei in Ihrem Home-Verzeichnis−

export PATH=/usr/local/cuda/bin:$PATH export MXNET_HOME=$HOME/mxnet/
export PYTHONPATH=$MXNET_HOME/python:$PYTHONPATH

Wenden Sie die Änderung jetzt sofort mit dem folgenden Befehl an

source .profile

Konfigurieren Sie CUDA

Bevor Sie CUDA mit nvcc konfigurieren, müssen Sie überprüfen, welche Version von CUDA ausgeführt wird

nvcc --version

Angenommen, wenn mehr als eine CUDA-Version auf Ihrem Gerät oder Computer installiert ist und Sie die CUDA-Versionen wechseln möchten, verwenden Sie Folgendes und ersetzen Sie den symbolischen Link zu der gewünschten Version

sudo rm /usr/local/cuda
sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda

Der obige Befehl wechselt zu CUDA 10.0, das auf dem NVIDIA Jetson-Gerät vorinstalliert ist Nano.

Nachdem Sie die oben genannten Voraussetzungen erfüllt haben, können Sie MXNet jetzt auf NVIDIA Jetson-Geräten installieren. Lassen Sie uns die Möglichkeiten verstehen, mit denen Sie MXNet− installieren können

By using a Jetson MXNet pip wheel for Python development- Wenn Sie ein vorbereitetes Python-Rad verwenden möchten, laden Sie Folgendes auf Ihren Jetson herunter und führen Sie es aus

  • MXNet 1.4.0 (für Python 3) erhältlich bei https://docs.docker.com

  • MXNet 1.4.0 (für Python 2) erhältlich bei https://docs.docker.com

Native Build (aus der Quelle)

Um MXNet von der Quelle aus zu installieren, müssen Sie die folgenden zwei Schritte ausführen:

Schritt 1

Build the shared library from the Apache MXNet C++ source code

Um die gemeinsam genutzte Bibliothek aus dem Apache MXNet C ++ - Quellcode zu erstellen, können Sie entweder die Docker-Methode verwenden oder dies manuell tun

Docker-Methode

Bei dieser Methode müssen Sie zuerst Docker installieren und es ohne sudo ausführen können (was auch in den vorherigen Schritten erläutert wurde). Führen Sie anschließend die folgenden Schritte aus, um die Cross-Kompilierung über Docker− auszuführen

$MXNET_HOME/ci/build.py -p jetson

Handbuch

Bei dieser Methode müssen Sie die bearbeiten Makefile (mit dem folgenden Befehl) So installieren Sie das MXNet mit CUDA-Bindungen, um die Grafikprozessoren (GPU) auf NVIDIA Jetson-Geräten zu nutzen:

cp $MXNET_HOME/make/crosscompile.jetson.mk config.mk

Nach dem Bearbeiten des Makefiles müssen Sie die Datei config.mk bearbeiten, um einige zusätzliche Änderungen für das NVIDIA Jetson-Gerät vorzunehmen.

Aktualisieren Sie dazu die folgenden Einstellungen

  • Aktualisieren Sie den CUDA-Pfad: USE_CUDA_PATH = / usr / local / cuda

  • Fügen Sie der Einstellung CUDA_ARCH -gencode arch = compute-63, code = sm_62 hinzu.

  • Aktualisieren Sie die NVCC-Einstellungen: NVCCFLAGS: = -m64

  • Aktivieren Sie OpenCV: USE_OPENCV = 1

Um sicherzustellen, dass das MXNet mit Pascals Hardwarebeschleunigung mit geringer Genauigkeit erstellt wird, müssen wir das Mshadow-Makefile wie folgt bearbeiten:

MSHADOW_CFLAGS += -DMSHADOW_USE_PASCAL=1

Schließlich können Sie mit Hilfe des folgenden Befehls die vollständige Apache MXNet-Bibliothek erstellen

cd $MXNET_HOME make -j $(nproc)

Sobald Sie die obigen Befehle ausgeführt haben, wird der Erstellungsprozess gestartet, dessen Abschluss einige Stunden dauern wird. Sie erhalten eine Datei mit dem Namenlibmxnet.so in dem mxnet/lib directory.

Schritt 2

Install the Apache MXNet Python Bindings

In diesem Schritt installieren wir MXNet Python-Bindungen. Dazu müssen wir den folgenden Befehl im MXNet-Verzeichnis ausführen

cd $MXNET_HOME/python
sudo pip install -e .

Nachdem Sie die obigen Schritte ausgeführt haben, können Sie MXNet jetzt auf Ihren NVIDIA Jetson-Geräten TX2 oder Nano ausführen. Dies kann mit dem folgenden Befehl überprüft werden

import mxnet
mxnet.__version__

Die Versionsnummer wird zurückgegeben, wenn alles ordnungsgemäß funktioniert.

Um die Forschung und Entwicklung von Deep Learning-Anwendungen in vielen Bereichen zu unterstützen, bietet Apache MXNet ein reichhaltiges Ökosystem an Toolkits, Bibliotheken und vielem mehr. Lassen Sie uns sie erkunden -

ToolKits

Im Folgenden finden Sie einige der am häufigsten verwendeten und wichtigsten Toolkits von MXNet:

GluonCV

Wie der Name schon sagt, ist GluonCV ein Gluon-Toolkit für Computer Vision, das von MXNet unterstützt wird. Es bietet die Implementierung modernster DL-Algorithmen (Deep Learning) in Computer Vision (CV). Mit Hilfe des GluonCV-Toolkits können Ingenieure, Forscher und Studenten neue Ideen validieren und den Lebenslauf einfach lernen.

Im Folgenden sind einige der features of GluonCV - -

  • Es trainiert Skripte für die Reproduktion der neuesten Ergebnisse, die in neuesten Forschungsergebnissen veröffentlicht wurden.

  • Mehr als 170 hochwertige, vorgefertigte Modelle.

  • Umfassen Sie flexibles Entwicklungsmuster.

  • GluonCV ist einfach zu optimieren. Wir können es bereitstellen, ohne das schwere DL-Framework beizubehalten.

  • Es bietet sorgfältig gestaltete APIs, die die Komplexität der Implementierung erheblich verringern.

  • Gemeinschaftliche Unterstützung.

  • Einfach zu verstehende Implementierungen.

Es folgen die supported applications von GluonCV Toolkit:

  • Bildklassifizierung

  • Objekterkennung

  • Semantische Segmentierung

  • Instanzsegmentierung

  • Posenschätzung

  • Video-Aktionserkennung

Wir können GluonCV mithilfe von pip wie folgt installieren:

pip install --upgrade mxnet gluoncv

GluonNLP

Wie der Name schon sagt, ist GluonNLP ein Gluon-Toolkit für die Verarbeitung natürlicher Sprache (NLP), das von MXNet unterstützt wird. Es bietet die Implementierung modernster DL-Modelle (Deep Learning) in NLP.

Mithilfe des GluonNLP-Toolkits können Ingenieure, Forscher und Studenten Blöcke für Textdaten-Pipelines und -Modelle erstellen. Basierend auf diesen Modellen können sie schnell Prototypen der Forschungsideen und des Produkts erstellen.

Im Folgenden sind einige der Funktionen von GluonNLP aufgeführt:

  • Es trainiert Skripte für die Reproduktion der neuesten Ergebnisse, die in neuesten Forschungsergebnissen veröffentlicht wurden.

  • Satz vorab trainierter Modelle für allgemeine NLP-Aufgaben.

  • Es bietet sorgfältig gestaltete APIs, die die Komplexität der Implementierung erheblich verringern.

  • Gemeinschaftliche Unterstützung.

  • Es enthält auch Tutorials, die Ihnen den Einstieg in neue NLP-Aufgaben erleichtern.

Im Folgenden sind die NLP-Aufgaben aufgeführt, die wir mit dem GluonNLP-Toolkit implementieren können:

  • Worteinbettung

  • Sprachmodell

  • Maschinenübersetzung

  • Textklassifizierung

  • Stimmungsanalyse

  • Inferenz natürlicher Sprache

  • Texterzeugung

  • Abhängigkeitsanalyse

  • Named Entity Recognition

  • Absichtsklassifizierung und Slot-Kennzeichnung

Wir können GluonNLP mithilfe von pip wie folgt installieren:

pip install --upgrade mxnet gluonnlp

Gluonen

Wie der Name schon sagt, ist GluonTS ein Gluon-Toolkit für die probabilistische Zeitreihenmodellierung, das von MXNet unterstützt wird.

Es bietet die folgenden Funktionen:

  • Deep-Learning-Modelle nach dem neuesten Stand der Technik (SOTA), die für das Training bereit sind.

  • Die Dienstprogramme zum Laden und Durchlaufen von Zeitreihendatensätzen.

  • Bausteine ​​zur Definition Ihres eigenen Modells.

Mithilfe des GluonTS-Toolkits können Ingenieure, Forscher und Studenten jedes der integrierten Modelle anhand ihrer eigenen Daten trainieren und bewerten, schnell mit verschiedenen Lösungen experimentieren und eine Lösung für ihre Zeitreihenaufgaben finden.

Sie können die bereitgestellten Abstraktionen und Bausteine ​​auch verwenden, um benutzerdefinierte Zeitreihenmodelle zu erstellen und diese schnell mit Basisalgorithmen zu vergleichen.

Wir können GluonTS mithilfe von pip wie folgt installieren:

pip install gluonts

GluonFR

Wie der Name schon sagt, handelt es sich um ein Apache MXNet Gluon-Toolkit für FR (Gesichtserkennung). Es bietet die folgenden Funktionen:

  • Deep-Learning-Modelle nach dem neuesten Stand der Technik (SOTA) zur Gesichtserkennung.

  • Die Implementierung von SoftmaxCrossEntropyLoss, ArcLoss, TripletLoss, RingLoss, CosLoss / AMsoftmax, L2-Softmax, A-Softmax, CenterLoss, ContrastiveLoss und LGM Loss usw.

Um Gluon Face zu installieren, benötigen wir Python 3.5 oder höher. Wir müssen auch zuerst GluonCV und MXNet wie folgt installieren:

pip install gluoncv --pre
pip install mxnet-mkl --pre --upgrade
pip install mxnet-cuXXmkl --pre –upgrade # if cuda XX is installed

Nachdem Sie die Abhängigkeiten installiert haben, können Sie GluonFR mit dem folgenden Befehl installieren:

From Source

pip install git+https://github.com/THUFutureLab/gluon-face.git@master

Pip

pip install gluonfr

Ökosystem

Lassen Sie uns nun die umfangreichen Bibliotheken, Pakete und Frameworks von MXNet erkunden.

Trainer RL

Coach, ein RL-Framework (Python Reinforcement Learning), das vom Intel AI Lab erstellt wurde. Es ermöglicht ein einfaches Experimentieren mit hochmodernen RL-Algorithmen. Coach RL unterstützt Apache MXNet als Backend und ermöglicht die einfache Integration neuer Umgebungen.

Um vorhandene Komponenten problemlos zu erweitern und wiederzuverwenden, hat Coach RL die grundlegenden Komponenten des Verstärkungslernens wie Algorithmen, Umgebungen, NN-Architekturen und Explorationsrichtlinien sehr gut entkoppelt.

Im Folgenden sind die Agenten und unterstützten Algorithmen für das Coach RL-Framework aufgeführt:

Value Optimization Agents

  • Deep Q Network (DQN)

  • Double Deep Q Network (DDQN)

  • Duell Q Network

  • Gemischtes Monte Carlo (MMC)

  • Persistent Advantage Learning (PAL)

  • Kategoriales Deep Q-Netzwerk (C51)

  • Quantiles Regressions-Deep-Q-Netzwerk (QR-DQN)

  • N-Schritt Q Lernen

  • Neuronale episodische Kontrolle (NEC)

  • Normalisierte Vorteilsfunktionen (NAF)

  • Rainbow

Agenten zur Richtlinienoptimierung

  • Policy Gradients (PG)

  • Asynchronous Advantage Actor-Critic (A3C)

  • Deep Deterministic Policy Gradients (DDPG)

  • Proximale Richtlinienoptimierung (PPO)

  • Clipped Proximal Policy Optimization (CPPO)

  • Generalized Advantage Estimation (GAE)

  • Beispiel für einen effizienten Schauspieler-Kritiker mit Erfahrungswiederholung (ACER)

  • Soft Actor-Critic (SAC)

  • Twin Delayed Deep Deterministic Policy Gradient (TD3)

Generalvertreter

  • Direkte Zukunftsprognose (DFP)

Imitation Learning Agents

  • Behavioral Cloning (BC)

  • Bedingtes Nachahmungslernen

Hierarchical Reinforcement Learning Agents

  • Hierarchical Actor Critic (HAC)

Deep Graph Library

Die Deep Graph Library (DGL), die von den NYU- und AWS-Teams in Shanghai entwickelt wurde, ist ein Python-Paket, das eine einfache Implementierung von Graph Neural Networks (GNNs) über MXNet bietet. Es bietet auch eine einfache Implementierung von GNNs zusätzlich zu anderen vorhandenen großen Deep-Learning-Bibliotheken wie PyTorch, Gluon usw.

Deep Graph Library ist eine kostenlose Software. Es ist auf allen Linux-Distributionen später als Ubuntu 16.04, macOS X und Windows 7 oder höher verfügbar. Es erfordert auch die Python 3.5-Version oder höher.

Im Folgenden sind die Funktionen von DGL aufgeführt:

No Migration cost - Für die Verwendung von DGL fallen keine Migrationskosten an, da es auf den gängigen DL-Frameworks basiert.

Message Passing- DGL bietet die Weitergabe von Nachrichten und hat eine vielseitige Kontrolle darüber. Die Nachrichtenübermittlung reicht von Operationen auf niedriger Ebene wie dem Senden entlang ausgewählter Kanten bis hin zur Steuerung auf hoher Ebene wie grafikweiten Funktionsaktualisierungen.

Smooth Learning Curve - DGL ist recht einfach zu erlernen und zu verwenden, da die leistungsstarken benutzerdefinierten Funktionen sowohl flexibel als auch benutzerfreundlich sind.

Transparent Speed Optimization - DGL bietet eine transparente Geschwindigkeitsoptimierung durch automatische Stapelverarbeitung von Berechnungen und Multiplikation mit geringer Matrix.

High performance - Um maximale Effizienz zu erzielen, stapelt DGL das DNN-Training (Deep Neural Networks) automatisch in einem oder mehreren Diagrammen.

Easy & friendly interface - DGL bietet uns einfache und benutzerfreundliche Schnittstellen für den Zugriff auf Kantenfunktionen sowie für die Manipulation der Diagrammstruktur.

InsightFace

InsightFace, ein Deep Learning Toolkit für die Gesichtsanalyse, das die Implementierung des SOTA-Gesichtsanalysealgorithmus (Stand der Technik) in Computer Vision mit MXNet ermöglicht. Es bietet -

  • Hochwertiger großer Satz vorgefertigter Modelle.

  • Schulungsskripte nach dem neuesten Stand der Technik (SOTA).

  • InsightFace ist einfach zu optimieren. Wir können es bereitstellen, ohne das schwere DL-Framework beizubehalten.

  • Es bietet sorgfältig gestaltete APIs, die die Komplexität der Implementierung erheblich verringern.

  • Bausteine ​​zur Definition Ihres eigenen Modells.

Wir können InsightFace mithilfe von pip wie folgt installieren:

pip install --upgrade insightface

Bitte beachten Sie, dass Sie vor der Installation von InsightFace das richtige MXNet-Paket entsprechend Ihrer Systemkonfiguration installieren müssen.

Keras-MXNet

Da wir wissen, dass Keras eine in Python geschriebene NN-API (High-Level Neural Network) ist, bietet Keras-MXNet eine Backend-Unterstützung für Keras. Es kann auf einem leistungsstarken und skalierbaren Apache MXNet DL-Framework ausgeführt werden.

Die Funktionen von Keras-MXNet werden unten aufgeführt -

  • Ermöglicht Benutzern ein einfaches, reibungsloses und schnelles Prototyping. Dies alles geschieht durch Benutzerfreundlichkeit, Modularität und Erweiterbarkeit.

  • Unterstützt sowohl CNN (Convolutional Neural Networks) als auch RNN (Recurrent Neural Networks) sowie die Kombination von beiden.

  • Läuft einwandfrei auf der Central Processing Unit (CPU) und der Graphical Processing Unit (GPU).

  • Kann auf einer oder mehreren GPUs ausgeführt werden.

Um mit diesem Backend arbeiten zu können, müssen Sie zuerst keras-mxnet wie folgt installieren:

pip install keras-mxnet

Wenn Sie jetzt GPUs verwenden, installieren Sie MXNet mit CUDA 9-Unterstützung wie folgt:

pip install mxnet-cu90

Wenn Sie jedoch nur die CPU verwenden, installieren Sie das grundlegende MXNet wie folgt:

pip install mxnet

MXBoard

MXBoard ist ein in Python geschriebenes Protokollierungswerkzeug, mit dem MXNet-Datenrahmen aufgezeichnet und in TensorBoard angezeigt werden. Mit anderen Worten, das MXBoard soll der Tensorboard-Pytorch-API folgen. Es unterstützt die meisten Datentypen in TensorBoard.

Einige von ihnen sind unten erwähnt -

  • Graph

  • Scalar

  • Histogram

  • Embedding

  • Image

  • Text

  • Audio

  • Präzisionsrückrufkurve

MXFusion

MXFusion ist eine modulare probabilistische Programmierbibliothek mit tiefem Lernen. Mit MXFusion können wir die Modularität, die ein Schlüsselmerkmal von Deep-Learning-Bibliotheken ist, für die probabilistische Programmierung voll ausnutzen. Es ist einfach zu bedienen und bietet den Benutzern eine bequeme Oberfläche zum Entwerfen probabilistischer Modelle und zum Anwenden auf die realen Probleme.

MXFusion wird unter Python Version 3.4 und höher unter MacOS und Linux OS überprüft. Um MXFusion zu installieren, müssen zuerst die folgenden Abhängigkeiten installiert werden:

  • MXNet> = 1,3

  • Networkx> = 2.1

Mit Hilfe des folgenden Befehls pip können Sie MXFusion installieren -

pip install mxfusion

TVM

Apache TVM, ein Open-Source-End-to-End-Deep-Learning-Compiler-Stack für Hardware-Backends wie CPUs, GPUs und spezialisierte Beschleuniger, soll die Lücke zwischen produktivitätsorientierten Deep-Learning-Frameworks und leistungsorientierten Hardware-Backends schließen . Mit der neuesten Version MXNet 1.6.0 können Benutzer Apache (Inkubation) TVM nutzen, um leistungsstarke Operator-Kernel in der Programmiersprache Python zu implementieren.

Apache TVM startete tatsächlich als Forschungsprojekt an der SAMPL-Gruppe der Paul G. Allen School für Informatik und Ingenieurwesen der Universität von Washington. Jetzt wird es bei der Apache Software Foundation (ASF) inkubiert, die von einem OSC ( Open Source Community), an der mehrere Industrie- und akademische Einrichtungen nach Apache-Art beteiligt sind.

Im Folgenden sind die Hauptfunktionen von Apache (Inkubation) TVM aufgeführt:

  • Vereinfacht den früheren C ++ - basierten Entwicklungsprozess.

  • Ermöglicht die gemeinsame Nutzung derselben Implementierung für mehrere Hardware-Backends wie CPUs, GPUs usw.

  • TVM bietet die Kompilierung von DL-Modellen in verschiedenen Frameworks wie Kears, MXNet, PyTorch, Tensorflow, CoreML und DarkNet zu minimal bereitstellbaren Modulen auf verschiedenen Hardware-Backends.

  • Es bietet uns auch die Infrastruktur, um automatisch Tensoroperatoren mit besserer Leistung zu generieren und zu optimieren.

XFer

Xfer, ein Transfer-Lernframework, ist in Python geschrieben. Grundsätzlich wird ein MXNet-Modell verwendet und ein Metamodell trainiert oder das Modell auch für einen neuen Zieldatensatz geändert.

Mit einfachen Worten, Xfer ist eine Python-Bibliothek, mit der Benutzer schnell und einfach Wissen übertragen können, das in DNN (Deep Neural Networks) gespeichert ist.

Xfer kann verwendet werden -

  • Zur Klassifizierung von Daten beliebigen numerischen Formats.

  • Zu den häufigsten Fällen von Bildern oder Textdaten.

  • Als Pipeline, die Spam vom Extrahieren von Features bis zum Trainieren eines Repurposers (eines Objekts, das eine Klassifizierung in der Zielaufgabe durchführt).

Im Folgenden sind die Funktionen von Xfer aufgeführt:

  • Ressourceneffizienz

  • Dateneffizienz

  • Einfacher Zugang zu neuronalen Netzen

  • Unsicherheitsmodellierung

  • Rapid-Prototyping

  • Dienstprogramme zum Extrahieren von Features aus NN

Dieses Kapitel hilft Ihnen beim Verständnis der MXNet-Systemarchitektur. Beginnen wir mit den MXNet-Modulen.

MXNet-Module

Das folgende Diagramm zeigt die MXNet-Systemarchitektur und zeigt die wichtigsten Module und Komponenten von MXNet modules and their interaction.

Im obigen Diagramm -

  • Die Module in blauen Farbfeldern sind User Facing Modules.

  • Die Module in grünen Farbfeldern sind System Modules.

  • Ein durchgehender Pfeil steht für eine hohe Abhängigkeit, dh er hängt stark von der Schnittstelle ab.

  • Der gepunktete Pfeil steht für die Lichtabhängigkeit, dh die verwendete Datenstruktur zur Vereinfachung und Konsistenz der Benutzeroberfläche. In der Tat kann es durch die Alternativen ersetzt werden.

Lassen Sie uns mehr über Benutzer- und Systemmodule diskutieren.

Benutzerbezogene Module

Die benutzerbezogenen Module sind wie folgt:

  • NDArray- Es bietet flexible Imperativprogramme für Apache MXNet. Sie sind dynamische und asynchrone n-dimensionale Arrays.

  • KVStore- Es fungiert als Schnittstelle für eine effiziente Parametersynchronisation. In KVStore steht KV für Key-Value. Es handelt sich also um eine Schnittstelle zum Speichern von Schlüsselwerten.

  • Data Loading (IO) - Dieses benutzerbezogene Modul wird zum effizienten Laden und Erweitern verteilter Daten verwendet.

  • Symbol Execution- Es ist ein statischer symbolischer Graph Executor. Es bietet eine effiziente Ausführung und Optimierung symbolischer Diagramme.

  • Symbol Construction - Dieses benutzerbezogene Modul bietet dem Benutzer die Möglichkeit, ein Berechnungsdiagramm, dh eine Netzkonfiguration, zu erstellen.

Systemmodule

Die Systemmodule sind wie folgt:

  • Storage Allocator - Dieses Systemmodul weist, wie der Name schon sagt, Speicherblöcke auf dem Host, dh der CPU und verschiedenen Geräten, dh GPUs, effizient zu und recycelt sie effizient.

  • Runtime Dependency Engine - Runtime Dependency Engine-Modul plant und führt die Operationen gemäß ihrer Lese- / Schreibabhängigkeit aus.

  • Resource Manager - Das Resource Manager (RM) -Systemmodul verwaltet globale Ressourcen wie den Zufallszahlengenerator und den zeitlichen Raum.

  • Operator - Das Betriebssystemmodul besteht aus allen Operatoren, die die statische Vorwärts- und Gradientenberechnung, dh die Rückausbreitung, definieren.

Hier werden die Systemkomponenten in Apache MXNet ausführlich erläutert. Zunächst werden wir uns mit der Ausführungs-Engine in MXNet befassen.

Ausführungs-Engine

Die Ausführungs-Engine von Apache MXNet ist sehr vielseitig. Wir können es für tiefes Lernen sowie für jedes domänenspezifische Problem verwenden: Führen Sie eine Reihe von Funktionen aus, die ihren Abhängigkeiten folgen. Es ist so konzipiert, dass die Funktionen mit Abhängigkeiten serialisiert werden, während die Funktionen ohne Abhängigkeiten parallel ausgeführt werden können.

Kernschnittstelle

Die unten angegebene API ist die Kernschnittstelle für die Ausführungs-Engine von Apache MXNet.

virtual void PushSync(Fn exec_fun, Context exec_ctx,
std::vector<VarHandle> const& const_vars,
std::vector<VarHandle> const& mutate_vars) = 0;

Die obige API hat Folgendes:

  • exec_fun - Mit der Kernschnittstellen-API von MXNet können wir die Funktion exec_fun zusammen mit ihren Kontextinformationen und Abhängigkeiten an die Ausführungs-Engine senden.

  • exec_ctx - Die Kontextinformationen, in denen die oben genannte Funktion exec_fun ausgeführt werden soll.

  • const_vars - Dies sind die Variablen, aus denen die Funktion liest.

  • mutate_vars - Dies sind die Variablen, die geändert werden sollen.

Die Ausführungs-Engine bietet dem Benutzer die Garantie, dass die Ausführung von zwei beliebigen Funktionen, die eine gemeinsame Variable ändern, in ihrer Push-Reihenfolge serialisiert wird.

Funktion

Es folgt der Funktionstyp der Ausführungsengine von Apache MXNet -

using Fn = std::function<void(RunContext)>;

In der obigen Funktion RunContextenthält die Laufzeitinformationen. Die Laufzeitinformationen sollten von der Ausführungsengine bestimmt werden. Die Syntax vonRunContext ist wie folgt -

struct RunContext {
   // stream pointer which could be safely cast to
   // cudaStream_t* type
   void *stream;
};

Im Folgenden finden Sie einige wichtige Punkte zu den Funktionen der Ausführungs-Engine:

  • Alle Funktionen werden von den internen Threads der MXNet-Ausführungs-Engine ausgeführt.

  • Es ist nicht gut, das Blockieren der Funktion auf die Ausführungs-Engine zu übertragen, da damit die Funktion den Ausführungsthread belegt und auch den Gesamtdurchsatz verringert.

Hierfür bietet MXNet eine weitere asynchrone Funktion wie folgt:

using Callback = std::function<void()>;
using AsyncFn = std::function<void(RunContext, Callback)>;
  • In diesem AsyncFn Funktion können wir den schweren Teil unserer Threads übergeben, aber die Ausführungs-Engine betrachtet die Funktion erst dann als beendet, wenn wir die aufrufen callback Funktion.

Kontext

Im Contextkönnen wir den Kontext der Funktion angeben, in der ausgeführt werden soll. Dies beinhaltet normalerweise Folgendes:

  • Ob die Funktion auf einer CPU oder einer GPU ausgeführt werden soll.

  • Wenn wir im Kontext eine GPU angeben, welche GPU dann verwendet werden soll.

  • Es gibt einen großen Unterschied zwischen Context und RunContext. Der Kontext hat den Gerätetyp und die Geräte-ID, während RunContext die Informationen enthält, die nur zur Laufzeit festgelegt werden können.

VarHandle

VarHandle, mit dem die Abhängigkeiten von Funktionen angegeben werden, ähnelt einem Token (insbesondere von der Ausführungs-Engine bereitgestellt), mit dem wir die externen Ressourcen darstellen können, die die Funktion ändern oder verwenden kann.

Es stellt sich jedoch die Frage, warum wir VarHandle verwenden müssen. Dies liegt daran, dass die Apache MXNet-Engine so konzipiert ist, dass sie von anderen MXNet-Modulen entkoppelt ist.

Im Folgenden sind einige wichtige Punkte zu VarHandle aufgeführt:

  • Das Erstellen, Löschen oder Kopieren einer Variablen ist leicht und verursacht nur geringe Betriebskosten.

  • Wir müssen die unveränderlichen Variablen angeben, dh die Variablen, die in der verwendet werden const_vars.

  • Wir müssen die veränderlichen Variablen angeben, dh die Variablen, die in der geändert werden mutate_vars.

  • Die Regel, die von der Ausführungs-Engine zum Auflösen der Abhängigkeiten zwischen Funktionen verwendet wird, lautet, dass die Ausführung von zwei beliebigen Funktionen, wenn eine von ihnen mindestens eine gemeinsame Variable ändert, in ihrer Push-Reihenfolge serialisiert wird.

  • Zum Erstellen einer neuen Variablen können wir die verwenden NewVar() API.

  • Zum Löschen einer Variablen können wir die verwenden PushDelete API.

Lassen Sie uns anhand eines einfachen Beispiels verstehen, wie es funktioniert -

Angenommen, wir haben zwei Funktionen, nämlich F1 und F2, und beide mutieren die Variable V2. In diesem Fall wird garantiert, dass F2 nach F1 ausgeführt wird, wenn F2 nach F1 gedrückt wird. Wenn andererseits F1 und F2 beide V2 verwenden, kann ihre tatsächliche Ausführungsreihenfolge zufällig sein.

Drücken und warten

Push und wait sind zwei weitere nützliche API der Ausführungs-Engine.

Es folgen zwei wichtige Merkmale von Push API:

  • Alle Push-APIs sind asynchron, was bedeutet, dass der API-Aufruf sofort zurückgegeben wird, unabhängig davon, ob die Push-Funktion beendet ist oder nicht.

  • Die Push-API ist nicht threadsicher, was bedeutet, dass jeweils nur ein Thread Engine-API-Aufrufe ausführen sollte.

Wenn wir nun über die Warte-API sprechen, stellen folgende Punkte sie dar:

  • Wenn ein Benutzer warten möchte, bis eine bestimmte Funktion abgeschlossen ist, sollte er eine Rückruffunktion in den Abschluss aufnehmen. Rufen Sie die Funktion am Ende der Funktion auf.

  • Wenn ein Benutzer andererseits warten möchte, bis alle Funktionen, an denen eine bestimmte Variable beteiligt ist, abgeschlossen sind, sollte er sie verwenden WaitForVar(var) API.

  • Wenn jemand warten möchte, bis alle Push-Funktionen abgeschlossen sind, verwenden Sie die WaitForAll () API.

  • Wird verwendet, um die Abhängigkeiten von Funktionen anzugeben, ist wie ein Token.

Betreiber

Der Operator in Apache MXNet ist eine Klasse, die die tatsächliche Berechnungslogik sowie Zusatzinformationen enthält und das System bei der Durchführung der Optimierung unterstützt.

Bedienoberfläche

Forward ist die zentrale Bedienoberfläche, deren Syntax wie folgt lautet:

virtual void Forward(const OpContext &ctx,
const std::vector<TBlob> &in_data,
const std::vector<OpReqType> &req,
const std::vector<TBlob> &out_data,
const std::vector<TBlob> &aux_states) = 0;

Die Struktur von OpContext, definiert in Forward() ist wie folgt:

struct OpContext {
   int is_train;
   RunContext run_ctx;
   std::vector<Resource> requested;
}

Das OpContextbeschreibt den Zustand des Betreibers (ob in der Zug- oder Testphase), auf welchem ​​Gerät der Betreiber betrieben werden soll und auch die angeforderten Ressourcen. zwei weitere nützliche API der Ausführungs-Engine.

Von Oben Forward Kernschnittstelle können wir die angeforderten Ressourcen wie folgt verstehen:

  • in_data und out_data repräsentieren die Eingangs- und Ausgangstensoren.

  • req gibt an, wie das Ergebnis der Berechnung in das geschrieben wird out_data.

Das OpReqType kann definiert werden als -

enum OpReqType {
   kNullOp,
   kWriteTo,
   kWriteInplace,
   kAddTo
};

Wie Forward Betreiber können wir optional die implementieren Backward Schnittstelle wie folgt -

virtual void Backward(const OpContext &ctx,
const std::vector<TBlob> &out_grad,
const std::vector<TBlob> &in_data,
const std::vector<TBlob> &out_data,
const std::vector<OpReqType> &req,
const std::vector<TBlob> &in_grad,
const std::vector<TBlob> &aux_states);

Mehrere Aufgaben

Operator Schnittstelle ermöglicht den Benutzern, die folgenden Aufgaben zu erledigen -

  • Der Benutzer kann direkte Aktualisierungen angeben und die Kosten für die Speicherzuweisung reduzieren

  • Um es sauberer zu machen, kann der Benutzer einige interne Argumente vor Python verbergen.

  • Der Benutzer kann die Beziehung zwischen den Tensoren und den Ausgangstensoren definieren.

  • Um eine Berechnung durchzuführen, kann der Benutzer zusätzlichen temporären Speicherplatz vom System abrufen.

Betreiber-Eigenschaft

Wie wir wissen, hat eine Faltung im Convolutional Neural Network (CNN) mehrere Implementierungen. Um die beste Leistung zu erzielen, möchten wir möglicherweise zwischen diesen verschiedenen Windungen wechseln.

Aus diesem Grund trennt Apache MXNet die semantische Operatorschnittstelle von der Implementierungsschnittstelle. Diese Trennung erfolgt in Form vonOperatorProperty Klasse, die aus den folgenden besteht -

InferShape - Die InferShape-Oberfläche dient zwei Zwecken:

  • Der erste Zweck besteht darin, dem System die Größe jedes Eingangs- und Ausgangstensors mitzuteilen, damit der Raum vorher zugewiesen werden kann Forward und Backward Anruf.

  • Der zweite Zweck besteht darin, eine Größenprüfung durchzuführen, um sicherzustellen, dass vor dem Ausführen kein Fehler vorliegt.

Die Syntax ist unten angegeben -

virtual bool InferShape(mxnet::ShapeVector *in_shape,
mxnet::ShapeVector *out_shape,
mxnet::ShapeVector *aux_shape) const = 0;

Request Resource- Was ist, wenn Ihr System den Berechnungsarbeitsbereich für Vorgänge wie cudnnConvolutionForward verwalten kann? Ihr System kann Optimierungen wie die Wiederverwendung des Speicherplatzes und vieles mehr durchführen. Hier erreicht MXNet dies auf einfache Weise mithilfe der folgenden zwei Schnittstellen

virtual std::vector<ResourceRequest> ForwardResource(
   const mxnet::ShapeVector &in_shape) const;
virtual std::vector<ResourceRequest> BackwardResource(
   const mxnet::ShapeVector &in_shape) const;

Aber was ist, wenn die ForwardResource und BackwardResourceNicht leere Arrays zurückgeben? In diesem Fall bietet das System entsprechende Ressourcen durchctx Parameter in der Forward und Backward Schnittstelle von Operator.

Backward dependency - Apache MXNet verfügt über zwei verschiedene Operatorsignaturen, um die Rückwärtsabhängigkeit zu bewältigen. -

void FullyConnectedForward(TBlob weight, TBlob in_data, TBlob out_data);
void FullyConnectedBackward(TBlob weight, TBlob in_data, TBlob out_grad, TBlob in_grad);
void PoolingForward(TBlob in_data, TBlob out_data);
void PoolingBackward(TBlob in_data, TBlob out_data, TBlob out_grad, TBlob in_grad);

Hier sind die beiden wichtigen Punkte zu beachten -

  • Die out_data in FullyConnectedForward werden von FullyConnectedBackward und nicht verwendet

  • PoolingBackward erfordert alle Argumente von PoolingForward.

Deshalb für FullyConnectedForward, das out_dataEinmal verbrauchter Tensor könnte sicher befreit werden, da die Rückwärtsfunktion ihn nicht benötigt. Mit Hilfe dieses Systems konnte man einige Tensoren so früh wie möglich als Müll einsammeln.

In place Option- Apache MXNet bietet den Benutzern eine weitere Schnittstelle, um die Kosten für die Speicherzuweisung zu sparen. Die Schnittstelle eignet sich für elementweise Operationen, bei denen sowohl Eingangs- als auch Ausgangstensoren dieselbe Form haben.

Im Folgenden finden Sie die Syntax zum Festlegen des direkten Updates:

Beispiel zum Erstellen eines Operators

Mit Hilfe von OperatorProperty können wir einen Operator erstellen. Führen Sie dazu die folgenden Schritte aus:

virtual std::vector<std::pair<int, void*>> ElewiseOpProperty::ForwardInplaceOption(
   const std::vector<int> &in_data,
   const std::vector<void*> &out_data) 
const {
   return { {in_data[0], out_data[0]} };
}
virtual std::vector<std::pair<int, void*>> ElewiseOpProperty::BackwardInplaceOption(
   const std::vector<int> &out_grad,
   const std::vector<int> &in_data,
   const std::vector<int> &out_data,
   const std::vector<void*> &in_grad) 
const {
   return { {out_grad[0], in_grad[0]} }
}

Schritt 1

Create Operator

Implementieren Sie zunächst die folgende Schnittstelle in OperatorProperty:

virtual Operator* CreateOperator(Context ctx) const = 0;

Das Beispiel ist unten angegeben -

class ConvolutionOp {
   public:
      void Forward( ... ) { ... }
      void Backward( ... ) { ... }
};
class ConvolutionOpProperty : public OperatorProperty {
   public:
      Operator* CreateOperator(Context ctx) const {
         return new ConvolutionOp;
      }
};

Schritt 2

Parameterize Operator

Wenn Sie einen Faltungsoperator implementieren möchten, müssen Sie die Kernelgröße, die Schrittgröße, die Auffüllgröße usw. kennen. Warum, weil diese Parameter vor dem Aufruf von any an den Operator übergeben werden solltenForward oder backward Schnittstelle.

Dazu müssen wir a definieren ConvolutionParam Struktur wie unten -

#include <dmlc/parameter.h>
struct ConvolutionParam : public dmlc::Parameter<ConvolutionParam> {
   mxnet::TShape kernel, stride, pad;
   uint32_t num_filter, num_group, workspace;
   bool no_bias;
};

Jetzt müssen wir das einfügen ConvolutionOpProperty und geben Sie es wie folgt an den Bediener weiter -

class ConvolutionOp {
   public:
      ConvolutionOp(ConvolutionParam p): param_(p) {}
      void Forward( ... ) { ... }
      void Backward( ... ) { ... }
   private:
      ConvolutionParam param_;
};
class ConvolutionOpProperty : public OperatorProperty {
   public:
      void Init(const vector<pair<string, string>& kwargs) {
         // initialize param_ using kwargs
      }
      Operator* CreateOperator(Context ctx) const {
         return new ConvolutionOp(param_);
      }
   private:
      ConvolutionParam param_;
};

Schritt 3

Register the Operator Property Class and the Parameter Class to Apache MXNet

Zuletzt müssen wir die Operator-Eigenschaftsklasse und die Parameterklasse bei MXNet registrieren. Dies kann mit Hilfe der folgenden Makros erfolgen -

DMLC_REGISTER_PARAMETER(ConvolutionParam);
MXNET_REGISTER_OP_PROPERTY(Convolution, ConvolutionOpProperty);

Im obigen Makro ist das erste Argument die Namenszeichenfolge und das zweite der Name der Eigenschaftsklasse.

Dieses Kapitel enthält Informationen zur Unified Operator Application Programming Interface (API) in Apache MXNet.

SimpleOp

SimpleOp ist eine neue einheitliche Operator-API, die verschiedene aufrufende Prozesse vereinheitlicht. Nach dem Aufrufen kehrt es zu den grundlegenden Elementen der Operatoren zurück. Der einheitliche Operator wurde speziell für unäre und binäre Operationen entwickelt. Dies liegt daran, dass die meisten mathematischen Operatoren sich um einen oder zwei Operanden kümmern und mehrere Operanden die Optimierung in Bezug auf die Abhängigkeit nützlich machen.

Wir werden den vereinfachten Operator SimpleOp anhand eines Beispiels verstehen. In diesem Beispiel erstellen wir einen Operator, der alssmooth l1 loss, das ist eine Mischung aus l1 und l2 Verlust. Wir können den Verlust wie folgt definieren und schreiben -

loss = outside_weight .* f(inside_weight .* (data - label))
grad = outside_weight .* inside_weight .* f'(inside_weight .* (data - label))

Hier im obigen Beispiel

  • . * steht für elementweise Multiplikation

  • f, f’ ist die glatte l1-Verlustfunktion, von der wir annehmen, dass sie in ist mshadow.

Es scheint unmöglich, diesen bestimmten Verlust als unären oder binären Operator zu implementieren, aber MXNet bietet seinen Benutzern eine automatische Differenzierung in der symbolischen Ausführung, die den Verlust für f und f 'direkt vereinfacht. Deshalb können wir diesen besonderen Verlust sicherlich als unären Operator implementieren.

Formen definieren

Wie wir wissen, MXNet mshadow libraryerfordert eine explizite Speicherzuweisung, daher müssen wir alle Datenformen bereitstellen, bevor eine Berechnung erfolgt. Bevor wir Funktionen und Farbverläufe definieren, müssen wir die Konsistenz der Eingabeform und die Ausgabeform wie folgt bereitstellen:

typedef mxnet::TShape (*UnaryShapeFunction)(const mxnet::TShape& src,
const EnvArguments& env);
   typedef mxnet::TShape (*BinaryShapeFunction)(const mxnet::TShape& lhs,
const mxnet::TShape& rhs,
const EnvArguments& env);

Die Funktion mxnet :: Tshape wird verwendet, um die Form der Eingabedaten und die angegebene Form der Ausgabedaten zu überprüfen. Wenn Sie diese Funktion nicht definieren, entspricht die Standardausgabeform der Eingabeform. Beispielsweise wird im Fall eines binären Operators die Form von lhs und rhs standardmäßig als dieselbe überprüft.

Kommen wir nun zu unserem smooth l1 loss example. Dazu müssen wir in der Header-Implementierung eine XPU für CPU oder GPU definieren smooth_l1_unary-inl.h. Der Grund ist, denselben Code in wiederzuverwenden smooth_l1_unary.cc und smooth_l1_unary.cu.

#include <mxnet/operator_util.h>
   #if defined(__CUDACC__)
      #define XPU gpu
   #else
      #define XPU cpu
#endif

Wie bei uns smooth l1 loss example,Die Ausgabe hat die gleiche Form wie die Quelle. Wir können das Standardverhalten verwenden. Es kann wie folgt geschrieben werden:

inline mxnet::TShape SmoothL1Shape_(const mxnet::TShape& src,const EnvArguments& env) {
   return mxnet::TShape(src);
}

Funktionen definieren

Wir können eine unäre oder binäre Funktion mit einem Eingang wie folgt erstellen:

typedef void (*UnaryFunction)(const TBlob& src,
   const EnvArguments& env,
   TBlob* ret,
   OpReqType req,
   RunContext ctx);
typedef void (*BinaryFunction)(const TBlob& lhs,
   const TBlob& rhs,
   const EnvArguments& env,
   TBlob* ret,
   OpReqType req,
   RunContext ctx);

Es folgt die RunContext ctx struct welches die Informationen enthält, die zur Laufzeit für die Ausführung benötigt werden -

struct RunContext {
   void *stream; // the stream of the device, can be NULL or Stream<gpu>* in GPU mode
   template<typename xpu> inline mshadow::Stream<xpu>* get_stream() // get mshadow stream from Context
} // namespace mxnet

Nun wollen wir sehen, wie wir die Berechnungsergebnisse schreiben können ret.

enum OpReqType {
   kNullOp, // no operation, do not write anything
   kWriteTo, // write gradient to provided space
   kWriteInplace, // perform an in-place write
   kAddTo // add to the provided space
};

Kommen wir nun zu unserem smooth l1 loss example. Dazu verwenden wir UnaryFunction, um die Funktion dieses Operators wie folgt zu definieren:

template<typename xpu>
void SmoothL1Forward_(const TBlob& src,
   const EnvArguments& env,
   TBlob *ret,
   OpReqType req,
RunContext ctx) {
   using namespace mshadow;
   using namespace mshadow::expr;
   mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
   real_t sigma2 = env.scalar * env.scalar;
   MSHADOW_TYPE_SWITCH(ret->type_flag_, DType, {
      mshadow::Tensor<xpu, 2, DType> out = ret->get<xpu, 2, DType>(s);
      mshadow::Tensor<xpu, 2, DType> in = src.get<xpu, 2, DType>(s);
      ASSIGN_DISPATCH(out, req,
      F<mshadow_op::smooth_l1_loss>(in, ScalarExp<DType>(sigma2)));
   });
}

Farbverläufe definieren

Außer Input, TBlob, und OpReqTypeverdoppelt werden, haben Gradientenfunktionen von Binäroperatoren eine ähnliche Struktur. Schauen wir uns unten an, wo wir eine Verlaufsfunktion mit verschiedenen Arten von Eingaben erstellt haben:

// depending only on out_grad
typedef void (*UnaryGradFunctionT0)(const OutputGrad& out_grad,
   const EnvArguments& env,
   TBlob* in_grad,
   OpReqType req,
   RunContext ctx);
// depending only on out_value
typedef void (*UnaryGradFunctionT1)(const OutputGrad& out_grad,
   const OutputValue& out_value,
   const EnvArguments& env,
   TBlob* in_grad,
   OpReqType req,
   RunContext ctx);
// depending only on in_data
typedef void (*UnaryGradFunctionT2)(const OutputGrad& out_grad,
   const Input0& in_data0,
   const EnvArguments& env,
   TBlob* in_grad,
   OpReqType req,
   RunContext ctx);

Wie oben definiert Input0, Input, OutputValue, und OutputGrad Alle teilen die Struktur von GradientFunctionArgument. Es ist wie folgt definiert:

struct GradFunctionArgument {
   TBlob data;
}

Kommen wir nun zu unserem smooth l1 loss example. Damit dies die Kettenregel des Gradienten ermöglicht, müssen wir multiplizierenout_grad von oben bis zum Ergebnis von in_grad.

template<typename xpu>
void SmoothL1BackwardUseIn_(const OutputGrad& out_grad, const Input0& in_data0,
   const EnvArguments& env,
   TBlob *in_grad,
   OpReqType req,
   RunContext ctx) {
   using namespace mshadow;
   using namespace mshadow::expr;
   mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
   real_t sigma2 = env.scalar * env.scalar;
      MSHADOW_TYPE_SWITCH(in_grad->type_flag_, DType, {
      mshadow::Tensor<xpu, 2, DType> src = in_data0.data.get<xpu, 2, DType>(s);
      mshadow::Tensor<xpu, 2, DType> ograd = out_grad.data.get<xpu, 2, DType>(s);
      mshadow::Tensor<xpu, 2, DType> igrad = in_grad->get<xpu, 2, DType>(s);
      ASSIGN_DISPATCH(igrad, req,
      ograd * F<mshadow_op::smooth_l1_gradient>(src, ScalarExp<DType>(sigma2)));
   });
}

Registrieren Sie SimpleOp bei MXNet

Nachdem wir Form, Funktion und Verlauf erstellt haben, müssen wir sie sowohl in einem NDArray-Operator als auch in einem symbolischen Operator wiederherstellen. Hierfür können wir das Registrierungsmakro wie folgt verwenden:

MXNET_REGISTER_SIMPLE_OP(Name, DEV)
   .set_shape_function(Shape)
   .set_function(DEV::kDevMask, Function<XPU>, SimpleOpInplaceOption)
   .set_gradient(DEV::kDevMask, Gradient<XPU>, SimpleOpInplaceOption)
   .describe("description");

Das SimpleOpInplaceOption kann wie folgt definiert werden -

enum SimpleOpInplaceOption {
   kNoInplace, // do not allow inplace in arguments
   kInplaceInOut, // allow inplace in with out (unary)
   kInplaceOutIn, // allow inplace out_grad with in_grad (unary)
   kInplaceLhsOut, // allow inplace left operand with out (binary)

   kInplaceOutLhs // allow inplace out_grad with lhs_grad (binary)
};

Kommen wir nun zu unserem smooth l1 loss example. Zu diesem Zweck haben wir eine Verlaufsfunktion, die auf Eingabedaten basiert, sodass die Funktion nicht an Ort und Stelle geschrieben werden kann.

MXNET_REGISTER_SIMPLE_OP(smooth_l1, XPU)
.set_function(XPU::kDevMask, SmoothL1Forward_<XPU>, kNoInplace)
.set_gradient(XPU::kDevMask, SmoothL1BackwardUseIn_<XPU>, kInplaceOutIn)
.set_enable_scalar(true)
.describe("Calculate Smooth L1 Loss(lhs, scalar)");

SimpleOp auf EnvArguments

Wie wir wissen, benötigen einige Operationen möglicherweise Folgendes:

  • Ein Skalar als Eingabe, z. B. eine Gradientenskala

  • Eine Reihe von Schlüsselwortargumenten, die das Verhalten steuern

  • Ein temporärer Bereich, um Berechnungen zu beschleunigen.

Die Verwendung von EnvArguments bietet den Vorteil, dass zusätzliche Argumente und Ressourcen bereitgestellt werden, um Berechnungen skalierbarer und effizienter zu gestalten.

Beispiel

Definieren wir zuerst die Struktur wie folgt -

struct EnvArguments {
   real_t scalar; // scalar argument, if enabled
   std::vector<std::pair<std::string, std::string> > kwargs; // keyword arguments
   std::vector<Resource> resource; // pointer to the resources requested
};

Als nächstes müssen wir zusätzliche Ressourcen wie anfordern mshadow::Random<xpu> und temporärer Speicherplatz von EnvArguments.resource. Dies kann wie folgt erfolgen:

struct ResourceRequest {
   enum Type { // Resource type, indicating what the pointer type is
      kRandom, // mshadow::Random<xpu> object
      kTempSpace // A dynamic temp space that can be arbitrary size
   };
   Type type; // type of resources
};

Jetzt fordert die Registrierung die deklarierte Ressourcenanforderung von an mxnet::ResourceManager. Danach werden die Ressourcen in platziert std::vector<Resource> resource in EnvAgruments.

Wir können mit Hilfe des folgenden Codes auf die Ressourcen zugreifen:

auto tmp_space_res = env.resources[0].get_space(some_shape, some_stream);
auto rand_res = env.resources[0].get_random(some_stream);

Wenn Sie in unserem Beispiel für einen glatten l1-Verlust sehen, wird eine skalare Eingabe benötigt, um den Wendepunkt einer Verlustfunktion zu markieren. Deshalb verwenden wir bei der Registrierungset_enable_scalar(true), und env.scalar in Funktions- und Gradientendeklarationen.

Gebäudetensorbetrieb

Hier stellt sich die Frage, warum wir Tensoroperationen herstellen müssen. Die Gründe sind wie folgt:

  • Für die Berechnung wird die mshadow-Bibliothek verwendet, und manchmal stehen keine Funktionen zur Verfügung.

  • Wenn eine Operation nicht elementweise ausgeführt wird, z. B. Softmax-Verlust und Gradient.

Beispiel

Hier verwenden wir das obige Beispiel für einen glatten l1-Verlust. Wir werden zwei Mapper erstellen, nämlich die skalaren Fälle von glattem l1-Verlust und Gradienten:

namespace mshadow_op {
   struct smooth_l1_loss {
      // a is x, b is sigma2
      MSHADOW_XINLINE static real_t Map(real_t a, real_t b) {
         if (a > 1.0f / b) {
            return a - 0.5f / b;
         } else if (a < -1.0f / b) {
            return -a - 0.5f / b;
         } else {
            return 0.5f * a * a * b;
         }
      }
   };
}

In diesem Kapitel geht es um das verteilte Training in Apache MXNet. Beginnen wir mit dem Verständnis der Berechnungsmodi in MXNet.

Berechnungsmodi

MXNet, eine mehrsprachige ML-Bibliothek, bietet seinen Benutzern die folgenden zwei Berechnungsmodi:

Imperativer Modus

Dieser Berechnungsmodus macht eine Schnittstelle wie die NumPy-API verfügbar. Verwenden Sie in MXNet beispielsweise den folgenden Imperativcode, um einen Tensor von Nullen sowohl auf der CPU als auch auf der GPU zu erstellen.

import mxnet as mx
tensor_cpu = mx.nd.zeros((100,), ctx=mx.cpu())
tensor_gpu= mx.nd.zeros((100,), ctx=mx.gpu(0))

Wie wir im obigen Code sehen, gibt MXNets den Ort an, an dem der Tensor gehalten werden soll, entweder in der CPU oder im GPU-Gerät. Im obigen Beispiel befindet es sich an Position 0. MXNet erreicht eine unglaubliche Auslastung des Geräts, da alle Berechnungen nicht sofort, sondern träge erfolgen.

Symbolischer Modus

Der imperative Modus ist zwar sehr nützlich, aber einer der Nachteile dieses Modus ist seine Starrheit, dh alle Berechnungen müssen im Voraus zusammen mit vordefinierten Datenstrukturen bekannt sein.

Andererseits zeigt der symbolische Modus ein Berechnungsdiagramm wie TensorFlow an. Der Nachteil der imperativen API wird beseitigt, indem MXNet anstelle von festen / vordefinierten Datenstrukturen mit Symbolen oder Variablen arbeiten kann. Danach können die Symbole wie folgt als eine Reihe von Operationen interpretiert werden:

import mxnet as mx
x = mx.sym.Variable(“X”)
y = mx.sym.Variable(“Y”)
z = (x+y)
m = z/100

Arten von Parallelität

Apache MXNet unterstützt verteiltes Training. Es ermöglicht uns, mehrere Maschinen für ein schnelleres und effektives Training zu nutzen.

Im Folgenden finden Sie zwei Möglichkeiten, wie wir die Arbeitslast für das Training eines NN auf mehrere Geräte, CPU- oder GPU-Geräte verteilen können:

Datenparallelität

Bei dieser Art von Parallelität speichert jedes Gerät eine vollständige Kopie des Modells und arbeitet mit einem anderen Teil des Datensatzes. Geräte aktualisieren auch gemeinsam ein freigegebenes Modell. Wir können alle Geräte auf einer einzelnen Maschine oder auf mehreren Maschinen lokalisieren.

Modellparallelität

Es ist eine andere Art von Parallelität, die nützlich ist, wenn Modelle so groß sind, dass sie nicht in den Gerätespeicher passen. Bei der Modellparallelität wird verschiedenen Geräten die Aufgabe zugewiesen, verschiedene Teile des Modells zu lernen. Der wichtige Punkt hierbei ist, dass Apache MXNet derzeit Modellparallelität nur auf einem einzelnen Computer unterstützt.

Arbeiten von verteilten Schulungen

Die folgenden Konzepte sind der Schlüssel zum Verständnis der Funktionsweise verteilter Schulungen in Apache MXNet.

Arten von Prozessen

Prozesse kommunizieren miteinander, um das Training eines Modells durchzuführen. Apache MXNet hat die folgenden drei Prozesse:

Arbeiter

Die Aufgabe des Arbeiterknotens besteht darin, eine Schulung für eine Reihe von Schulungsmustern durchzuführen. Die Worker-Knoten ziehen Gewichte vom Server, bevor sie jeden Stapel verarbeiten. Die Worker-Knoten senden Farbverläufe an den Server, sobald der Stapel verarbeitet wurde.

Server

MXNet kann mehrere Server zum Speichern der Modellparameter und zur Kommunikation mit den Arbeitsknoten haben.

Planer

Die Rolle des Schedulers besteht darin, den Cluster einzurichten. Dazu gehört das Warten auf Nachrichten, die von jedem Knoten gesendet wurden und welchen Port der Knoten abhört. Nach dem Einrichten des Clusters informiert der Scheduler alle Prozesse über jeden anderen Knoten im Cluster. Dies liegt daran, dass die Prozesse miteinander kommunizieren können. Es gibt nur einen Scheduler.

KV Store

KV Stores steht für Key-ValueGeschäft. Es ist eine wichtige Komponente für das Training mit mehreren Geräten. Dies ist wichtig, da die Kommunikation von Parametern zwischen Geräten auf einem oder mehreren Computern über einen oder mehrere Server mit einem KVStore für die Parameter übertragen wird. Lassen Sie uns die Arbeitsweise von KVStore anhand der folgenden Punkte verstehen:

  • Jeder Wert in KVStore wird durch a dargestellt key und ein value.

  • Jedem Parameterarray im Netzwerk ist a zugeordnet key und auf die Gewichte dieses Parameterarrays wird verwiesen value.

  • Danach die Worker-Knoten pushFarbverläufe nach der Bearbeitung einer Charge. Sie auchpull Aktualisierte Gewichte vor der Verarbeitung einer neuen Charge.

Der Begriff des KVStore-Servers existiert nur während des verteilten Trainings und der verteilte Modus wird durch Aufrufen aktiviert mxnet.kvstore.create Funktion mit einem String-Argument, das das Wort enthält dist - -

kv = mxnet.kvstore.create(‘dist_sync’)

Verteilung der Schlüssel

Es ist nicht erforderlich, dass alle Server alle Parameterarrays oder -schlüssel speichern, sie sind jedoch auf verschiedene Server verteilt. Eine solche Verteilung von Schlüsseln auf verschiedene Server wird vom KVStore transparent behandelt, und die Entscheidung, auf welchem ​​Server ein bestimmter Schlüssel gespeichert wird, wird zufällig getroffen.

Wie oben erläutert, stellt KVStore sicher, dass bei jedem Ziehen des Schlüssels seine Anforderung an diesen Server gesendet wird, der den entsprechenden Wert hat. Was ist, wenn der Wert eines Schlüssels groß ist? In diesem Fall kann es von verschiedenen Servern gemeinsam genutzt werden.

Trainingsdaten teilen

Als Benutzer möchten wir, dass jeder Computer an verschiedenen Teilen des Datensatzes arbeitet, insbesondere wenn verteiltes Training im datenparallelen Modus ausgeführt wird. Wir wissen, dass wir einen Stapel von Stichproben, die vom Dateniterator für datenparalleles Training bereitgestellt werden, auf einen einzelnen Mitarbeiter aufteilen können, den wir verwenden könnenmxnet.gluon.utils.split_and_load Laden Sie dann jeden Teil des Stapels auf das Gerät, das ihn weiter verarbeitet.

Auf der anderen Seite müssen wir im Fall eines verteilten Trainings zu Beginn den Datensatz in unterteilen nverschiedene Teile, so dass jeder Arbeiter ein anderes Teil bekommt. Einmal erhalten, kann jeder Arbeiter dann verwendensplit_and_loadum diesen Teil des Datensatzes erneut auf verschiedene Geräte auf einem einzelnen Computer aufzuteilen. All dies geschieht durch einen Dateniterator.mxnet.io.MNISTIterator und mxnet.io.ImageRecordIter Es gibt zwei solche Iteratoren in MXNet, die diese Funktion unterstützen.

Gewichte aktualisieren

Zum Aktualisieren der Gewichte unterstützt KVStore die folgenden zwei Modi:

  • Die erste Methode aggregiert die Farbverläufe und aktualisiert die Gewichte mithilfe dieser Farbverläufe.

  • Bei der zweiten Methode aggregiert der Server nur Farbverläufe.

Wenn Sie Gluon verwenden, können Sie durch Übergeben zwischen den oben genannten Methoden wählen update_on_kvstoreVariable. Lassen Sie es uns verstehen, indem Sie das erstellentrainer Objekt wie folgt -

trainer = gluon.Trainer(net.collect_params(), optimizer='sgd',
   optimizer_params={'learning_rate': opt.lr,
      'wd': opt.wd,
      'momentum': opt.momentum,
      'multi_precision': True},
      kvstore=kv,
   update_on_kvstore=True)

Modi des verteilten Trainings

Wenn die KVStore-Erstellungszeichenfolge das Wort dist enthält, bedeutet dies, dass das verteilte Training aktiviert ist. Im Folgenden finden Sie verschiedene Modi für verteiltes Training, die mithilfe verschiedener KVStore-Typen aktiviert werden können:

dist_sync

Wie der Name schon sagt, bedeutet dies synchrones verteiltes Training. Dabei verwenden alle Mitarbeiter zu Beginn jeder Charge denselben synchronisierten Satz von Modellparametern.

Der Nachteil dieses Modus besteht darin, dass der Server nach jedem Stapel warten muss, um Farbverläufe von jedem Worker zu erhalten, bevor er die Modellparameter aktualisiert. Dies bedeutet, dass ein Absturz eines Arbeitnehmers den Fortschritt aller Arbeiter stoppen würde.

dist_async

Wie der Name schon sagt, bedeutet dies synchrones verteiltes Training. Dabei empfängt der Server Farbverläufe von einem Mitarbeiter und aktualisiert sofort seinen Speicher. Der Server verwendet den aktualisierten Speicher, um auf weitere Zugriffe zu reagieren.

Der Vorteil im Vergleich zu dist_sync modeist, dass ein Mitarbeiter, der die Verarbeitung eines Stapels beendet hat, die aktuellen Parameter vom Server abrufen und den nächsten Stapel starten kann. Der Arbeiter kann dies tun, auch wenn der andere Arbeiter die Verarbeitung der früheren Charge noch nicht abgeschlossen hat. Es ist auch schneller als der dist_sync-Modus, da die Konvergenz mehr Epochen dauern kann, ohne dass Synchronisationskosten anfallen.

dist_sync_device

Dieser Modus ist der gleiche wie dist_syncModus. Der einzige Unterschied besteht darin, dass auf jedem Knoten mehrere GPUs verwendet werdendist_sync_device aggregiert Farbverläufe und aktualisiert Gewichte auf der GPU, während dist_sync aggregiert Farbverläufe und aktualisiert Gewichte im CPU-Speicher.

Es reduziert die teure Kommunikation zwischen GPU und CPU. Deshalb ist es schneller alsdist_sync. Der Nachteil ist, dass es die Speichernutzung auf der GPU erhöht.

dist_async_device

Dieser Modus funktioniert genauso wie dist_sync_device Modus, aber im asynchronen Modus.

In diesem Kapitel erfahren Sie mehr über die in Apache MXNet verfügbaren Python-Pakete.

Wichtige MXNet Python-Pakete

MXNet verfügt über die folgenden wichtigen Python-Pakete, die wir einzeln diskutieren werden:

  • Autograd (automatische Differenzierung)

  • NDArray

  • KVStore

  • Gluon

  • Visualization

Beginnen wir zuerst mit Autograd Python-Paket für Apache MXNet.

Autograd

Autograd steht für automatic differentiationwird verwendet, um die Gradienten von der Verlustmetrik zurück zu jedem der Parameter zu propagieren. Zusammen mit der Backpropagation wird ein dynamischer Programmieransatz verwendet, um die Gradienten effizient zu berechnen. Es wird auch als automatische Differenzierung im umgekehrten Modus bezeichnet. Diese Technik ist sehr effizient in "Fan-In" -Situationen, in denen viele Parameter eine einzelne Verlustmetrik beeinflussen.

Was sind Farbverläufe?

Gradienten sind die Grundlagen für den Prozess des neuronalen Netzwerktrainings. Sie erklären uns im Grunde, wie wir die Parameter des Netzwerks ändern können, um seine Leistung zu verbessern.

Wie wir wissen, bestehen neuronale Netze (NN) aus Operatoren wie Summen, Produkten, Faltungen usw. Diese Operatoren verwenden für ihre Berechnungen Parameter wie die Gewichte in Faltungskernen. Wir sollten die optimalen Werte für diese Parameter finden müssen, und Gradienten zeigen uns den Weg und führen uns auch zur Lösung.

Wir sind an der Auswirkung der Änderung eines Parameters auf die Leistung des Netzwerks interessiert, und Gradienten geben an, um wie viel eine bestimmte Variable zunimmt oder abnimmt, wenn wir eine Variable ändern, von der sie abhängt. Die Leistung wird normalerweise mithilfe einer Verlustmetrik definiert, die wir zu minimieren versuchen. Zum Beispiel könnten wir für die Regression versuchen, zu minimierenL2 Verlust zwischen unseren Vorhersagen und dem genauen Wert, während wir für die Klassifizierung die minimieren könnten cross-entropy loss.

Sobald wir den Gradienten jedes Parameters in Bezug auf den Verlust berechnet haben, können wir einen Optimierer verwenden, z. B. den stochastischen Gradientenabstieg.

Wie berechnet man Gradienten?

Wir haben die folgenden Optionen, um Farbverläufe zu berechnen:

  • Symbolic Differentiation- Die allererste Option ist die symbolische Differenzierung, bei der die Formeln für jeden Gradienten berechnet werden. Der Nachteil dieser Methode ist, dass sie schnell zu unglaublich langen Formeln führt, wenn das Netzwerk tiefer und die Bediener komplexer werden.

  • Finite Differencing- Eine andere Möglichkeit besteht darin, eine endliche Differenzierung zu verwenden, bei der geringfügige Unterschiede für jeden Parameter versucht werden und festgestellt wird, wie die Verlustmetrik reagiert. Der Nachteil dieses Verfahrens besteht darin, dass es rechenintensiv wäre und möglicherweise eine schlechte numerische Genauigkeit aufweist.

  • Automatic differentiation- Die Lösung für die Nachteile der obigen Methoden besteht darin, eine automatische Differenzierung zu verwenden, um die Gradienten von der Verlustmetrik zurück zu jedem der Parameter zu verbreiten. Die Ausbreitung ermöglicht uns einen dynamischen Programmieransatz zur effizienten Berechnung der Gradienten. Diese Methode wird auch als automatische Differenzierung im umgekehrten Modus bezeichnet.

Automatische Differenzierung (autograd)

Hier werden wir die Arbeitsweise von Autograd im Detail verstehen. Es funktioniert grundsätzlich in zwei Schritten:

Stage 1 - Diese Stufe heißt ‘Forward Pass’des Trainings. Wie der Name schon sagt, wird in dieser Phase die Aufzeichnung des Betreibers erstellt, der vom Netzwerk verwendet wird, um Vorhersagen zu treffen und die Verlustmetrik zu berechnen.

Stage 2 - Diese Stufe heißt ‘Backward Pass’des Trainings. Wie der Name schon sagt, funktioniert es in dieser Phase rückwärts durch diesen Datensatz. Wenn Sie rückwärts gehen, werden die partiellen Ableitungen jedes Operators bis zum Netzwerkparameter ausgewertet.

Vorteile von Autograd

Im Folgenden sind die Vorteile der automatischen Differenzierung (Autograd) aufgeführt:

  • Flexible- Flexibilität, die wir bei der Definition unseres Netzwerks erhalten, ist einer der großen Vorteile der Verwendung von Autograd. Wir können die Operationen bei jeder Iteration ändern. Diese werden als dynamische Diagramme bezeichnet, deren Implementierung in Frameworks, die statische Diagramme erfordern, viel komplexer ist. Selbst in solchen Fällen kann Autograd die Farbverläufe immer noch korrekt rückpropagieren.

  • Automatic- Autograd ist automatisch, dh die Komplexität des Backpropagation-Verfahrens wird von Ihnen für Sie erledigt. Wir müssen nur angeben, welche Verläufe wir berechnen möchten.

  • Efficient - Autogard berechnet die Verläufe sehr effizient.

  • Can use native Python control flow operators- Wir können die nativen Python-Steuerungsflussoperatoren verwenden, z. B. if-Bedingung und while-Schleife. Der Autograd kann die Gradienten weiterhin effizient und korrekt zurückpropagieren.

Verwenden von Autograd in MXNet Gluon

Hier sehen wir anhand eines Beispiels, wie wir es verwenden können autograd in MXNet Gluon.

Implementierungsbeispiel

Im folgenden Beispiel implementieren wir das Regressionsmodell mit zwei Ebenen. Nach der Implementierung verwenden wir Autograd, um den Gradienten des Verlusts unter Bezugnahme auf jeden der Gewichtsparameter automatisch zu berechnen.

Importieren Sie zuerst den Autogrard und andere erforderliche Pakete wie folgt:

from mxnet import autograd
import mxnet as mx
from mxnet.gluon.nn import HybridSequential, Dense
from mxnet.gluon.loss import L2Loss

Jetzt müssen wir das Netzwerk wie folgt definieren:

N_net = HybridSequential()
N_net.add(Dense(units=3))
N_net.add(Dense(units=1))
N_net.initialize()

Jetzt müssen wir den Verlust wie folgt definieren:

loss_function = L2Loss()

Als nächstes müssen wir die Dummy-Daten wie folgt erstellen:

x = mx.nd.array([[0.5, 0.9]])
y = mx.nd.array([[1.5]])

Jetzt sind wir bereit für unseren ersten Vorwärtsdurchlauf durch das Netzwerk. Wir möchten, dass Autograd den Rechengraphen aufzeichnet, damit wir die Gradienten berechnen können. Dazu müssen wir den Netzwerkcode im Umfang von ausführenautograd.record Kontext wie folgt -

with autograd.record():
   y_hat = N_net(x)
   loss = loss_function(y_hat, y)

Jetzt sind wir bereit für den Rückwärtsdurchlauf, bei dem wir zunächst die Rückwärtsmethode für die interessierende Menge aufrufen. Die Quatität des Interesses in unserem Beispiel ist Verlust, weil wir versuchen, den Verlustgradienten unter Bezugnahme auf die Parameter zu berechnen -

loss.backward()

Jetzt haben wir Gradienten für jeden Parameter des Netzwerks, die vom Optimierer verwendet werden, um den Parameterwert für eine verbesserte Leistung zu aktualisieren. Schauen wir uns die Farbverläufe der 1. Ebene wie folgt an:

N_net[0].weight.grad()

Output

Die Ausgabe ist wie folgt

[[-0.00470527 -0.00846948]
[-0.03640365 -0.06552657]
[ 0.00800354 0.01440637]]
<NDArray 3x2 @cpu(0)>

Vollständiges Implementierungsbeispiel

Im Folgenden finden Sie das vollständige Implementierungsbeispiel.

from mxnet import autograd
import mxnet as mx
from mxnet.gluon.nn import HybridSequential, Dense
from mxnet.gluon.loss import L2Loss
N_net = HybridSequential()
N_net.add(Dense(units=3))
N_net.add(Dense(units=1))
N_net.initialize()
loss_function = L2Loss()
x = mx.nd.array([[0.5, 0.9]])
y = mx.nd.array([[1.5]])
with autograd.record():
y_hat = N_net(x)
loss = loss_function(y_hat, y)
loss.backward()
N_net[0].weight.grad()

In diesem Kapitel werden wir uns mit dem mehrdimensionalen Array-Format von MXNet befassen ndarray.

Umgang mit Daten mit NDArray

Zuerst werden wir sehen, wie wir mit Daten mit NDArray umgehen können. Nachfolgend sind die Voraussetzungen dafür aufgeführt -

Voraussetzungen

Um zu verstehen, wie wir mit Daten mit diesem mehrdimensionalen Array-Format umgehen können, müssen wir die folgenden Voraussetzungen erfüllen:

  • MXNet in einer Python-Umgebung installiert

  • Python 2.7.x oder Python 3.x.

Implementierungsbeispiel

Lassen Sie uns die Grundfunktionalität anhand eines unten angegebenen Beispiels verstehen -

Zuerst müssen wir MXNet und ndarray wie folgt aus MXNet importieren:

import mxnet as mx
from mxnet import nd

Sobald wir die erforderlichen Bibliotheken importiert haben, werden wir mit den folgenden grundlegenden Funktionen fortfahren:

Ein einfaches 1-D-Array mit einer Python-Liste

Example

x = nd.array([1,2,3,4,5,6,7,8,9,10])
print(x)

Output

Die Ausgabe ist wie unten erwähnt -

[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
<NDArray 10 @cpu(0)>

Ein 2-D-Array mit einer Python-Liste

Example

y = nd.array([[1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10]])
print(y)

Output

Die Ausgabe ist wie unten angegeben -

[[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]]
<NDArray 3x10 @cpu(0)>

Erstellen eines NDArray ohne Initialisierung

Hier erstellen wir mithilfe von eine Matrix mit 3 Zeilen und 4 Spalten .emptyFunktion. Wir werden auch verwenden.full Funktion, die einen zusätzlichen Operator für den Wert benötigt, den Sie in das Array einfügen möchten.

Example

x = nd.empty((3, 4))
print(x)
x = nd.full((3,4), 8)
print(x)

Output

Die Ausgabe ist unten angegeben -

[[0.000e+00 0.000e+00 0.000e+00 0.000e+00]
 [0.000e+00 0.000e+00 2.887e-42 0.000e+00]
 [0.000e+00 0.000e+00 0.000e+00 0.000e+00]]
<NDArray 3x4 @cpu(0)>

[[8. 8. 8. 8.]
 [8. 8. 8. 8.]
 [8. 8. 8. 8.]]
<NDArray 3x4 @cpu(0)>

Matrix aller Nullen mit der Funktion .zeros

Example

x = nd.zeros((3, 8))
print(x)

Output

Die Ausgabe ist wie folgt -

[[0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 3x8 @cpu(0)>

Matrix aller mit der .ones-Funktion

Example

x = nd.ones((3, 8))
print(x)

Output

Die Ausgabe wird unten erwähnt -

[[1. 1. 1. 1. 1. 1. 1. 1.]
   [1. 1. 1. 1. 1. 1. 1. 1.]
   [1. 1. 1. 1. 1. 1. 1. 1.]]
<NDArray 3x8 @cpu(0)>

Erstellen eines Arrays, dessen Werte zufällig abgetastet werden

Example

y = nd.random_normal(0, 1, shape=(3, 4))
print(y)

Output

Die Ausgabe ist unten angegeben -

[[ 1.2673576 -2.0345826 -0.32537818 -1.4583491 ]
 [-0.11176403 1.3606371 -0.7889914 -0.17639421]
 [-0.2532185 -0.42614475 -0.12548696 1.4022992 ]]
<NDArray 3x4 @cpu(0)>

Finden der Dimension jedes NDArray

Example

y.shape

Output

Die Ausgabe ist wie folgt -

(3, 4)

Ermitteln der Größe jedes NDArray

Example

y.size

Output

12

Ermitteln des Datentyps jedes NDArray

Example

y.dtype

Output

numpy.float32

NDArray-Operationen

In diesem Abschnitt stellen wir Ihnen die Array-Operationen von MXNet vor. NDArray unterstützt eine große Anzahl von mathematischen Standard- und In-Place-Operationen.

Mathematische Standardoperationen

Es folgen mathematische Standardoperationen, die von NDArray unterstützt werden:

Elementweise Addition

Zuerst müssen wir MXNet und ndarray wie folgt aus MXNet importieren:

import mxnet as mx
from mxnet import nd
x = nd.ones((3, 5))
y = nd.random_normal(0, 1, shape=(3, 5))
print('x=', x)
print('y=', y)
x = x + y
print('x = x + y, x=', x)

Output

Die Ausgabe wird hiermit gegeben -

x=
[[1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1.]]
<NDArray 3x5 @cpu(0)>
y=
[[-1.0554522 -1.3118273 -0.14674698 0.641493 -0.73820823]
[ 2.031364 0.5932667 0.10228804 1.179526 -0.5444829 ]
[-0.34249446 1.1086396 1.2756858 -1.8332436 -0.5289873 ]]
<NDArray 3x5 @cpu(0)>
x = x + y, x=
[[-0.05545223 -0.3118273 0.853253 1.6414931 0.26179177]
[ 3.031364 1.5932667 1.102288 2.1795259 0.4555171 ]
[ 0.6575055 2.1086397 2.2756858 -0.8332436 0.4710127 ]]
<NDArray 3x5 @cpu(0)>

Elementweise Multiplikation

Example

x = nd.array([1, 2, 3, 4])
y = nd.array([2, 2, 2, 1])
x * y

Output

Sie sehen die folgende Ausgabe -

[2. 4. 6. 4.]
<NDArray 4 @cpu(0)>

Potenzierung

Example

nd.exp(x)

Output

Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:

[ 2.7182817 7.389056 20.085537 54.59815 ]
<NDArray 4 @cpu(0)>

Matrixtransponierung zur Berechnung des Matrix-Matrix-Produkts

Example

nd.dot(x, y.T)

Output

Unten ist die Ausgabe des Codes angegeben -

[16.]
<NDArray 1 @cpu(0)>

In-Place-Operationen

Jedes Mal, wenn wir im obigen Beispiel eine Operation ausgeführt haben, haben wir einen neuen Speicher zugewiesen, um das Ergebnis zu hosten.

Wenn wir beispielsweise A = A + B schreiben, dereferenzieren wir die Matrix, auf die A zeigte, und zeigen sie stattdessen auf den neu zugewiesenen Speicher. Lassen Sie es uns anhand des folgenden Beispiels verstehen, das die Funktion id () von Python verwendet -

print('y=', y)
print('id(y):', id(y))
y = y + x
print('after y=y+x, y=', y)
print('id(y):', id(y))

Output

Bei der Ausführung erhalten Sie folgende Ausgabe:

y=
[2. 2. 2. 1.]
<NDArray 4 @cpu(0)>
id(y): 2438905634376
after y=y+x, y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)>
id(y): 2438905685664

Tatsächlich können wir das Ergebnis auch wie folgt einem zuvor zugewiesenen Array zuweisen:

print('x=', x)
z = nd.zeros_like(x)
print('z is zeros_like x, z=', z)
print('id(z):', id(z))
print('y=', y)
z[:] = x + y
print('z[:] = x + y, z=', z)
print('id(z) is the same as before:', id(z))

Output

Die Ausgabe wird unten gezeigt -

x=
[1. 2. 3. 4.]
<NDArray 4 @cpu(0)>
z is zeros_like x, z=
[0. 0. 0. 0.]
<NDArray 4 @cpu(0)>
id(z): 2438905790760
y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)>
z[:] = x + y, z=
[4. 6. 8. 9.]
<NDArray 4 @cpu(0)>
id(z) is the same as before: 2438905790760

Aus der obigen Ausgabe können wir ersehen, dass x + y immer noch einen temporären Puffer zum Speichern des Ergebnisses zuweist, bevor es nach z kopiert wird. Jetzt können wir Vorgänge vor Ort ausführen, um den Speicher besser zu nutzen und temporären Puffer zu vermeiden. Zu diesem Zweck geben wir das Argument out keyword an, das jeder Operator unterstützt, wie folgt:

print('x=', x, 'is in id(x):', id(x))
print('y=', y, 'is in id(y):', id(y))
print('z=', z, 'is in id(z):', id(z))
nd.elemwise_add(x, y, out=z)
print('after nd.elemwise_add(x, y, out=z), x=', x, 'is in id(x):', id(x))
print('after nd.elemwise_add(x, y, out=z), y=', y, 'is in id(y):', id(y))
print('after nd.elemwise_add(x, y, out=z), z=', z, 'is in id(z):', id(z))

Output

Wenn Sie das obige Programm ausführen, erhalten Sie das folgende Ergebnis:

x=
[1. 2. 3. 4.]
<NDArray 4 @cpu(0)> is in id(x): 2438905791152
y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)> is in id(y): 2438905685664
z=
[4. 6. 8. 9.]
<NDArray 4 @cpu(0)> is in id(z): 2438905790760
after nd.elemwise_add(x, y, out=z), x=
[1. 2. 3. 4.]
<NDArray 4 @cpu(0)> is in id(x): 2438905791152
after nd.elemwise_add(x, y, out=z), y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)> is in id(y): 2438905685664
after nd.elemwise_add(x, y, out=z), z=
[4. 6. 8. 9.]
<NDArray 4 @cpu(0)> is in id(z): 2438905790760

NDArray-Kontexte

In Apache MXNet hat jedes Array einen Kontext und ein Kontext kann die CPU sein, während andere Kontexte mehrere GPUs sein können. Die Dinge können noch schlimmer werden, wenn wir die Arbeit auf mehreren Servern bereitstellen. Deshalb müssen wir Arrays intelligent Kontexte zuweisen. Dadurch wird der Zeitaufwand für die Datenübertragung zwischen Geräten minimiert.

Versuchen Sie beispielsweise, ein Array wie folgt zu initialisieren:

from mxnet import nd
z = nd.ones(shape=(3,3), ctx=mx.cpu(0))
print(z)

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]
<NDArray 3x3 @cpu(0)>

Wir können das angegebene NDArray von einem Kontext in einen anderen Kontext kopieren, indem wir die copyto () -Methode wie folgt verwenden:

x_gpu = x.copyto(gpu(0))
print(x_gpu)

NumPy-Array vs. NDArray

Wir alle kennen NumPy-Arrays, aber Apache MXNet bietet eine eigene Array-Implementierung namens NDArray an. Eigentlich war es ursprünglich so konzipiert, dass es NumPy ähnelt, aber es gibt einen entscheidenden Unterschied:

Der Hauptunterschied besteht in der Art und Weise, wie Berechnungen in NumPy und NDArray ausgeführt werden. Jede NDArray-Manipulation in MXNet erfolgt asynchron und nicht blockierend. Wenn wir also Code wie c = a * b schreiben, wird die Funktion an die gesendetExecution Engine, wodurch die Berechnung gestartet wird.

Hier sind a und b beide NDArrays. Der Vorteil der Verwendung besteht darin, dass die Funktion sofort zurückgegeben wird und der Benutzer-Thread die Ausführung fortsetzen kann, obwohl die vorherige Berechnung möglicherweise noch nicht abgeschlossen wurde.

Funktionsweise der Execution Engine

Wenn wir über die Funktionsweise der Ausführungs-Engine sprechen, wird das Berechnungsdiagramm erstellt. Das Berechnungsdiagramm kann einige Berechnungen neu anordnen oder kombinieren, berücksichtigt jedoch immer die Abhängigkeitsreihenfolge.

Wenn beispielsweise später im Programmiercode andere Manipulationen mit 'X' vorgenommen werden, beginnt die Execution Engine damit, sobald das Ergebnis von 'X' verfügbar ist. Die Ausführungs-Engine übernimmt einige wichtige Aufgaben für die Benutzer, z. B. das Schreiben von Rückrufen, um die Ausführung des nachfolgenden Codes zu starten.

In Apache MXNet müssen wir mit Hilfe von NDArray nur auf die resultierende Variable zugreifen, um das Ergebnis der Berechnung zu erhalten. Der Codefluss wird blockiert, bis die Berechnungsergebnisse der resultierenden Variablen zugewiesen sind. Auf diese Weise wird die Codeleistung erhöht, während der zwingende Programmiermodus weiterhin unterstützt wird.

Konvertieren von NDArray in NumPy Array

Lassen Sie uns lernen, wie wir NDArray in MXNet in NumPy Array konvertieren können.

Combining higher-level operator with the help of few lower-level operators

Manchmal können wir einen übergeordneten Operator mithilfe der vorhandenen Operatoren zusammenstellen. Eines der besten Beispiele dafür ist dasnp.full_like()Operator, der in der NDArray-API nicht vorhanden ist. Es kann wie folgt leicht durch eine Kombination vorhandener Operatoren ersetzt werden:

from mxnet import nd
import numpy as np
np_x = np.full_like(a=np.arange(7, dtype=int), fill_value=15)
nd_x = nd.ones(shape=(7,)) * 15
np.array_equal(np_x, nd_x.asnumpy())

Output

Wir werden die Ausgabe wie folgt erhalten -

True

Finding similar operator with different name and/or signature

Einige der Operatoren haben einen leicht unterschiedlichen Namen, sind jedoch hinsichtlich der Funktionalität ähnlich. Ein Beispiel dafür istnd.ravel_index() mit np.ravel()Funktionen. Auf die gleiche Weise haben einige Operatoren möglicherweise ähnliche Namen, aber unterschiedliche Signaturen. Ein Beispiel dafür istnp.split() und nd.split() sind ähnlich.

Lassen Sie es uns mit dem folgenden Programmierbeispiel verstehen:

def pad_array123(data, max_length):
data_expanded = data.reshape(1, 1, 1, data.shape[0])
data_padded = nd.pad(data_expanded,
mode='constant',
pad_width=[0, 0, 0, 0, 0, 0, 0, max_length - data.shape[0]],
constant_value=0)
data_reshaped_back = data_padded.reshape(max_length)
return data_reshaped_back
pad_array123(nd.array([1, 2, 3]), max_length=10)

Output

Die Ausgabe ist unten angegeben -

[1. 2. 3. 0. 0. 0. 0. 0. 0. 0.]
<NDArray 10 @cpu(0)>

Minimierung der Auswirkungen des Blockierens von Anrufen

In einigen Fällen müssen wir entweder verwenden .asnumpy() oder .asscalar()Methoden, aber dies zwingt MXNet, die Ausführung zu blockieren, bis das Ergebnis abgerufen werden kann. Wir können die Auswirkungen eines blockierenden Anrufs durch einen Anruf minimieren.asnumpy() oder .asscalar() Methoden in dem Moment, in dem wir denken, dass die Berechnung dieses Wertes bereits abgeschlossen ist.

Implementierungsbeispiel

Example

from __future__ import print_function
import mxnet as mx
from mxnet import gluon, nd, autograd
from mxnet.ndarray import NDArray
from mxnet.gluon import HybridBlock
import numpy as np

class LossBuffer(object):
   """
   Simple buffer for storing loss value
   """
   
   def __init__(self):
      self._loss = None

   def new_loss(self, loss):
      ret = self._loss
      self._loss = loss
      return ret

      @property
      def loss(self):
         return self._loss

net = gluon.nn.Dense(10)
ce = gluon.loss.SoftmaxCELoss()
net.initialize()
data = nd.random.uniform(shape=(1024, 100))
label = nd.array(np.random.randint(0, 10, (1024,)), dtype='int32')
train_dataset = gluon.data.ArrayDataset(data, label)
train_data = gluon.data.DataLoader(train_dataset, batch_size=128, shuffle=True, num_workers=2)
trainer = gluon.Trainer(net.collect_params(), optimizer='sgd')
loss_buffer = LossBuffer()
for data, label in train_data:
   with autograd.record():
      out = net(data)
      # This call saves new loss and returns previous loss
      prev_loss = loss_buffer.new_loss(ce(out, label))
   loss_buffer.loss.backward()
   trainer.step(data.shape[0])
   if prev_loss is not None:
      print("Loss: {}".format(np.mean(prev_loss.asnumpy())))

Output

Die Ausgabe wird unten zitiert:

Loss: 2.3373236656188965
Loss: 2.3656985759735107
Loss: 2.3613128662109375
Loss: 2.3197104930877686
Loss: 2.3054862022399902
Loss: 2.329197406768799
Loss: 2.318927526473999

Ein weiteres wichtiges MXNet Python-Paket ist Gluon. In diesem Kapitel werden wir dieses Paket diskutieren. Gluon bietet eine klare, präzise und einfache API für DL-Projekte. Es ermöglicht Apache MXNet, DL-Modelle zu prototypisieren, zu bauen und zu trainieren, ohne die Trainingsgeschwindigkeit zu beeinträchtigen.

Blöcke

Blöcke bilden die Grundlage für komplexere Netzwerkdesigns. In einem neuronalen Netzwerk müssen wir mit zunehmender Komplexität des neuronalen Netzwerks vom Entwurf einzelner zu ganzen Schichten von Neuronen übergehen. Zum Beispiel haben NN-Designs wie ResNet-152 einen sehr angemessenen Grad an Regelmäßigkeit, indem sie ausblocks von wiederholten Schichten.

Beispiel

In dem unten angegebenen Beispiel schreiben wir Code in einen einfachen Block, nämlich einen Block für ein mehrschichtiges Perzeptron.

from mxnet import nd
from mxnet.gluon import nn
x = nd.random.uniform(shape=(2, 20))
N_net = nn.Sequential()
N_net.add(nn.Dense(256, activation='relu'))
N_net.add(nn.Dense(10))
N_net.initialize()
N_net(x)

Output

Dies erzeugt die folgende Ausgabe:

[[ 0.09543004 0.04614332 -0.00286655 -0.07790346 -0.05130241 0.02942038
0.08696645 -0.0190793 -0.04122177 0.05088576]
[ 0.0769287 0.03099706 0.00856576 -0.044672 -0.06926838 0.09132431
0.06786592 -0.06187843 -0.03436674 0.04234696]]
<NDArray 2x10 @cpu(0)>

Schritte, die von der Definition von Ebenen zur Definition von Blöcken einer oder mehrerer Ebenen erforderlich sind -

Step 1 - Block nehmen die Daten als Eingabe.

Step 2- Jetzt speichern Blöcke den Status in Form von Parametern. Im obigen Codierungsbeispiel enthält der Block beispielsweise zwei verborgene Ebenen, und wir benötigen einen Speicherort für die Parameter.

Step 3- Der nächste Block ruft die Vorwärtsfunktion auf, um die Vorwärtsausbreitung durchzuführen. Es wird auch Vorwärtsberechnung genannt. Als Teil des ersten Weiterleitungsaufrufs initialisieren Blöcke die Parameter auf träge Weise.

Step 4- Zuletzt rufen die Blöcke die Rückwärtsfunktion auf und berechnen den Gradienten anhand ihrer Eingabe. In der Regel wird dieser Schritt automatisch ausgeführt.

Sequentieller Block

Ein sequentieller Block ist eine spezielle Art von Block, bei dem die Daten durch eine Folge von Blöcken fließen. Dabei wird jeder Block zuvor auf die Ausgabe von eins angewendet, wobei der erste Block auf die Eingabedaten selbst angewendet wird.

Mal sehen wie sequential Klasse funktioniert -

from mxnet import nd
from mxnet.gluon import nn
class MySequential(nn.Block):
   def __init__(self, **kwargs):
      super(MySequential, self).__init__(**kwargs)

   def add(self, block):
      self._children[block.name] = block
   def forward(self, x):
   for block in self._children.values():
      x = block(x)
   return x
x = nd.random.uniform(shape=(2, 20))
N_net = MySequential()
N_net.add(nn.Dense(256, activation
='relu'))
N_net.add(nn.Dense(10))
N_net.initialize()
N_net(x)

Output

Die Ausgabe wird hiermit gegeben -

[[ 0.09543004 0.04614332 -0.00286655 -0.07790346 -0.05130241 0.02942038
0.08696645 -0.0190793 -0.04122177 0.05088576]
[ 0.0769287 0.03099706 0.00856576 -0.044672 -0.06926838 0.09132431
0.06786592 -0.06187843 -0.03436674 0.04234696]]
<NDArray 2x10 @cpu(0)>

Benutzerdefinierter Block

Wir können leicht über die Verkettung mit dem oben definierten sequentiellen Block hinausgehen. Aber wenn wir Anpassungen vornehmen möchten, dann dieBlockKlasse bietet uns auch die erforderliche Funktionalität. Die Blockklasse verfügt über einen Modellkonstruktor, der im Modul nn bereitgestellt wird. Wir können diesen Modellkonstruktor erben, um das gewünschte Modell zu definieren.

Im folgenden Beispiel wird die MLP class überschreibt die __init__ und Weiterleitungsfunktionen der Block-Klasse.

Lassen Sie uns sehen, wie es funktioniert.

class MLP(nn.Block):

   def __init__(self, **kwargs):
      super(MLP, self).__init__(**kwargs)
      self.hidden = nn.Dense(256, activation='relu') # Hidden layer
      self.output = nn.Dense(10) # Output layer


   def forward(self, x):
      hidden_out = self.hidden(x)
      return self.output(hidden_out)
x = nd.random.uniform(shape=(2, 20))
N_net = MLP()
N_net.initialize()
N_net(x)

Output

Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:

[[ 0.07787763 0.00216403 0.01682201 0.03059879 -0.00702019 0.01668715
0.04822846 0.0039432 -0.09300035 -0.04494302]
[ 0.08891078 -0.00625484 -0.01619131 0.0380718 -0.01451489 0.02006172
0.0303478 0.02463485 -0.07605448 -0.04389168]]
<NDArray 2x10 @cpu(0)>

Benutzerdefinierte Ebenen

Die Gluon-API von Apache MXNet enthält eine bescheidene Anzahl vordefinierter Ebenen. Aber irgendwann stellen wir möglicherweise fest, dass eine neue Ebene benötigt wird. Wir können einfach eine neue Ebene in der Gluon-API hinzufügen. In diesem Abschnitt werden wir sehen, wie wir eine neue Ebene von Grund auf neu erstellen können.

Die einfachste benutzerdefinierte Ebene

Um eine neue Ebene in der Gluon-API zu erstellen, müssen wir eine Klasse erstellen, die von der Block-Klasse erbt und die grundlegendste Funktionalität bietet. Wir können alle vordefinierten Ebenen direkt oder über andere Unterklassen davon erben.

Zum Erstellen der neuen Ebene muss nur die Instanzmethode implementiert werden forward (self, x). Diese Methode definiert, was genau unsere Schicht während der Vorwärtsausbreitung tun wird. Wie bereits erwähnt, wird der Back-Propagation-Pass für Blöcke automatisch von Apache MXNet selbst ausgeführt.

Beispiel

Im folgenden Beispiel definieren wir eine neue Ebene. Wir werden auch implementierenforward() Methode zum Normalisieren der Eingabedaten durch Anpassen in einen Bereich von [0, 1].

from __future__ import print_function
import mxnet as mx
from mxnet import nd, gluon, autograd
from mxnet.gluon.nn import Dense
mx.random.seed(1)
class NormalizationLayer(gluon.Block):
   def __init__(self):
      super(NormalizationLayer, self).__init__()

   def forward(self, x):
      return (x - nd.min(x)) / (nd.max(x) - nd.min(x))
x = nd.random.uniform(shape=(2, 20))
N_net = NormalizationLayer()
N_net.initialize()
N_net(x)

Output

Wenn Sie das obige Programm ausführen, erhalten Sie das folgende Ergebnis:

[[0.5216355 0.03835821 0.02284337 0.5945146 0.17334817 0.69329053
0.7782702 1. 0.5508242 0. 0.07058554 0.3677264
0.4366546 0.44362497 0.7192635 0.37616986 0.6728799 0.7032008

 0.46907538 0.63514024]
[0.9157533 0.7667402 0.08980197   0.03593295 0.16176797 0.27679572
 0.07331014 0.3905285 0.6513384 0.02713427 0.05523694 0.12147208
 0.45582628 0.8139887 0.91629887 0.36665893 0.07873632 0.78268915
 0.63404864 0.46638715]]
 <NDArray 2x20 @cpu(0)>

Hybridisierung

Es kann als ein Prozess definiert werden, der von Apache MXNets verwendet wird, um einen symbolischen Graphen einer Vorwärtsberechnung zu erstellen. Durch die Hybridisierung kann MXNet die Rechenleistung durch Optimierung des rechnergestützten symbolischen Diagramms steigern. Anstatt direkt von zu erbenBlockIn der Tat können wir feststellen, dass während der Implementierung vorhandener Ebenen ein Block von a erbt HybridBlock.

Im Folgenden sind die Gründe dafür aufgeführt:

  • Allows us to write custom layers: Mit HybridBlock können wir benutzerdefinierte Ebenen schreiben, die sowohl in der imperativen als auch in der symbolischen Programmierung verwendet werden können.

  • Increase computation performance- HybridBlock optimiert den rechnergestützten symbolischen Graphen, wodurch MXNet die Rechenleistung steigern kann.

Beispiel

In diesem Beispiel schreiben wir unsere oben erstellte Beispielebene mithilfe von HybridBlock neu:

class NormalizationHybridLayer(gluon.HybridBlock):
   def __init__(self):
      super(NormalizationHybridLayer, self).__init__()

   def hybrid_forward(self, F, x):
      return F.broadcast_div(F.broadcast_sub(x, F.min(x)), (F.broadcast_sub(F.max(x), F.min(x))))

layer_hybd = NormalizationHybridLayer()
layer_hybd(nd.array([1, 2, 3, 4, 5, 6], ctx=mx.cpu()))

Output

Die Ausgabe ist unten angegeben:

[0. 0.2 0.4 0.6 0.8 1. ]
<NDArray 6 @cpu(0)>

Die Hybridisierung hat nichts mit der Berechnung auf der GPU zu tun, und man kann sowohl hybridisierte als auch nicht hybridisierte Netzwerke sowohl auf der CPU als auch auf der GPU trainieren.

Unterschied zwischen Block und HybridBlock

Wenn wir das vergleichen Block Klasse und HybridBlock, wir werden sehen HybridBlock hat schon seine forward() Methode implementiert. HybridBlock definiert a hybrid_forward()Methode, die beim Erstellen der Ebenen implementiert werden muss. Das Argument F erzeugt den Hauptunterschied zwischenforward() und hybrid_forward(). In der MXNet-Community wird das F-Argument als Backend bezeichnet. F kann sich entweder beziehenmxnet.ndarray API (für imperative Programmierung verwendet) oder mxnet.symbol API (wird für die symbolische Programmierung verwendet).

Wie füge ich einem Netzwerk eine benutzerdefinierte Ebene hinzu?

Anstatt benutzerdefinierte Ebenen separat zu verwenden, werden diese Ebenen mit vordefinierten Ebenen verwendet. Wir können entweder verwendenSequential oder HybridSequentialContainer aus einem sequentiellen neuronalen Netzwerk. Wie bereits erwähnt,Sequential Container erben von Block und HybridSequential geerbt von HybridBlock beziehungsweise.

Beispiel

Im folgenden Beispiel erstellen wir ein einfaches neuronales Netzwerk mit einer benutzerdefinierten Ebene. Die Ausgabe vonDense (5) Ebene wird die Eingabe von sein NormalizationHybridLayer. Die Ausgabe vonNormalizationHybridLayer wird die Eingabe von Dense (1) Schicht.

net = gluon.nn.HybridSequential()
with net.name_scope():
net.add(Dense(5))
net.add(NormalizationHybridLayer())
net.add(Dense(1))
net.initialize(mx.init.Xavier(magnitude=2.24))
net.hybridize()
input = nd.random_uniform(low=-10, high=10, shape=(10, 2))
net(input)

Output

Sie sehen die folgende Ausgabe -

[[-1.1272651]
 [-1.2299833]
 [-1.0662932]
 [-1.1805027]
 [-1.3382034]
 [-1.2081106]
 [-1.1263978]
 [-1.2524893]
 
 [-1.1044774]

 [-1.316593 ]]
<NDArray 10x1 @cpu(0)>

Benutzerdefinierte Ebenenparameter

In einem neuronalen Netzwerk ist einer Schicht eine Reihe von Parametern zugeordnet. Wir bezeichnen sie manchmal als Gewichte, was der interne Zustand einer Schicht ist. Diese Parameter spielen unterschiedliche Rollen -

  • Manchmal sind dies diejenigen, die wir während des Backpropagation-Schritts lernen möchten.

  • Manchmal sind dies nur Konstanten, die wir beim Vorwärtsdurchlauf verwenden möchten.

Wenn wir über das Programmierkonzept sprechen, werden diese Parameter (Gewichte) eines Blocks gespeichert und über abgerufen ParameterDict Klasse, die beim Initialisieren, Aktualisieren, Speichern und Laden hilft.

Beispiel

Im folgenden Beispiel definieren wir zwei folgende Parametersätze:

  • Parameter weights- Dies ist trainierbar und seine Form ist während der Bauphase unbekannt. Es wird beim ersten Durchlauf der Vorwärtsausbreitung abgeleitet.

  • Parameter scale- Dies ist eine Konstante, deren Wert sich nicht ändert. Im Gegensatz zu Parametergewichten wird seine Form während der Konstruktion definiert.

class NormalizationHybridLayer(gluon.HybridBlock):
   def __init__(self, hidden_units, scales):
      super(NormalizationHybridLayer, self).__init__()
      with self.name_scope():
      self.weights = self.params.get('weights',
      shape=(hidden_units, 0),
      allow_deferred_init=True)
      self.scales = self.params.get('scales',
         shape=scales.shape,
         init=mx.init.Constant(scales.asnumpy()),
         differentiable=False)
      def hybrid_forward(self, F, x, weights, scales):
         normalized_data = F.broadcast_div(F.broadcast_sub(x, F.min(x)),
         (F.broadcast_sub(F.max(x), F.min(x))))
         weighted_data = F.FullyConnected(normalized_data, weights, num_hidden=self.weights.shape[0], no_bias=True)
         scaled_data = F.broadcast_mul(scales, weighted_data)
return scaled_data

Dieses Kapitel befasst sich mit den Python-Paketen KVStore und Visualisierung.

KVStore-Paket

KV Stores steht für Key-Value Store. Es ist eine wichtige Komponente für das Training mit mehreren Geräten. Dies ist wichtig, da die Kommunikation von Parametern zwischen Geräten auf einem oder mehreren Computern über einen oder mehrere Server mit einem KVStore für die Parameter übertragen wird.

Lassen Sie uns die Arbeitsweise von KVStore anhand folgender Punkte verstehen:

  • Jeder Wert in KVStore wird durch a dargestellt key und ein value.

  • Jedem Parameterarray im Netzwerk ist a zugeordnet key und auf die Gewichte dieses Parameterarrays wird verwiesen value.

  • Danach die Worker-Knoten pushFarbverläufe nach der Bearbeitung einer Charge. Sie auchpull Aktualisierte Gewichte vor der Verarbeitung einer neuen Charge.

Mit einfachen Worten können wir sagen, dass KVStore ein Ort für den Datenaustausch ist, an dem jedes Gerät Daten ein- und ausziehen kann.

Daten Push-In und Pull-Out

KVStore kann als einzelnes Objekt betrachtet werden, das von verschiedenen Geräten wie GPUs und Computern gemeinsam genutzt wird, wobei jedes Gerät Daten ein- und ausziehen kann.

Im Folgenden sind die Implementierungsschritte aufgeführt, die von Geräten ausgeführt werden müssen, um Daten einzuschieben und herauszuziehen:

Implementierungsschritte

Initialisation- Der erste Schritt besteht darin, die Werte zu initialisieren. In unserem Beispiel initialisieren wir ein Paar (int, NDArray) in KVStrore und ziehen danach die Werte heraus -

import mxnet as mx
kv = mx.kv.create('local') # create a local KVStore.
shape = (3,3)
kv.init(3, mx.nd.ones(shape)*2)
a = mx.nd.zeros(shape)
kv.pull(3, out = a)
print(a.asnumpy())

Output

Dies erzeugt die folgende Ausgabe -

[[2. 2. 2.]
[2. 2. 2.]
[2. 2. 2.]]

Push, Aggregate, and Update - Nach der Initialisierung können wir einen neuen Wert mit der gleichen Form auf den Schlüssel in den KVStore übertragen. -

kv.push(3, mx.nd.ones(shape)*8)
kv.pull(3, out = a)
print(a.asnumpy())

Output

Die Ausgabe ist unten angegeben -

[[8. 8. 8.]
 [8. 8. 8.]
 [8. 8. 8.]]

Die zum Pushen verwendeten Daten können auf jedem Gerät wie GPUs oder Computern gespeichert werden. Wir können auch mehrere Werte in dieselbe Taste drücken. In diesem Fall summiert der KVStore zuerst alle diese Werte und überträgt dann den aggregierten Wert wie folgt:

contexts = [mx.cpu(i) for i in range(4)]
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.push(3, b)
kv.pull(3, out = a)
print(a.asnumpy())

Output

Sie sehen die folgende Ausgabe -

[[4. 4. 4.]
 [4. 4. 4.]
 [4. 4. 4.]]

Für jeden Push, den Sie angewendet haben, kombiniert KVStore den Push-Wert mit dem bereits gespeicherten Wert. Dies erfolgt mit Hilfe eines Updaters. Hier ist der Standard-Updater ASSIGN.

def update(key, input, stored):
   print("update on key: %d" % key)
   
   stored += input * 2
kv.set_updater(update)
kv.pull(3, out=a)
print(a.asnumpy())

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[[4. 4. 4.]
 [4. 4. 4.]
 [4. 4. 4.]]

Example

kv.push(3, mx.nd.ones(shape))
kv.pull(3, out=a)
print(a.asnumpy())

Output

Unten ist die Ausgabe des Codes angegeben -

update on key: 3
[[6. 6. 6.]
 [6. 6. 6.]
 [6. 6. 6.]]

Pull - Wie bei Push können wir den Wert auch mit einem einzigen Aufruf wie folgt auf mehrere Geräte übertragen: -

b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.pull(3, out = b)
print(b[1].asnumpy())

Output

Die Ausgabe ist unten angegeben -

[[6. 6. 6.]
 [6. 6. 6.]
 [6. 6. 6.]]

Vollständiges Implementierungsbeispiel

Im Folgenden finden Sie das vollständige Implementierungsbeispiel -

import mxnet as mx
kv = mx.kv.create('local')
shape = (3,3)
kv.init(3, mx.nd.ones(shape)*2)
a = mx.nd.zeros(shape)
kv.pull(3, out = a)
print(a.asnumpy())
kv.push(3, mx.nd.ones(shape)*8)
kv.pull(3, out = a) # pull out the value
print(a.asnumpy())
contexts = [mx.cpu(i) for i in range(4)]
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.push(3, b)
kv.pull(3, out = a)
print(a.asnumpy())
def update(key, input, stored):
   print("update on key: %d" % key)
   stored += input * 2
kv._set_updater(update)
kv.pull(3, out=a)
print(a.asnumpy())
kv.push(3, mx.nd.ones(shape))
kv.pull(3, out=a)
print(a.asnumpy())
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.pull(3, out = b)
print(b[1].asnumpy())

Umgang mit Schlüsselwertpaaren

Alle oben implementierten Vorgänge umfassen einen einzelnen Schlüssel, aber KVStore bietet auch eine Schnittstelle für a list of key-value pairs - -

Für ein einzelnes Gerät

Das folgende Beispiel zeigt eine KVStore-Schnittstelle für eine Liste von Schlüssel-Wert-Paaren für ein einzelnes Gerät:

keys = [5, 7, 9]
kv.init(keys, [mx.nd.ones(shape)]*len(keys))
kv.push(keys, [mx.nd.ones(shape)]*len(keys))
b = [mx.nd.zeros(shape)]*len(keys)
kv.pull(keys, out = b)
print(b[1].asnumpy())

Output

Sie erhalten folgende Ausgabe:

update on key: 5
update on key: 7
update on key: 9
[[3. 3. 3.]
 [3. 3. 3.]
 [3. 3. 3.]]

Für mehrere Geräte

Das folgende Beispiel zeigt eine KVStore-Schnittstelle für eine Liste von Schlüssel-Wert-Paaren für mehrere Geräte:

b = [[mx.nd.ones(shape, ctx) for ctx in contexts]] * len(keys)
kv.push(keys, b)
kv.pull(keys, out = b)
print(b[1][1].asnumpy())

Output

Sie sehen die folgende Ausgabe -

update on key: 5
update on key: 7
update on key: 9
[[11. 11. 11.]
 [11. 11. 11.]
 [11. 11. 11.]]

Visualisierungspaket

Das Visualisierungspaket ist ein Apache MXNet-Paket, mit dem das neuronale Netzwerk (NN) als Berechnungsdiagramm dargestellt wird, das aus Knoten und Kanten besteht.

Visualisieren Sie das neuronale Netzwerk

Im folgenden Beispiel werden wir verwenden mx.viz.plot_networkneuronales Netzwerk zu visualisieren. Folgendes sind die Voraussetzungen dafür -

Prerequisites

  • Jupyter Notizbuch

  • Graphviz-Bibliothek

Implementierungsbeispiel

Im folgenden Beispiel werden wir ein Beispiel NN für die lineare Matrixfaktorisierung visualisieren -

import mxnet as mx
user = mx.symbol.Variable('user')
item = mx.symbol.Variable('item')
score = mx.symbol.Variable('score')

# Set the dummy dimensions
k = 64
max_user = 100
max_item = 50

# The user feature lookup
user = mx.symbol.Embedding(data = user, input_dim = max_user, output_dim = k)

# The item feature lookup
item = mx.symbol.Embedding(data = item, input_dim = max_item, output_dim = k)

# predict by the inner product and then do sum
N_net = user * item
N_net = mx.symbol.sum_axis(data = N_net, axis = 1)
N_net = mx.symbol.Flatten(data = N_net)

# Defining the loss layer
N_net = mx.symbol.LinearRegressionOutput(data = N_net, label = score)

# Visualize the network
mx.viz.plot_network(N_net)

In diesem Kapitel wird die ndarray-Bibliothek erläutert, die in Apache MXNet verfügbar ist.

Mxnet.ndarray

Die NDArray-Bibliothek von Apache MXNet definiert den Kern-DS (Datenstrukturen) für alle mathematischen Berechnungen. Zwei grundlegende Aufgaben von NDArray sind:

  • Es unterstützt die schnelle Ausführung auf einer Vielzahl von Hardwarekonfigurationen.

  • Es parallelisiert automatisch mehrere Vorgänge über die verfügbare Hardware.

Das folgende Beispiel zeigt, wie ein NDArray mithilfe eines 1-D- und 2-D-Arrays aus einer regulären Python-Liste erstellt werden kann.

import mxnet as mx
from mxnet import nd

x = nd.array([1,2,3,4,5,6,7,8,9,10])
print(x)

Output

Die Ausgabe ist unten angegeben:

[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
<NDArray 10 @cpu(0)>

Example

y = nd.array([[1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10]])
print(y)

Output

Dies erzeugt die folgende Ausgabe -

[[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
 [ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
 [ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]]
<NDArray 3x10 @cpu(0)>

Lassen Sie uns nun die Klassen, Funktionen und Parameter der ndarray-API von MXNet ausführlich diskutieren.

Klassen

Die folgende Tabelle enthält die Klassen der ndarray-API von MXNet -

Klasse Definition
CachedOp (sym [, flags]) Es wird für das zwischengespeicherte Bedienerhandle verwendet.
NDArray (handle [, beschreibbar]) Es wird als Array-Objekt verwendet, das ein mehrdimensionales, homogenes Array von Elementen fester Größe darstellt.

Funktionen und ihre Parameter

Im Folgenden sind einige wichtige Funktionen und deren Parameter aufgeführt, die von der API mxnet.ndarray abgedeckt werden:

Funktion und ihre Parameter Definition
Activation([data, act_type, out, name]) Es wendet eine Aktivierungsfunktion elementweise auf den Eingang an. Es unterstützt die Aktivierungsfunktionen relu, sigmoid, tanh, softrelu und softsign.
BatchNorm([Daten, Gamma, Beta, Moving_Mean,…]) Es wird zur Chargennormalisierung verwendet. Diese Funktion normalisiert einen Datenstapel nach Mittelwert und Varianz. Es wird eine Skala Gamma und Offset Beta angewendet.
BilinearSampler([Daten, Raster, cudnn_off,…])

Diese Funktion wendet eine bilineare Abtastung auf die Eingabe-Feature-Map an. Eigentlich ist es der Schlüssel von "Spatial Transformer Networks".

Wenn Sie mit der Remap-Funktion in OpenCV vertraut sind, ist die Verwendung dieser Funktion der sehr ähnlich. Der einzige Unterschied ist, dass es den Rückwärtspass hat.

BlockGrad ([Daten, Out, Name]) Wie der Name schon sagt, stoppt diese Funktion die Gradientenberechnung. Grundsätzlich wird verhindert, dass der akkumulierte Gradient der Eingaben durch diesen Operator in Rückwärtsrichtung fließt.
cast ([Daten, Typ, Out, Name]) Diese Funktion wandelt alle Elemente der Eingabe in einen neuen Typ um.

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir die Funktion BilinierSampler (), um die Daten zweimal herauszuzoomen und die Daten horizontal um -1 Pixel zu verschieben.

import mxnet as mx
from mxnet import nd
data = nd.array([[[[2, 5, 3, 6],
   [1, 8, 7, 9],
   [0, 4, 1, 8],
   [2, 0, 3, 4]]]])
affine_matrix = nd.array([[2, 0, 0],
   [0, 2, 0]])

affine_matrix = nd.reshape(affine_matrix, shape=(1, 6))

grid = nd.GridGenerator(data=affine_matrix, transform_type='affine', target_shape=(4, 4))

output = nd.BilinearSampler(data, grid)

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[[[[0. 0. 0. 0. ]
   [0. 4.0000005 6.25 0. ]
   [0. 1.5 4. 0. ]
   [0. 0. 0. 0. ]]]]
<NDArray 1x1x4x4 @cpu(0)>

Die obige Ausgabe zeigt das zweimalige Verkleinern von Daten.

Ein Beispiel für die Verschiebung der Daten um -1 Pixel ist wie folgt:

import mxnet as mx
from mxnet import nd
data = nd.array([[[[2, 5, 3, 6],
   [1, 8, 7, 9],
   [0, 4, 1, 8],
   [2, 0, 3, 4]]]])
warp_matrix = nd.array([[[[1, 1, 1, 1],
   [1, 1, 1, 1],
   [1, 1, 1, 1],
   [1, 1, 1, 1]],
   [[0, 0, 0, 0],
   [0, 0, 0, 0],
   [0, 0, 0, 0],
   [0, 0, 0, 0]]]])
grid = nd.GridGenerator(data=warp_matrix, transform_type='warp')
output = nd.BilinearSampler(data, grid)

Output

Die Ausgabe ist unten angegeben -

[[[[5. 3. 6. 0.]
[8. 7. 9. 0.]
[4. 1. 8. 0.]
[0. 3. 4. 0.]]]]
<NDArray 1x1x4x4 @cpu(0)>

In ähnlicher Weise zeigt das folgende Beispiel die Verwendung der Funktion cast () -

nd.cast(nd.array([300, 10.1, 15.4, -1, -2]), dtype='uint8')

Output

Bei der Ausführung erhalten Sie folgende Ausgabe:

[ 44 10 15 255 254]
<NDArray 5 @cpu(0)>

ndarray.contrib

Die Contrib NDArray-API ist im Paket ndarray.contrib definiert. Es bietet normalerweise viele nützliche experimentelle APIs für neue Funktionen. Diese API dient als Ort für die Community, an dem sie die neuen Funktionen ausprobieren kann. Der Feature-Mitwirkende erhält ebenfalls das Feedback.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.contrib API - -

Funktion und ihre Parameter Definition
rand_zipfian(true_classes, num_sampled,…) Diese Funktion zieht Zufallsstichproben aus einer ungefähren Zipfian-Verteilung. Die Basisverteilung dieser Funktion ist die Zipfian-Verteilung. Diese Funktion tastet zufällig num_sampled Kandidaten ab und die Elemente von sampled_candidates werden aus der oben angegebenen Basisverteilung gezogen.
foreach(body, data, init_states) Wie der Name schon sagt, führt diese Funktion eine for-Schleife mit benutzerdefinierter Berechnung über NDArrays in Dimension 0 aus. Diese Funktion simuliert eine for-Schleife und body hat die Berechnung für eine Iteration der for-Schleife.
while_loop (cond, func, loop_vars [,…]) Wie der Name schon sagt, führt diese Funktion eine while-Schleife mit benutzerdefinierter Berechnung und Schleifenbedingung aus. Diese Funktion simuliert eine while-Schleife, die literarisch benutzerdefinierte Berechnungen durchführt, wenn die Bedingung erfüllt ist.
cond(pred, then_func, else_func) Wie der Name schon sagt, führt diese Funktion ein Wenn-Dann-Sonst unter Verwendung einer benutzerdefinierten Bedingung und Berechnung aus. Diese Funktion simuliert einen if-ähnlichen Zweig, der eine der beiden benutzerdefinierten Berechnungen gemäß der angegebenen Bedingung ausführt.
isinf(Daten) Diese Funktion führt eine elementweise Überprüfung durch, um festzustellen, ob das NDArray ein unendliches Element enthält oder nicht.
getnnz([Daten, Achse, Ausgang, Name]) Diese Funktion gibt uns die Anzahl der gespeicherten Werte für einen spärlichen Tensor an. Es enthält auch explizite Nullen. Es unterstützt nur die CSR-Matrix auf der CPU.
Requantize ([Daten, min_range, max_range,…]) Diese Funktion benötigt die angegebenen Daten, die in int32 und den entsprechenden Schwellenwerten quantisiert sind, in int8 unter Verwendung von minimalen und maximalen Schwellenwerten, die entweder zur Laufzeit oder aus der Kalibrierung berechnet werden.

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir die Funktion rand_zipfian, um Zufallsstichproben aus einer ungefähren Zipfian-Verteilung zu ziehen.

import mxnet as mx
from mxnet import nd
trueclass = mx.nd.array([2])
samples, exp_count_true, exp_count_sample = mx.nd.contrib.rand_zipfian(trueclass, 3, 4)
samples

Output

Sie sehen die folgende Ausgabe -

[0 0 1]
<NDArray 3 @cpu(0)>

Example

exp_count_true

Output

Die Ausgabe ist unten angegeben:

[0.53624076]
<NDArray 1 @cpu(0)>

Example

exp_count_sample

Output

Dies erzeugt die folgende Ausgabe:

[1.29202967 1.29202967 0.75578891]
<NDArray 3 @cpu(0)>

Im folgenden Beispiel verwenden wir die Funktion while_loop zum Ausführen einer while-Schleife für benutzerdefinierte Berechnungen und Schleifenbedingungen:

cond = lambda i, s: i <= 7
func = lambda i, s: ([i + s], [i + 1, s + i])
loop_var = (mx.nd.array([0], dtype="int64"), mx.nd.array([1], dtype="int64"))
outputs, states = mx.nd.contrib.while_loop(cond, func, loop_vars, max_iterations=10)
outputs

Output

Die Ausgabe wird unten gezeigt -

[
[[       1]
 [      2]
 [      4]
 [      7]
 [     11]
 [     16]
 [     22]
 [     29]
 [3152434450384]
 [     257]]
<NDArray 10x1 @cpu(0)>]

Example

States

Output

Dies erzeugt die folgende Ausgabe -

[
[8]
<NDArray 1 @cpu(0)>,
[29]
<NDArray 1 @cpu(0)>]

ndarray.image

Die Image NDArray-API ist im Paket ndarray.image definiert. Wie der Name schon sagt, wird es normalerweise für Bilder und deren Funktionen verwendet.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.image API- -

Funktion und ihre Parameter Definition
adjust_lighting([Daten, Alpha, Out, Name]) Wie der Name schon sagt, passt diese Funktion die Beleuchtungsstärke des Eingangs an. Es folgt dem AlexNet-Stil.
crop([Daten, x, y, Breite, Höhe, Out, Name]) Mit Hilfe dieser Funktion können wir ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zuschneiden.
normalize([Daten, Mittelwert, Standard, Out, Name]) Es wird ein Tensor der Form (C x H x B) oder (N x C x H x B) mit normalisiert mean und standard deviation(SD).
random_crop ([Daten, x-Bereich, y-Bereich, Breite,…]) Ähnlich wie beim Zuschneiden () wird zufällig ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zugeschnitten. Das Ergebnis wird aktualisiert, wenn src kleiner als die Größe ist.
random_lighting([data, alpha_std, out, name]) Wie der Name schon sagt, fügt diese Funktion das PCA-Rauschen zufällig hinzu. Es folgt auch dem AlexNet-Stil.
random_resized_crop([data, xrange, yrange,…]) Es schneidet auch ein Bild zufällig NDArray der Form (H x B x C) oder (N x H x B x C) auf die angegebene Größe. Das Ergebnis wird aktualisiert, wenn src kleiner als die Größe ist. Es wird auch die Flächen- und Seitenration zufällig sortieren.
resize([Daten, Größe, keep_ratio, interp,…]) Wie der Name schon sagt, ändert diese Funktion die Größe eines Bild-NDArrays der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe.
to_tensor([Daten, Out, Name]) Es konvertiert ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray der Form (C x H x B) oder ( N x C x H x B) mit den Werten im Bereich [0, 1].

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir die Funktion to_tensor, um das Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray umzuwandeln der Form (C x H x B) oder (N x C x H x B) mit den Werten im Bereich [0, 1].

import numpy as np
img = mx.nd.random.uniform(0, 255, (4, 2, 3)).astype(dtype=np.uint8)
mx.nd.image.to_tensor(img)

Output

Sie sehen die folgende Ausgabe -

[[[0.972549 0.5058824 ]
   [0.6039216 0.01960784]
   [0.28235295 0.35686275]
   [0.11764706 0.8784314 ]]

[[0.8745098 0.9764706 ]
   [0.4509804 0.03529412]
   [0.9764706 0.29411766]
   [0.6862745 0.4117647 ]]

[[0.46666667 0.05490196]
   [0.7372549 0.4392157 ]
   [0.11764706 0.47843137]
   [0.31764707 0.91764706]]]
<NDArray 3x4x2 @cpu(0)>

Example

img = mx.nd.random.uniform(0, 255, (2, 4, 2, 3)).astype(dtype=np.uint8)

mx.nd.image.to_tensor(img)

Output

Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:

[[[[0.0627451 0.5647059 ]
[0.2627451 0.9137255 ]
[0.57254905 0.27450982]
[0.6666667 0.64705884]]
[[0.21568628 0.5647059 ]
[0.5058824 0.09019608]
[0.08235294 0.31764707]
[0.8392157 0.7137255 ]]
[[0.6901961 0.8627451 ]
[0.52156866 0.91764706]
[0.9254902 0.00784314]
[0.12941177 0.8392157 ]]]
[[[0.28627452 0.39607844]
[0.01960784 0.36862746]
[0.6745098 0.7019608 ]
[0.9607843 0.7529412 ]]
[[0.2627451 0.58431375]
[0.16470589 0.00392157]
[0.5686275 0.73333335]
[0.43137255 0.57254905]]
[[0.18039216 0.54901963]
[0.827451 0.14509805]
[0.26666668 0.28627452]
[0.24705882 0.39607844]]]]
<NDArgt;ray 2x3x4x2 @cpu(0)>

Im folgenden Beispiel verwenden wir die Funktion normalize einen Tensor der Form (C x H x B) oder (N x C x H x B) mit zu normalisieren mean und standard deviation(SD).

img = mx.nd.random.uniform(0, 1, (3, 4, 2))

mx.nd.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))

Output

Dies erzeugt die folgende Ausgabe -

[[[ 0.29391178 0.3218054 ]
[ 0.23084386 0.19615503]
[ 0.24175143 0.21988946]
[ 0.16710812 0.1777354 ]]
[[-0.02195817 -0.3847335 ]
[-0.17800489 -0.30256534]
[-0.28807247 -0.19059572]
[-0.19680339 -0.26256624]]
[[-1.9808068 -1.5298678 ]
[-1.6984252 -1.2839255 ]
[-1.3398265 -1.712009 ]
[-1.7099224 -1.6165378 ]]]
<NDArray 3x4x2 @cpu(0)>

Example

img = mx.nd.random.uniform(0, 1, (2, 3, 4, 2))

mx.nd.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[[[[ 2.0600514e-01 2.4972327e-01]
[ 1.4292289e-01 2.9281738e-01]
[ 4.5158025e-02 3.4287784e-02]
[ 9.9427439e-02 3.0791296e-02]]
[[-2.1501756e-01 -3.2297665e-01]
[-2.0456362e-01 -2.2409186e-01]
[-2.1283737e-01 -4.8318747e-01]
[-1.7339960e-01 -1.5519112e-02]]
[[-1.3478968e+00 -1.6790028e+00]
[-1.5685816e+00 -1.7787373e+00]
[-1.1034534e+00 -1.8587360e+00]
[-1.6324382e+00 -1.9027401e+00]]]
[[[ 1.4528830e-01 3.2801408e-01]
[ 2.9730779e-01 8.6780310e-02]
[ 2.6873133e-01 1.7900752e-01]
[ 2.3462953e-01 1.4930873e-01]]
[[-4.4988656e-01 -4.5021546e-01]
[-4.0258706e-02 -3.2384416e-01]
[-1.4287934e-01 -2.6537544e-01]
[-5.7649612e-04 -7.9429924e-02]]
[[-1.8505517e+00 -1.0953522e+00]
[-1.1318740e+00 -1.9624406e+00]
[-1.8375070e+00 -1.4916846e+00]
[-1.3844404e+00 -1.8331525e+00]]]]
<NDArray 2x3x4x2 @cpu(0)>

ndarray.random

Die zufällige NDArray-API ist im Paket ndarray.random definiert. Wie der Name schon sagt, handelt es sich um die NDArray-API des Zufallsverteilungsgenerators von MXNet.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.random API - -

Funktion und ihre Parameter Definition
Uniform ([niedrig, hoch, Form, dtype, ctx, out]) Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung generiert.
normal ([loc, scale, shape, dtype, ctx, out]) Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert.
randn (* form, ** kwargs) Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert.
exponentiell ([Skala, Form, dtype, ctx, out]) Es werden Stichproben aus einer Exponentialverteilung generiert.
Gamma ([Alpha, Beta, Form, D-Typ, Ctx, Out]) Aus einer Gammaverteilung werden Zufallsstichproben generiert.
multinomial (Daten [, Form, get_prob, out, dtype]) Es generiert eine gleichzeitige Abtastung aus mehreren Multinomialverteilungen.
negative_binomial ([k, p, Form, dtype, ctx, out]) Es werden Zufallsstichproben aus einer negativen Binomialverteilung generiert.
generalized_negative_binomial ([mu, alpha,…]) Es generiert Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung.
mischen (Daten, ** kwargs) Die Elemente werden zufällig gemischt.
Randint (niedrig, hoch [, Form, Typ, Ctx, out]) Es werden Zufallsstichproben aus einer diskreten Gleichverteilung generiert.
exponentiell_ähnlich ([data, lam, out, name]) Es werden Zufallsstichproben aus einer Exponentialverteilung gemäß der Form des Eingabearrays generiert.
gamma_like ([Daten, Alpha, Beta, Out, Name]) Es werden Zufallsstichproben aus einer Gammaverteilung gemäß der Form des Eingabearrays generiert.
generalized_negative_binomial_like ([Daten,…]) Es werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gemäß der Form des Eingabearrays generiert.
negative_binomial_like ([Daten, k, p, out, Name]) Es werden Zufallsstichproben aus einer negativen Binomialverteilung entsprechend der Form des Eingabearrays generiert.
normal_like ([Daten, Ort, Skalierung, Out, Name]) Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) entsprechend der Form des Eingabearrays generiert.
poisson_like ([Daten, Lam, Out, Name]) Es werden Zufallsstichproben aus einer Poisson-Verteilung entsprechend der Form des Eingabearrays generiert.
uniform_like ([Daten, niedrig, hoch, out, Name]) Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung entsprechend der Form des Eingabearrays generiert.

Implementierungsbeispiele

Im folgenden Beispiel werden Zufallsstichproben aus einer gleichmäßigen Verteilung gezogen. Hierfür wird die Funktion verwendetuniform().

mx.nd.random.uniform(0, 1)

Output

Die Ausgabe wird unten erwähnt -

[0.12381998]
<NDArray 1 @cpu(0)>

Example

mx.nd.random.uniform(-1, 1, shape=(2,))

Output

Die Ausgabe ist unten angegeben -

[0.558102 0.69601643]
<NDArray 2 @cpu(0)>

Example

low = mx.nd.array([1,2,3])
high = mx.nd.array([2,3,4])
mx.nd.random.uniform(low, high, shape=2)

Output

Sie sehen die folgende Ausgabe -

[[1.8649333 1.8073189]
 [2.4113967 2.5691009]
 [3.1399727 3.4071832]]
<NDArray 3x2 @cpu(0)>

Im folgenden Beispiel werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gezogen. Dafür werden wir die Funktion verwendengeneralized_negative_binomial().

mx.nd.random.generalized_negative_binomial(10, 0.5)

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[1.]
<NDArray 1 @cpu(0)>

Example

mx.nd.random.generalized_negative_binomial(10, 0.5, shape=(2,))

Output

Die Ausgabe wird hiermit gegeben -

[16. 23.]
<NDArray 2 @cpu(0)>

Example

mu = mx.nd.array([1,2,3])
alpha = mx.nd.array([0.2,0.4,0.6])
mx.nd.random.generalized_negative_binomial(mu, alpha, shape=2)

Output

Unten ist die Ausgabe des Codes angegeben -

[[0. 0.]
 [4. 1.]
 [9. 3.]]
<NDArray 3x2 @cpu(0)>

ndarray.utils

Das Dienstprogramm NDArray API ist im Paket ndarray.utils definiert. Wie der Name schon sagt, bietet es die Dienstprogrammfunktionen für NDArray und BaseSparseNDArray.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.utils API - -

Funktion und ihre Parameter Definition
Nullen (Form [, ctx, dtype, stype]) Diese Funktion gibt ein neues Array mit einer bestimmten Form und einem bestimmten Typ zurück, das mit Nullen gefüllt ist.
leer (Form [, ctx, dtype, stype]) Es wird ein neues Array mit der angegebenen Form und dem angegebenen Typ zurückgegeben, ohne dass Einträge initialisiert werden müssen.
Array (source_array [, ctx, dtype]) Wie der Name schon sagt, erstellt diese Funktion ein Array aus jedem Objekt, das die Array-Schnittstelle verfügbar macht.
Laden (fname) Es wird ein Array aus einer Datei geladen.
load_frombuffer (buf) Wie der Name schon sagt, lädt diese Funktion ein Array-Wörterbuch oder eine Liste aus einem Puffer
speichern (fname, Daten) Diese Funktion speichert eine Liste von Arrays oder ein Diktat von str-> array in einer Datei.

Implementierungsbeispiele

Im folgenden Beispiel geben wir ein neues Array mit einer bestimmten Form und einem bestimmten Typ zurück, das mit Nullen gefüllt ist. Dafür werden wir die Funktion verwendenzeros().

mx.nd.zeros((1,2), mx.cpu(), stype='csr')

Output

Dies erzeugt die folgende Ausgabe -

<CSRNDArray 1x2 @cpu(0)>

Example

mx.nd.zeros((1,2), mx.cpu(), 'float16', stype='row_sparse').asnumpy()

Output

Sie erhalten folgende Ausgabe:

array([[0., 0.]], dtype=float16)

Im folgenden Beispiel speichern wir eine Liste von Arrays und ein Wörterbuch von Zeichenfolgen. Dafür werden wir die Funktion verwendensave().

Example

x = mx.nd.zeros((2,3))
y = mx.nd.ones((1,4))
mx.nd.save('list', [x,y])
mx.nd.save('dict', {'x':x, 'y':y})
mx.nd.load('list')

Output

Bei der Ausführung erhalten Sie folgende Ausgabe:

[
[[0. 0. 0.]
[0. 0. 0.]]
<NDArray 2x3 @cpu(0)>,
[[1. 1. 1. 1.]]
<NDArray 1x4 @cpu(0)>]

Example

mx.nd.load('my_dict')

Output

Die Ausgabe wird unten gezeigt -

{'x':
[[0. 0. 0.]
[0. 0. 0.]]
<NDArray 2x3 @cpu(0)>, 'y':
[[1. 1. 1. 1.]]
<NDArray 1x4 @cpu(0)>}

Wie wir bereits in früheren Kapiteln besprochen haben, bietet MXNet Gluon eine klare, präzise und einfache API für DL-Projekte. Es ermöglicht Apache MXNet, DL-Modelle zu prototypisieren, zu bauen und zu trainieren, ohne die Trainingsgeschwindigkeit zu beeinträchtigen.

Kern Module

Lassen Sie uns die Kernmodule von Apache MXNet Python API (Application Programming Interface) lernen.

gluon.nn

Gluon bietet eine große Anzahl integrierter NN-Schichten im Modul gluon.nn. Aus diesem Grund wird es als Kernmodul bezeichnet.

Methoden und ihre Parameter

Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.nn Kernmodul -

Methoden und ihre Parameter Definition
Aktivierung (Aktivierung, ** kwargs) Wie der Name schon sagt, wendet diese Methode eine Aktivierungsfunktion auf die Eingabe an.
AvgPool1D ([pool_size, Schritte, Polsterung,…]) Dies ist eine durchschnittliche Pooling-Operation für zeitliche Daten.
AvgPool2D ([pool_size, strides, padding,…]) Dies ist eine durchschnittliche Pooloperation für räumliche Daten.
AvgPool3D ([pool_size, Schritte, Polsterung,…]) Dies ist die durchschnittliche Pooloperation für 3D-Daten. Die Daten können räumlich oder räumlich-zeitlich sein.
BatchNorm ([Achse, Impuls, Epsilon, Mitte,…]) Es repräsentiert die Chargennormalisierungsschicht.
BatchNormReLU ([Achse, Impuls, Epsilon,…]) Es stellt auch die Batch-Normalisierungsschicht dar, jedoch mit Relu-Aktivierungsfunktion.
Block ([Präfix, Parameter]) Es gibt die Basisklasse für alle neuronalen Netzwerkschichten und -modelle an.
Conv1D (Kanäle, kernel_size [, Schritte,…]) Dieses Verfahren wird für die 1-D-Faltungsschicht verwendet. Zum Beispiel zeitliche Faltung.
Conv1DTranspose (Kanäle, kernel_size [,…]) Dieses Verfahren wird für die transponierte 1D-Faltungsschicht verwendet.
Conv2D (Kanäle, kernel_size [, Schritte,…]) Diese Methode wird für die 2D-Faltungsschicht verwendet. Zum Beispiel räumliche Faltung über Bildern).
Conv2DTranspose (Kanäle, kernel_size [,…]) Diese Methode wird für die transponierte 2D-Faltungsschicht verwendet.
Conv3D (Kanäle, kernel_size [, Schritte,…]) Diese Methode wird für die 3D-Faltungsschicht verwendet. Zum Beispiel räumliche Faltung über Volumina.
Conv3DTranspose (Kanäle, kernel_size [,…]) Diese Methode wird für die transponierte 3D-Faltungsschicht verwendet.
Dicht (Einheiten [, Aktivierung, use_bias,…]) Diese Methode steht für Ihre reguläre dicht verbundene NN-Schicht.
Ausfall (Rate [, Achsen]) Wie der Name schon sagt, wendet die Methode Dropout auf die Eingabe an.
ELU (& agr;) Diese Methode wird für die Exponential Linear Unit (ELU) verwendet.
Einbetten (input_dim, output_dim [, dtype,…]) Nicht negative ganze Zahlen werden in dichte Vektoren fester Größe umgewandelt.
Abflachen (** kwargs) Diese Methode glättet die Eingabe auf 2-D.
GELU (** kwargs) Diese Methode wird für die Gaußsche Exponential Linear Unit (GELU) verwendet.
GlobalAvgPool1D ([Layout]) Mit Hilfe dieser Methode können wir globale durchschnittliche Pooling-Operationen für zeitliche Daten durchführen.
GlobalAvgPool2D ([Layout]) Mit Hilfe dieser Methode können wir globale durchschnittliche Pooling-Operationen für räumliche Daten durchführen.
GlobalAvgPool3D ([Layout]) Mit Hilfe dieser Methode können wir globale durchschnittliche Pooling-Operationen für 3D-Daten durchführen.
GlobalMaxPool1D ([Layout]) Mit Hilfe dieser Methode können wir globale Max-Pooling-Operationen für 1-D-Daten durchführen.
GlobalMaxPool2D ([Layout]) Mit Hilfe dieser Methode können wir globale Max-Pooling-Operationen für 2D-Daten durchführen.
GlobalMaxPool3D ([Layout]) Mit Hilfe dieser Methode können wir globale Max-Pooling-Operationen für 3D-Daten durchführen.
GroupNorm ([num_groups, epsilon, center,…]) Diese Methode wendet die Gruppennormalisierung auf das nD-Eingabearray an.
HybridBlock ([Präfix, Parameter]) Diese Methode unterstützt die Weiterleitung mit beiden Symbol und NDArray.
HybridLambda(Funktion [, Präfix]) Mit Hilfe dieser Methode können wir einen Operator oder einen Ausdruck als HybridBlock-Objekt umschließen.
HybridSequential ([Präfix, Parameter]) Es stapelt HybridBlocks nacheinander.
InstanceNorm ([Achse, Epsilon, Mitte, Skala,…]) Diese Methode wendet die Instanznormalisierung auf das nD-Eingabearray an.

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir Block (), das die Basisklasse für alle neuronalen Netzwerkschichten und -modelle angibt.

from mxnet.gluon import Block, nn
class Model(Block):
   def __init__(self, **kwargs):
      super(Model, self).__init__(**kwargs)
      # use name_scope to give child Blocks appropriate names.
      with self.name_scope():
         self.dense0 = nn.Dense(20)
         self.dense1 = nn.Dense(20)
   def forward(self, x):

      x = mx.nd.relu(self.dense0(x))
      return mx.nd.relu(self.dense1(x))

model = Model()
model.initialize(ctx=mx.cpu(0))
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))

Output

Sie sehen die folgende Ausgabe -

[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)*gt;

Im folgenden Beispiel verwenden wir HybridBlock (), das die Weiterleitung sowohl mit Symbol als auch mit NDArray unterstützt.

import mxnet as mx
from mxnet.gluon import HybridBlock, nn


class Model(HybridBlock):
   def __init__(self, **kwargs):
      super(Model, self).__init__(**kwargs)
      # use name_scope to give child Blocks appropriate names.
      with self.name_scope():
         self.dense0 = nn.Dense(20)
         self.dense1 = nn.Dense(20)

   def forward(self, x):
      x = nd.relu(self.dense0(x))
      return nd.relu(self.dense1(x))
model = Model()
model.initialize(ctx=mx.cpu(0))

model.hybridize()
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))

Output

Die Ausgabe wird unten erwähnt -

[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)>

gluon.rnn

Gluon bietet eine große Anzahl von Einbauten recurrent neural network(RNN) Ebenen im Modul gluon.rnn. Aus diesem Grund wird es als Kernmodul bezeichnet.

Methoden und ihre Parameter

Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.nn Kern Modul:

Methoden und ihre Parameter Definition
Bidirektionale Zelle (l_cell, r_cell [,…]) Es wird für RNN-Zellen (Bidirectional Recurrent Neural Network) verwendet.
DropoutCell (Rate [, Achsen, Präfix, Parameter]) Diese Methode wendet Dropout auf die angegebene Eingabe an.
GRU (hidden_size [, num_layers, layout,…]) Es wendet eine RNU (Multi-Layer Gated Recurrent Unit) auf eine bestimmte Eingabesequenz an.
GRUCell (hidden_size [,…]) Es wird für die GRU-Netzwerkzelle (Gated Rectified Unit) verwendet.
HybridRecurrentCell ([Präfix, Parameter]) Diese Methode unterstützt das Hybridisieren.
HybridSequentialRNNCell ([Präfix, Parameter]) Mit Hilfe dieser Methode können wir mehrere HybridRNN-Zellen nacheinander stapeln.
LSTM (hidden_size [, num_layers, layout,…]) 0 Es wendet ein mehrschichtiges Langzeit-Kurzzeitgedächtnis (LSTM) RNN auf eine gegebene Eingabesequenz an.
LSTMCell (hidden_size [,…]) Es wird für LSTM-Netzwerkzellen (Long-Short Term Memory) verwendet.
ModifierCell (base_cell) Dies ist die Basisklasse für Modifikatorzellen.
RNN (hidden_size [, num_layers, Aktivierung,…]) Es wird ein mehrschichtiges Elman RNN mit angewendet tanh oder ReLU Nichtlinearität zu einer gegebenen Eingabesequenz.
RNNCell (hidden_size [, Aktivierung,…]) Es wird für wiederkehrende neuronale Netzwerkzellen von Elman RNN verwendet.
RecurrentCell ([Präfix, Parameter]) Es repräsentiert die abstrakte Basisklasse für RNN-Zellen.
SequentialRNNCell ([Präfix, Parameter]) Mit Hilfe dieser Methode können wir mehrere RNN-Zellen nacheinander stapeln.
ZoneoutCell (base_cell [, zoneout_outputs,…]) Diese Methode wendet Zoneout auf die Basiszelle an.

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir GRU (), das eine mehrschichtige RNU (Gated Recurrent Unit) auf eine bestimmte Eingabesequenz anwendet.

layer = mx.gluon.rnn.GRU(100, 3)
layer.initialize()
input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq, h0)
out_seq

Output

Dies erzeugt die folgende Ausgabe -

[[[ 1.50152072e-01 5.19012511e-01 1.02390535e-01 ... 4.35803324e-01
1.30406499e-01 3.30152437e-02]
[ 2.91542172e-01 1.02243155e-01 1.73325196e-01 ... 5.65296151e-02
1.76546033e-02 1.66693389e-01]
[ 2.22257316e-01 3.76294643e-01 2.11277917e-01 ... 2.28903517e-01
3.43954474e-01 1.52770668e-01]]


[[ 1.40634328e-01 2.93247789e-01 5.50393537e-02 ... 2.30207980e-01
6.61415309e-02 2.70989928e-02]
[ 1.11081995e-01 7.20834285e-02 1.08342394e-01 ... 2.28330195e-02
6.79589901e-03 1.25501186e-01]
[ 1.15944080e-01 2.41565228e-01 1.18612610e-01 ... 1.14908054e-01
1.61080107e-01 1.15969211e-01]]
………………………….

Example

hn

Output

Dies erzeugt die folgende Ausgabe -

[[[-6.08105101e-02 3.86217088e-02   6.64453954e-03 8.18805695e-02
3.85607071e-02 -1.36945639e-02 7.45836645e-03 -5.46515081e-03
9.49622393e-02 6.39371723e-02 -6.37890724e-03 3.82240303e-02
9.11015049e-02 -2.01375950e-02 -7.29381144e-02 6.93765879e-02
2.71829776e-02 -6.64435029e-02 -8.45306814e-02 -1.03075653e-01
6.72040805e-02 -7.06537142e-02 -3.93818803e-02 5.16211614e-03
-4.79770005e-02 1.10734522e-01 1.56721435e-02 -6.93409378e-03
1.16915874e-01 -7.95962065e-02 -3.06530762e-02 8.42394680e-02
7.60370195e-02 2.17055440e-01 9.85361822e-03 1.16660878e-01
4.08297703e-02 1.24978097e-02 8.25245082e-02 2.28673983e-02
-7.88266212e-02 -8.04114193e-02 9.28791538e-02 -5.70827350e-03
-4.46166918e-02 -6.41122833e-02 1.80885363e-02 -2.37745279e-03
4.37298454e-02 1.28888980e-01 -3.07202265e-02 2.50503756e-02
4.00907174e-02 3.37077095e-03 -1.78839862e-02 8.90695080e-02
6.30150884e-02 1.11416787e-01 2.12221760e-02 -1.13236710e-01
5.39616570e-02 7.80710578e-02 -2.28817668e-02 1.92073174e-02
………………………….

Im folgenden Beispiel verwenden wir LSTM (), das eine LSTM-RNN (Long-Short Term Memory) auf eine bestimmte Eingabesequenz anwendet.

layer = mx.gluon.rnn.LSTM(100, 3)
layer.initialize()

input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
c0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq,[h0,c0])
out_seq

Output

Die Ausgabe wird unten erwähnt -

[[[ 9.00025964e-02 3.96071747e-02 1.83841765e-01 ... 3.95872220e-02
1.25569820e-01 2.15555862e-01]
[ 1.55962542e-01 -3.10300849e-02 1.76772922e-01 ... 1.92474753e-01
2.30574399e-01 2.81707942e-02]
[ 7.83204585e-02 6.53361529e-03 1.27262697e-01 ... 9.97719541e-02
1.28254429e-01 7.55299702e-02]]
[[ 4.41036932e-02 1.35250352e-02 9.87644792e-02 ... 5.89378644e-03
5.23949116e-02 1.00922674e-01]
[ 8.59075040e-02 -1.67027581e-02 9.69351009e-02 ... 1.17763653e-01
9.71239135e-02 2.25218050e-02]
[ 4.34580036e-02 7.62207608e-04 6.37005866e-02 ... 6.14888743e-02
5.96345589e-02 4.72368896e-02]]
……………

Example

hn

Output

Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:

[
[[[ 2.21408084e-02 1.42750628e-02 9.53067932e-03 -1.22849066e-02
1.78788435e-02 5.99269159e-02 5.65306023e-02 6.42553642e-02
6.56616641e-03 9.80876666e-03 -1.15729487e-02 5.98640442e-02
-7.21173314e-03 -2.78371759e-02 -1.90690923e-02 2.21447181e-02
8.38765781e-03 -1.38521893e-02 -9.06938594e-03 1.21346042e-02
6.06449470e-02 -3.77471633e-02 5.65885007e-02 6.63008019e-02
-7.34188128e-03 6.46054149e-02 3.19911093e-02 4.11194898e-02
4.43960279e-02 4.92892228e-02 1.74766723e-02 3.40303481e-02
-5.23341820e-03 2.68163737e-02 -9.43402853e-03 -4.11836170e-02
1.55221792e-02 -5.05655073e-02 4.24557598e-03 -3.40388380e-02
……………………

Trainingsmodule

Die Schulungsmodule in Gluon sind wie folgt:

gluon.loss

Im mxnet.gluon.lossModul bietet Gluon vordefinierte Verlustfunktion. Grundsätzlich hat es die Verluste für das Training des neuronalen Netzes. Aus diesem Grund wird es als Trainingsmodul bezeichnet.

Methoden und ihre Parameter

Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.loss Trainingsmodul:

Methoden und ihre Parameter Definition
Verlust (Gewicht, Batch-Achse, ** kwargs) Dies fungiert als Basisklasse für Verluste.
L2Loss ([weight, batch_axis]) Es berechnet den mittleren quadratischen Fehler (MSE) zwischen label und prediction(pred).
L1Loss ([weight, batch_axis]) Es berechnet den mittleren absoluten Fehler (MAE) zwischen label und pred.
SigmoidBinaryCrossEntropyLoss ([…]) Diese Methode wird für den Kreuzentropieverlust für die binäre Klassifizierung verwendet.
SigmoidBCELoss Diese Methode wird für den Kreuzentropieverlust für die binäre Klassifizierung verwendet.
SoftmaxCrossEntropyLoss ([Achse,…]) Es berechnet den Softmax-Kreuzentropieverlust (CEL).
SoftmaxCELoss Es berechnet auch den Softmax-Kreuzentropieverlust.
KLDivLoss ([from_logits, Achse, Gewicht,…]) Es wird für den Kullback-Leibler-Divergenzverlust verwendet.
CTCLoss ([layout, label_layout, weight]) Es wird für TCL (Connectionist Temporal Classification Loss) verwendet.
HuberLoss ([rho, weight, batch_axis]) Es berechnet den geglätteten L1-Verlust. Der geglättete L1-Verlust ist gleich dem L1-Verlust, wenn der absolute Fehler Rho überschreitet, ist aber ansonsten gleich dem L2-Verlust.
HingeLoss ([Rand, Gewicht, Batch-Achse]) Diese Methode berechnet die in SVMs häufig verwendete Scharnierverlustfunktion:
SquaredHingeLoss ([Rand, Gewicht, Batch-Achse]) Diese Methode berechnet die in SVMs verwendete Soft-Margin-Loss-Funktion:
LogisticLoss ([weight, batch_axis, label_format]) Diese Methode berechnet den Logistikverlust.
TripletLoss ([Rand, Gewicht, Batch-Achse]) Diese Methode berechnet den Triplettverlust bei drei Eingangstensoren und einer positiven Marge.
PoissonNLLLoss ([weight, from_logits,…]) Die Funktion berechnet den Verlust der negativen Protokollwahrscheinlichkeit.
CosineEmbeddingLoss ([weight, batch_axis, margin]) Die Funktion berechnet den Kosinusabstand zwischen den Vektoren.
SDMLLoss ([Glättungsparameter, Gewicht,…]) Diese Methode berechnet den SDML-Verlust (Batchwise Smoothed Deep Metric Learning) bei zwei Eingangstensoren und einem SDM-Verlust bei Glättungsgewicht. Es lernt die Ähnlichkeit zwischen gepaarten Proben, indem ungepaarte Proben im Minibatch als mögliche negative Beispiele verwendet werden.

Beispiel

Wie wir das wissen mxnet.gluon.loss.lossberechnet die MSE (Mean Squared Error) zwischen Label und Vorhersage (pred). Dies geschieht mit Hilfe der folgenden Formel:

gluon.parameter

mxnet.gluon.parameter ist ein Container, der die Parameter enthält, dh die Gewichte der Blöcke.

Methoden und ihre Parameter

Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.parameter Schulungsmodul -

Methoden und ihre Parameter Definition
Besetzung (dtype) Diese Methode wandelt Daten und den Verlauf dieses Parameters in einen neuen Datentyp um.
Daten ([ctx]) Diese Methode gibt eine Kopie dieses Parameters in einem Kontext zurück.
grad ([ctx]) Diese Methode gibt einen Gradientenpuffer für diesen Parameter in einem Kontext zurück.
initialisieren ([init, ctx, default_init,…]) Diese Methode initialisiert Parameter- und Gradientenarrays.
list_ctx () Diese Methode gibt eine Liste der Kontexte zurück, in denen dieser Parameter initialisiert wird.
list_data () Diese Methode gibt Kopien dieses Parameters in allen Kontexten zurück. Dies erfolgt in derselben Reihenfolge wie die Erstellung.
list_grad () Diese Methode gibt Gradientenpuffer in allen Kontexten zurück. Dies erfolgt in der gleichen Reihenfolge wievalues().
list_row_sparse_data (row_id) Diese Methode gibt in allen Kontexten Kopien des Parameters 'row_sparse' zurück. Dies erfolgt in derselben Reihenfolge wie die Erstellung.
reset_ctx (ctx) Diese Methode weist Parameter anderen Kontexten neu zu.
row_sparse_data (row_id) Diese Methode gibt eine Kopie des Parameters 'row_sparse' im selben Kontext wie row_id zurück.
set_data (Daten) Diese Methode legt den Wert dieses Parameters in allen Kontexten fest.
var () Diese Methode gibt ein Symbol zurück, das diesen Parameter darstellt.
zero_grad () Diese Methode setzt den Gradientenpuffer in allen Kontexten auf 0.

Implementierungsbeispiel

Im folgenden Beispiel werden die Parameter und die Gradientenarrays mithilfe der Methode initialize () wie folgt initialisiert:

weight = mx.gluon.Parameter('weight', shape=(2, 2))
weight.initialize(ctx=mx.cpu(0))
weight.data()

Output

Die Ausgabe wird unten erwähnt -

[[-0.0256899 0.06511251]
[-0.00243821 -0.00123186]]
<NDArray 2x2 @cpu(0)>

Example

weight.grad()

Output

Die Ausgabe ist unten angegeben -

[[0. 0.]
[0. 0.]]
<NDArray 2x2 @cpu(0)>

Example

weight.initialize(ctx=[mx.gpu(0), mx.gpu(1)])
weight.data(mx.gpu(0))

Output

Sie sehen die folgende Ausgabe -

[[-0.00873779 -0.02834515]
 [ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(0)>

Example

weight.data(mx.gpu(1))

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[[-0.00873779 -0.02834515]
 [ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(1)>

gluon.trainer

mxnet.gluon.trainer wendet einen Optimierer auf eine Reihe von Parametern an. Es sollte zusammen mit Autograd verwendet werden.

Methoden und ihre Parameter

Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.trainer Schulungsmodul -

Methoden und ihre Parameter Definition
allreduce_grads () Diese Methode reduziert die Gradienten aus verschiedenen Kontexten für jeden Parameter (Gewicht).
load_states (fname) Wie der Name schon sagt, lädt diese Methode Trainerzustände.
save_states (fname) Wie der Name schon sagt, werden mit dieser Methode Trainerzustände gespeichert.
set_learning_rate (lr) Diese Methode legt eine neue Lernrate des Optimierers fest.
Schritt (batch_size [, ignore_stale_grad]) Diese Methode führt einen Schritt der Parameteraktualisierung durch. Es sollte danach aufgerufen werdenautograd.backward() und außerhalb von record() Umfang.
update (batch_size [, ignore_stale_grad]) Diese Methode führt auch einen Schritt der Parameteraktualisierung durch. Es sollte danach aufgerufen werdenautograd.backward() und außerhalb von record() Umfang und nach Trainer.update ().

Datenmodule

Die Datenmodule von Gluon werden nachfolgend erläutert -

gluon.data

Gluon bietet eine große Anzahl integrierter Dataset-Dienstprogramme im Modul gluon.data. Aus diesem Grund wird es als Datenmodul bezeichnet.

Klassen und ihre Parameter

Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die vom Kernmodul mxnet.gluon.data abgedeckt werden. Diese Methoden beziehen sich normalerweise auf Datasets, Sampling und DataLoader.

Datensatz
Methoden und ihre Parameter Definition
ArrayDataset (* args) Diese Methode stellt einen Datensatz dar, der zwei oder mehr als zwei Datensatz-ähnliche Objekte kombiniert. Zum Beispiel Datensätze, Listen, Arrays usw.
BatchSampler (Sampler, batch_size [, last_batch]) Diese Methode umschließt eine andere Sampler. Nach dem Verpacken werden die Mini-Probenstapel zurückgegeben.
DataLoader (Datensatz [, batch_size, shuffle,…]) Ähnlich wie BatchSampler, aber diese Methode lädt Daten aus einem Dataset. Nach dem Laden werden die Mini-Datenstapel zurückgegeben.
Dies repräsentiert die abstrakte Datensatzklasse.
FilterSampler (fn, Datensatz) Diese Methode repräsentiert die Beispielelemente aus einem Datensatz, für den fn (Funktion) zurückgibt True.
RandomSampler (Länge) Diese Methode repräsentiert Stichprobenelemente aus [0, Länge) zufällig ohne Ersatz.
RecordFileDataset (Dateiname) Es stellt einen Datensatz dar, der eine RecordIO-Datei umschließt. Die Erweiterung der Datei lautet.rec.
Sampler Dies ist die Basisklasse für Sampler.
SequentialSampler (Länge [, Start]) Es repräsentiert die Beispielelemente aus der Menge [Start, Start + Länge] nacheinander.
Es repräsentiert die Beispielelemente aus der Menge [Start, Start + Länge] nacheinander. Dies ist der einfache Dataset-Wrapper, insbesondere für Listen und Arrays.

Implementierungsbeispiele

Im folgenden Beispiel werden wir verwenden gluon.data.BatchSampler()API, die einen anderen Sampler umschließt. Es werden die Mini-Probenstapel zurückgegeben.

import mxnet as mx
from mxnet.gluon import data
sampler = mx.gluon.data.SequentialSampler(15)
batch_sampler = mx.gluon.data.BatchSampler(sampler, 4, 'keep')
list(batch_sampler)

Output

Die Ausgabe wird unten erwähnt -

[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11], [12, 13, 14]]

gluon.data.vision.datasets

Gluon bietet eine große Anzahl vordefinierter Funktionen für Vision-Datensätze in gluon.data.vision.datasets Modul.

Klassen und ihre Parameter

MXNet bietet uns nützliche und wichtige Datensätze, deren Klassen und Parameter unten angegeben sind -

Klassen und ihre Parameter Definition
MNIST ([Wurzel, Zug, Transformation]) Dies ist ein nützlicher Datensatz, der uns die handschriftlichen Ziffern liefert. Die URL für den MNIST-Datensatz lautet http://yann.lecun.com/exdb/mnist
FashionMNIST ([Wurzel, Zug, Transformation]) Dieser Datensatz besteht aus Zalandos Artikelbildern, die aus Modeprodukten bestehen. Es ist ein Drop-In-Ersatz für den ursprünglichen MNIST-Datensatz. Sie können diesen Datensatz unter https://github.com/zalandoresearch/fashion-mnist abrufen
CIFAR10 ([root, train, transform]] Dies ist ein Bildklassifizierungsdatensatz von https://www.cs.toronto.edu/~kriz/cifar.html. In diesem Datensatz ist jede Probe ein Bild mit Form (32, 32, 3).
CIFAR100 ([root, fine_label, train, transform]) Dies ist der CIFAR100-Bildklassifizierungsdatensatz von https://www.cs.toronto.edu/~kriz/cifar.html. Es hat auch jede Probe ist ein Bild mit Form (32, 32, 3).
ImageRecordDataset (Dateiname [, Flag, Transformation]) Dieser Datensatz umhüllt eine RecordIO-Datei, die Bilder enthält. In diesem Beispiel ist jedes Beispiel ein Bild mit der entsprechenden Beschriftung.
ImageFolderDataset (root [, flag, transform]) Dies ist ein Datensatz zum Laden von Bilddateien, die in einer Ordnerstruktur gespeichert sind.
ImageListDataset ([root, imglist, flag]) Dies ist ein Datensatz zum Laden von Bilddateien, die durch eine Liste von Einträgen angegeben werden.

Beispiel

Im folgenden Beispiel zeigen wir die Verwendung von ImageListDataset (), das zum Laden von Bilddateien verwendet wird, die durch eine Liste von Einträgen angegeben werden.

# written to text file *.lst

0 0 root/cat/0001.jpg
1 0 root/cat/xxxa.jpg
2 0 root/cat/yyyb.jpg
3 1 root/dog/123.jpg
4 1 root/dog/023.jpg
5 1 root/dog/wwww.jpg

# A pure list, each item is a list [imagelabel: float or list of float, imgpath]

[[0, root/cat/0001.jpg]
[0, root/cat/xxxa.jpg]
[0, root/cat/yyyb.jpg]
[1, root/dog/123.jpg]
[1, root/dog/023.jpg]
[1, root/dog/wwww.jpg]]

Utility-Module

Die Utility-Module in Gluon sind wie folgt:

gluon.utils

Gluon bietet eine große Anzahl von integrierten Optimierungsprogrammen für Parallelisierungsdienstprogramme im Modul gluon.utils. Es bietet eine Vielzahl von Dienstprogrammen für die Schulung. Aus diesem Grund wird es als Utility-Modul bezeichnet.

Funktionen und ihre Parameter

Im Folgenden sind die Funktionen und deren Parameter aufgeführt, die in diesem Dienstprogrammmodul mit dem Namen enthalten sind gluon.utils −

Funktionen und ihre Parameter Definition
split_data (data, num_slice [, batch_axis,…]) Diese Funktion wird normalerweise für die Datenparallelität verwendet und jedes Slice wird an ein Gerät, dh eine GPU, gesendet. Es teilt ein NDArray innum_slice Scheiben entlang batch_axis.
split_and_load (Daten, ctx_list [, batch_axis,…]) Diese Funktion teilt ein NDArray in auf len(ctx_list) Scheiben entlang batch_axis. Der einzige Unterschied zur obigen Funktion split_data () besteht darin, dass jedes Slice in einen Kontext in geladen wird ctx_list.
clip_global_norm (Arrays, max_norm [,…]) Die Aufgabe dieser Funktion ist es, NDArrays so neu zu skalieren, dass die Summe ihrer 2-Norm kleiner als ist max_norm.
check_sha1 (Dateiname, sha1_hash) Diese Funktion prüft, ob der sha1-Hash des Dateiinhalts mit dem erwarteten Hash übereinstimmt oder nicht.
Download (URL [, Pfad, Überschreiben, sha1_hash,…]) Wie der Name schon sagt, lädt diese Funktion eine bestimmte URL herunter.
replace_file (src, dst) Diese Funktion implementiert Atomic os.replace. Es wird mit Linux und OSX durchgeführt.

Dieses Kapitel befasst sich mit der Autograd- und Initialisierungs-API in MXNet.

mxnet.autograd

Dies ist die Autograd-API von MXNet für NDArray. Es hat die folgende Klasse -

Klasse: Funktion ()

Es wird zur kundenspezifischen Differenzierung im Autograd verwendet. Es kann geschrieben werden alsmxnet.autograd.Function. Wenn der Benutzer aus irgendeinem Grund die Gradienten nicht verwenden möchte, die durch die Standardkettenregel berechnet werden, kann er die Funktionsklasse von mxnet.autograd verwenden, um die Differenzierung für die Berechnung anzupassen. Es gibt zwei Methoden, nämlich Forward () und Backward ().

Lassen Sie uns die Arbeitsweise dieser Klasse anhand der folgenden Punkte verstehen:

  • Zuerst müssen wir unsere Berechnung in der Vorwärtsmethode definieren.

  • Dann müssen wir die angepasste Differenzierung in der Rückwärtsmethode bereitstellen.

  • Während der Gradientenberechnung verwendet mxnet.autograd anstelle der benutzerdefinierten Rückwärtsfunktion die vom Benutzer definierte Rückwärtsfunktion. Wir können für einige Operationen sowohl vorwärts als auch rückwärts in numpy array und back umwandeln.

Example

Bevor Sie die Klasse mxnet.autograd.function verwenden, definieren wir eine stabile Sigmoidfunktion mit Rückwärts- und Vorwärtsmethoden wie folgt:

class sigmoid(mx.autograd.Function):
   def forward(self, x):
      y = 1 / (1 + mx.nd.exp(-x))
      self.save_for_backward(y)
      return y
   
   def backward(self, dy):
      y, = self.saved_tensors
      return dy * y * (1-y)

Jetzt kann die Funktionsklasse wie folgt verwendet werden:

func = sigmoid()
x = mx.nd.random.uniform(shape=(10,))
x.attach_grad()
with mx.autograd.record():
m = func(x)
m.backward()
dx_grad = x.grad.asnumpy()
dx_grad

Output

Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:

array([0.21458015, 0.21291625, 0.23330082, 0.2361367 , 0.23086983,
0.24060014, 0.20326573, 0.21093895, 0.24968489, 0.24301809],
dtype=float32)

Methoden und ihre Parameter

Im Folgenden sind die Methoden und ihre Parameter der Klasse mxnet.autogard.function aufgeführt:

Methoden und ihre Parameter Definition
vorwärts (Köpfe [, head_grads, Retain_graph,…]) Diese Methode wird für die Vorwärtsberechnung verwendet.
rückwärts (Köpfe [, head_grads, Retain_graph,…]) Diese Methode wird für die Rückwärtsberechnung verwendet. Es berechnet die Gradienten von Köpfen in Bezug auf zuvor markierte Variablen. Diese Methode verwendet so viele Eingaben wie die Vorwärtsausgabe. Es werden auch so viele NDArrays wie Forward-Eingaben zurückgegeben.
get_symbol (x) Diese Methode wird verwendet, um den aufgezeichneten Berechnungsverlauf als abzurufen Symbol.
grad (Köpfe, Variablen [, head_grads,…]) Diese Methode berechnet die Gradienten von Köpfen in Bezug auf Variablen. Nach der Berechnung werden Gradienten als neue NDArrays zurückgegeben, anstatt sie in variable.grad zu speichern.
is_recording () Mit Hilfe dieser Methode können wir den Status der Aufnahme und nicht der Aufnahme abrufen.
is_training () Mit Hilfe dieser Methode können wir den Status von Training und Vorhersage erhalten.
mark_variables (Variablen, Gradienten [, grad_reqs]) Diese Methode markiert NDArrays als Variablen, um den Gradienten für die Autogradierung zu berechnen. Diese Methode ist identisch mit der Funktion .attach_grad () in einer Variablen, aber der einzige Unterschied besteht darin, dass wir mit diesem Aufruf den Gradienten auf einen beliebigen Wert setzen können.
Pause ([train_mode]) Diese Methode gibt einen Bereichskontext zurück, der in der Anweisung 'with' für Codes verwendet werden soll, für die keine Gradienten berechnet werden müssen.
Predict_Mode () Diese Methode gibt einen Bereichskontext zurück, der in der Anweisung 'with' verwendet werden soll, in der das Vorwärtsdurchlaufverhalten auf den Inferenzmodus eingestellt ist, ohne die Aufzeichnungsstatus zu ändern.
record ([train_mode]) Es wird ein zurückgegeben autograd Aufzeichnungsbereichskontext, der in der Anweisung 'with' verwendet werden soll, und Erfassung von Code, für den Gradienten berechnet werden müssen.
set_recording (is_recording) Ähnlich wie bei is_recoring () können wir mit Hilfe dieser Methode den Status beim Aufzeichnen und nicht beim Aufzeichnen abrufen.
set_training (is_training) Ähnlich wie bei is_traininig () können wir mit Hilfe dieser Methode den Status auf Training oder Vorhersage setzen.
train_mode () Diese Methode gibt einen Bereichskontext zurück, der in der Anweisung 'with' verwendet werden soll, in der das Vorwärtsdurchlaufverhalten auf den Trainingsmodus eingestellt ist, ohne die Aufzeichnungsstatus zu ändern.

Implementierungsbeispiel

Im folgenden Beispiel verwenden wir die Methode mxnet.autograd.grad (), um den Gradienten des Kopfes in Bezug auf Variablen zu berechnen.

x = mx.nd.ones((2,))
x.attach_grad()
with mx.autograd.record():
z = mx.nd.elemwise_add(mx.nd.exp(x), x)
dx_grad = mx.autograd.grad(z, [x], create_graph=True)
dx_grad

Output

Die Ausgabe wird unten erwähnt -

[
[3.7182817 3.7182817]
<NDArray 2 @cpu(0)>]

Wir können die Methode mxnet.autograd.predict_mode () verwenden, um einen Bereich zurückzugeben, der in der Anweisung 'with' verwendet werden soll.

with mx.autograd.record():
y = model(x)
with mx.autograd.predict_mode():
y = sampling(y)
backward([y])

mxnet.intializer

Dies ist die MXNet-API für den Wiegeinitialisierer. Es hat die folgenden Klassen -

Klassen und ihre Parameter

Es folgen die Methoden und ihre Parameter von mxnet.autogard.function Klasse:

Klassen und ihre Parameter Definition
Bilinear() Mit Hilfe dieser Klasse können wir das Gewicht für Up-Sampling-Schichten initialisieren.
Konstanter Wert) Diese Klasse initialisiert die Gewichte auf einen bestimmten Wert. Der Wert kann sowohl ein Skalar als auch ein NDArray sein, der der Form des einzustellenden Parameters entspricht.
FusedRNN (init, num_hidden, num_layers, mode) Wie der Name schon sagt, initialisiert diese Klasse Parameter für die verschmolzenen RNN-Schichten (Recurrent Neural Network).
InitDesc Es fungiert als Deskriptor für das Initialisierungsmuster.
Initializer (** kwargs) Dies ist die Basisklasse eines Initialisierers.
LSTMBias ([compare_bias]) Diese Klasse initialisiert alle Verzerrungen einer LSTMCell auf 0,0, mit Ausnahme des Vergessensgatters, dessen Verzerrung auf einen benutzerdefinierten Wert festgelegt ist.
Laden (param [, default_init, verbose]) Diese Klasse initialisiert die Variablen durch Laden von Daten aus einer Datei oder einem Wörterbuch.
MSRAPrelu ([Faktor_Typ, Steigung]) Wie der Name schon sagt, initialisiert diese Klasse das Gewicht gemäß einem MSRA-Papier.
Gemischt (Muster, Initialisierer) Die Parameter werden mit mehreren Initialisierern initialisiert.
Normal ([Sigma]) Die Klasse Normal () initialisiert Gewichte mit Zufallswerten, die aus einer Normalverteilung mit einem Mittelwert von Null und einer Standardabweichung (SD) von abgetastet wurden sigma.
Einer() Es initialisiert die Gewichtung des Parameters auf eins.
Orthogonal ([scale, rand_type]) Wie der Name schon sagt, initialisiert diese Klasse das Gewicht als orthogonale Matrix.
Uniform ([Skala]) Es initialisiert Gewichte mit zufälligen Werten, die gleichmäßig aus einem bestimmten Bereich abgetastet werden.
Xavier ([rnd_type, factor_type, size]) Es wird tatsächlich ein Initialisierer zurückgegeben, der die Xavier-Initialisierung für Gewichte durchführt.
Null() Es initialisiert die Gewichtung des Parameters auf Null.

Implementierungsbeispiel

Im folgenden Beispiel verwenden wir die Klasse mxnet.init.Normal (), erstellen einen Initialisierer und rufen seine Parameter ab.

init = mx.init.Normal(0.8)
init.dumps()

Output

Die Ausgabe ist unten angegeben -

'["normal", {"sigma": 0.8}]'

Example

init = mx.init.Xavier(factor_type="in", magnitude=2.45)
init.dumps()

Output

Die Ausgabe wird unten gezeigt -

'["xavier", {"rnd_type": "uniform", "factor_type": "in", "magnitude": 2.45}]'

Im folgenden Beispiel verwenden wir die Klasse mxnet.initializer.Mixed (), um Parameter mit mehreren Initialisierern zu initialisieren.

init = mx.initializer.Mixed(['bias', '.*'], [mx.init.Zero(),
mx.init.Uniform(0.1)])
module.init_params(init)

for dictionary in module.get_params():
for key in dictionary:
print(key)
print(dictionary[key].asnumpy())

Output

Die Ausgabe wird unten gezeigt -

fullyconnected1_weight
[[ 0.0097627 0.01856892 0.04303787]]
fullyconnected1_bias
[ 0.]

In diesem Kapitel lernen wir eine Schnittstelle in MXNet kennen, die als Symbol bezeichnet wird.

Mxnet.ndarray

Die Symbol-API von Apache MXNet ist eine Schnittstelle für die symbolische Programmierung. Die Symbol-API bietet die Verwendung der folgenden Optionen:

  • Computergraphen

  • Reduzierte Speichernutzung

  • Funktionsoptimierung vor dem Gebrauch

Das folgende Beispiel zeigt, wie Sie mithilfe der Symbol-API von MXNet einen einfachen Ausdruck erstellen können.

Ein NDArray unter Verwendung eines 1-D- und 2-D-Arrays aus einer regulären Python-Liste -

import mxnet as mx
# Two placeholders namely x and y will be created with mx.sym.variable
x = mx.sym.Variable('x')
y = mx.sym.Variable('y')
# The symbol here is constructed using the plus ‘+’ operator.
z = x + y

Output

Sie sehen die folgende Ausgabe -

<Symbol _plus0>

Example

(x, y, z)

Output

Die Ausgabe ist unten angegeben -

(<Symbol x>, <Symbol y>, <Symbol _plus0>)

Lassen Sie uns nun die Klassen, Funktionen und Parameter der ndarray-API von MXNet ausführlich diskutieren.

Klassen

Die folgende Tabelle enthält die Klassen der Symbol-API von MXNet -

Klasse Definition
Symbol (Griff) Diese Klasse, nämlich das Symbol, ist der symbolische Graph des Apache MXNet.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter, die von der mxnet.Symbol-API abgedeckt werden.

Funktion und ihre Parameter Definition
Aktivierung ([data, act_type, out, name]) Es wendet eine Aktivierungsfunktion elementweise auf den Eingang an. Es unterstütztrelu, sigmoid, tanh, softrelu, softsign Aktivierungsfunktionen.
BatchNorm ([Daten, Gamma, Beta, Moving_Mean,…]) Es wird zur Chargennormalisierung verwendet. Diese Funktion normalisiert einen Datenstapel nach Mittelwert und Varianz. Es wird eine Skala angewendetgamma und Offset beta.
BilinearSampler ([Daten, Raster, cudnn_off,…]) Diese Funktion wendet eine bilineare Abtastung auf die Eingabe-Feature-Map an. Eigentlich ist es der Schlüssel von "Spatial Transformer Networks". Wenn Sie mit der Remap-Funktion in OpenCV vertraut sind, ist die Verwendung dieser Funktion der sehr ähnlich. Der einzige Unterschied ist, dass es den Rückwärtspass hat.
BlockGrad ([Daten, Out, Name]) Wie der Name schon sagt, stoppt diese Funktion die Gradientenberechnung. Grundsätzlich wird verhindert, dass der akkumulierte Gradient der Eingaben durch diesen Operator in Rückwärtsrichtung fließt.
cast ([Daten, Typ, Out, Name]) Diese Funktion wandelt alle Elemente der Eingabe in einen neuen Typ um.
Diese Funktion wandelt alle Elemente der Eingabe in einen neuen Typ um. Diese Funktion gibt, wie der Name schon sagt, ein neues Symbol mit einer bestimmten Form und einem bestimmten Typ zurück, das mit Nullen gefüllt ist.
Einsen (Form [, Typ]) Diese Funktion gibt, wie angegeben, ein neues Symbol der angegebenen Form und des angegebenen Typs zurück, das mit Einsen gefüllt ist.
voll (Form, Wert [, Typ]) Diese Funktion gibt, wie der Name schon sagt, ein neues Array mit der angegebenen Form und dem angegebenen Typ zurück, das mit dem angegebenen Wert gefüllt ist val.
arrangieren (Start [, Stopp, Schritt, Wiederholung,…]) Innerhalb eines bestimmten Intervalls werden gleichmäßig verteilte Werte zurückgegeben. Die Werte werden innerhalb eines halboffenen Intervalls (Start, Stopp) generiert, was bedeutet, dass das Intervall enthältstart schließt aber aus stop.
linspace (start, stop, num [, endpunkt, name,…]) Innerhalb eines bestimmten Intervalls werden gleichmäßig verteilte Zahlen zurückgegeben. Ähnlich wie bei der Funktion arrang () werden die Werte innerhalb eines halboffenen Intervalls (Start, Stopp) generiert, was bedeutet, dass das Intervall enthältstart schließt aber aus stop.
Histogramm (a [, Bins, Bereich]) Wie der Name schon sagt, berechnet diese Funktion das Histogramm der Eingabedaten.
Macht (Basis, exp) Wie der Name schon sagt, gibt diese Funktion das elementweise Ergebnis von zurück base Element zu Mächten erhoben von expElement. Beide Eingänge, dh base und exp, können entweder Symbol oder Skalar sein. Beachten Sie hier, dass das Senden nicht erlaubt ist. Sie können verwendenbroadcast_pow Wenn Sie die Broadcast-Funktion verwenden möchten.
SoftmaxActivation ([Daten, Modus, Name, attr, out]) Diese Funktion wendet die Softmax-Aktivierung auf den Eingang an. Es ist für interne Schichten vorgesehen. Es ist tatsächlich veraltet, wir können verwendensoftmax() stattdessen.

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir die Funktion power() Dies gibt das elementweise Ergebnis des Basiselements zurück, das vom exp-Element auf die Potenzen angehoben wurde:

import mxnet as mx
mx.sym.power(3, 5)

Output

Sie sehen die folgende Ausgabe -

243

Example

x = mx.sym.Variable('x')
y = mx.sym.Variable('y')
z = mx.sym.power(x, 3)
z.eval(x=mx.nd.array([1,2]))[0].asnumpy()

Output

Dies erzeugt die folgende Ausgabe -

array([1., 8.], dtype=float32)

Example

z = mx.sym.power(4, y)
z.eval(y=mx.nd.array([2,3]))[0].asnumpy()

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

array([16., 64.], dtype=float32)

Example

z = mx.sym.power(x, y)
z.eval(x=mx.nd.array([4,5]), y=mx.nd.array([2,3]))[0].asnumpy()

Output

Die Ausgabe wird unten erwähnt -

array([ 16., 125.], dtype=float32)

Im folgenden Beispiel verwenden wir die Funktion SoftmaxActivation() (or softmax()) Dies wird auf die Eingabe angewendet und ist für interne Ebenen vorgesehen.

input_data = mx.nd.array([[2., 0.9, -0.5, 4., 8.], [4., -.7, 9., 2., 0.9]])
soft_max_act = mx.nd.softmax(input_data)
print (soft_max_act.asnumpy())

Output

Sie sehen die folgende Ausgabe -

[[2.4258138e-03 8.0748333e-04 1.9912292e-04 1.7924475e-02 9.7864312e-01]
[6.6843745e-03 6.0796250e-05 9.9204916e-01 9.0463174e-04 3.0112563e-04]]

symbol.contrib

Die Contrib NDArray-API ist im Paket symbol.contrib definiert. Es bietet normalerweise viele nützliche experimentelle APIs für neue Funktionen. Diese API dient als Ort für die Community, an dem sie die neuen Funktionen ausprobieren kann. Der Feature-Mitwirkende erhält ebenfalls das Feedback.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.symbol.contrib API - -

Funktion und ihre Parameter Definition
rand_zipfian (true_classes, num_sampled,…) Diese Funktion zieht Zufallsstichproben aus einer ungefähren Zipfian-Verteilung. Die Basisverteilung dieser Funktion ist die Zipfian-Verteilung. Diese Funktion tastet zufällig num_sampled Kandidaten ab und die Elemente von sampled_candidates werden aus der oben angegebenen Basisverteilung gezogen.
foreach (body, data, init_states) Wie der Name schon sagt, führt diese Funktion eine Schleife mit benutzerdefinierter Berechnung über NDArrays in Dimension 0 aus. Diese Funktion simuliert eine for-Schleife und body hat die Berechnung für eine Iteration der for-Schleife.
while_loop (cond, func, loop_vars [,…]) Wie der Name schon sagt, führt diese Funktion eine while-Schleife mit benutzerdefinierter Berechnung und Schleifenbedingung aus. Diese Funktion simuliert eine while-Schleife, die literarisch benutzerdefinierte Berechnungen durchführt, wenn die Bedingung erfüllt ist.
cond (pred, then_func, else_func) Wie der Name schon sagt, führt diese Funktion ein Wenn-Dann-Sonst unter Verwendung einer benutzerdefinierten Bedingung und Berechnung aus. Diese Funktion simuliert einen if-ähnlichen Zweig, der eine der beiden benutzerdefinierten Berechnungen gemäß der angegebenen Bedingung ausführt.
getnnz ([Daten, Achse, Out, Name]) Diese Funktion gibt uns die Anzahl der gespeicherten Werte für einen spärlichen Tensor an. Es enthält auch explizite Nullen. Es unterstützt nur die CSR-Matrix auf der CPU.
Requantize ([Daten, min_range, max_range,…]) Diese Funktion benötigt die angegebenen Daten, die in int32 und den entsprechenden Schwellenwerten quantisiert sind, in int8 unter Verwendung von minimalen und maximalen Schwellenwerten, die entweder zur Laufzeit oder aus der Kalibrierung berechnet werden.
index_copy ([old_tensor, index_vector,…]) Diese Funktion kopiert die Elemente von a new_tensor into the old_tensor by selecting the indices in the order given in index. The output of this operator will be a new tensor that contains the rest elements of old tensor and the copied elements of new tensor.
interleaved_matmul_encdec_qk ([Abfragen,…]) Dieser Operator berechnet die Matrixmultiplikation zwischen den Projektionen von Abfragen und Schlüsseln bei Verwendung mit mehreren Köpfen als Encoder-Decoder. Die Bedingung ist, dass die Eingaben ein Tensor von Projektionen von Abfragen sein sollten, die dem Layout folgen: (seq_length, batch_size, num_heads *, head_dim).

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir die Funktion rand_zipfian, um Zufallsstichproben aus einer ungefähren Zipfian-Verteilung zu ziehen.

import mxnet as mx
true_cls = mx.sym.Variable('true_cls')
samples, exp_count_true, exp_count_sample = mx.sym.contrib.rand_zipfian(true_cls, 5, 6)
samples.eval(true_cls=mx.nd.array([3]))[0].asnumpy()

Output

Sie sehen die folgende Ausgabe -

array([4, 0, 2, 1, 5], dtype=int64)

Example

exp_count_true.eval(true_cls=mx.nd.array([3]))[0].asnumpy()

Output

Die Ausgabe wird unten erwähnt -

array([0.57336551])

Example

exp_count_sample.eval(true_cls=mx.nd.array([3]))[0].asnumpy()

Output

Sie sehen die folgende Ausgabe -

array([1.78103594, 0.46847373, 1.04183923, 0.57336551, 1.04183923])

Im folgenden Beispiel verwenden wir die Funktion while_loop zum Ausführen einer while-Schleife für benutzerdefinierte Berechnungen und Schleifenbedingungen -

cond = lambda i, s: i <= 7
func = lambda i, s: ([i + s], [i + 1, s + i])
loop_vars = (mx.sym.var('i'), mx.sym.var('s'))
outputs, states = mx.sym.contrib.while_loop(cond, func, loop_vars, max_iterations=10)
print(outputs)

Output

Die Ausgabe ist unten angegeben:

[<Symbol _while_loop0>]

Example

Print(States)

Output

Dies erzeugt die folgende Ausgabe -

[<Symbol _while_loop0>, <Symbol _while_loop0>]

Im folgenden Beispiel verwenden wir die Funktion index_copy das kopiert die Elemente von new_tensor in den old_tensor.

import mxnet as mx
a = mx.nd.zeros((6,3))
b = mx.nd.array([[1,2,3],[4,5,6],[7,8,9]])
index = mx.nd.array([0,4,2])
mx.nd.contrib.index_copy(a, index, b)

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[[1. 2. 3.]
[0. 0. 0.]
[7. 8. 9.]
[0. 0. 0.]
[4. 5. 6.]
[0. 0. 0.]]
<NDArray 6x3 @cpu(0)>

symbol.image

Die Image Symbol API ist im Paket symbol.image definiert. Wie der Name schon sagt, wird es normalerweise für Bilder und deren Funktionen verwendet.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.symbol.image API - -

Funktion und ihre Parameter Definition
adjust_lighting ([Daten, Alpha, Out, Name]) Wie der Name schon sagt, passt diese Funktion die Beleuchtungsstärke des Eingangs an. Es folgt dem AlexNet-Stil.
Ernte ([Daten, x, y, Breite, Höhe, out, Name]) Mit Hilfe dieser Funktion können wir ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zuschneiden.
normalisieren ([Daten, Mittelwert, Standard, Out, Name]) Es normalisiert einen Tensor der Form (C x H x B) oder (N x C x H x B) mit mean und standard deviation(SD).
random_crop ([Daten, x-Bereich, y-Bereich, Breite,…]) Ähnlich wie beim Zuschneiden () wird zufällig ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zugeschnitten. Das Ergebnis wird aktualisiert, wennsrc ist kleiner als die size.
random_lighting([data, alpha_std, out, name]) Wie der Name schon sagt, fügt diese Funktion das PCA-Rauschen zufällig hinzu. Es folgt auch dem AlexNet-Stil.
random_resized_crop ([data, xrange, yrange,…]) Es schneidet auch ein Bild zufällig NDArray der Form (H x B x C) oder (N x H x B x C) auf die angegebene Größe. Das Ergebnis wird aktualisiert, wenn src kleiner als die Größe ist. Es wird auch die Flächen- und Seitenration randomisiert.
Größe ändern ([Daten, Größe, keep_ratio, interp,…]) Wie der Name schon sagt, ändert diese Funktion die Größe eines Bild-NDArrays der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe.
to_tensor ([Daten, Out, Name]) Es konvertiert ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray der Form (C x H x B) oder ( N x C x H x B) mit den Werten im Bereich [0, 1].

Implementierungsbeispiele

Im folgenden Beispiel verwenden wir die Funktion to_tensor, um das Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray umzuwandeln der Form (C x H x B) oder (N x C x H x B) mit den Werten im Bereich [0, 1].

import numpy as np

img = mx.sym.random.uniform(0, 255, (4, 2, 3)).astype(dtype=np.uint8)

mx.sym.image.to_tensor(img)

Output

Die Ausgabe ist unten angegeben -

<Symbol to_tensor4>

Example

img = mx.sym.random.uniform(0, 255, (2, 4, 2, 3)).astype(dtype=np.uint8)

mx.sym.image.to_tensor(img)

Output

Die Ausgabe wird unten erwähnt:

<Symbol to_tensor5>

Im folgenden Beispiel verwenden wir die Funktion normalize (), um einen Tensor der Form (C x H x B) oder (N x C x H x B) mit zu normalisieren mean und standard deviation(SD).

img = mx.sym.random.uniform(0, 1, (3, 4, 2))

mx.sym.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))

Output

Unten ist die Ausgabe des Codes angegeben -

<Symbol normalize0>

Example

img = mx.sym.random.uniform(0, 1, (2, 3, 4, 2))

mx.sym.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))

Output

Die Ausgabe wird unten gezeigt -

<Symbol normalize1>

symbol.random

Die Zufallssymbol-API ist im Paket symbol.random definiert. Wie der Name schon sagt, handelt es sich um die Symbol-API des Zufallsverteilungsgenerators von MXNet.

Funktionen und ihre Parameter

Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.symbol.random API - -

Funktion und ihre Parameter Definition
Uniform ([niedrig, hoch, Form, dtype, ctx, out]) Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung generiert.
normal ([loc, scale, shape, dtype, ctx, out]) Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert.
randn (* form, ** kwargs) Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert.
poisson ([lam, form, dtyp, ctx, out]) Es werden Zufallsstichproben aus einer Poisson-Verteilung generiert.
exponentiell ([Skala, Form, dtype, ctx, out]) Es werden Stichproben aus einer Exponentialverteilung generiert.
Gamma ([Alpha, Beta, Form, D-Typ, Ctx, Out]) Aus einer Gammaverteilung werden Zufallsstichproben generiert.
multinomial (Daten [, Form, get_prob, out, dtype]) Es generiert eine gleichzeitige Abtastung aus mehreren Multinomialverteilungen.
negative_binomial ([k, p, Form, dtype, ctx, out]) Es werden Zufallsstichproben aus einer negativen Binomialverteilung generiert.
generalized_negative_binomial ([mu, alpha,…]) Es generiert Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung.
mischen (Daten, ** kwargs) Die Elemente werden zufällig gemischt.
Randint (niedrig, hoch [, Form, Typ, Ctx, out]) Es werden Zufallsstichproben aus einer diskreten Gleichverteilung generiert.
exponentiell_ähnlich ([data, lam, out, name]) Es werden Zufallsstichproben aus einer Exponentialverteilung gemäß der Form des Eingabearrays generiert.
gamma_like ([Daten, Alpha, Beta, Out, Name]) Es werden Zufallsstichproben aus einer Gammaverteilung gemäß der Form des Eingabearrays generiert.
generalized_negative_binomial_like ([Daten,…]) Es werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gemäß der Form des Eingabearrays generiert.
negative_binomial_like ([Daten, k, p, out, Name]) Es werden Zufallsstichproben aus einer negativen Binomialverteilung gemäß der Form des Eingabearrays generiert.
normal_like ([Daten, Ort, Skalierung, Out, Name]) Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) gemäß der Form des Eingabearrays generiert.
poisson_like ([Daten, Lam, Out, Name]) Es werden Zufallsstichproben aus einer Poisson-Verteilung gemäß der Form des Eingabearrays generiert.
uniform_like ([Daten, niedrig, hoch, out, Name]) Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung gemäß der Form des Eingabearrays generiert.

Implementierungsbeispiele

Im folgenden Beispiel werden die Elemente mit der Funktion shuffle () zufällig gemischt. Das Array wird entlang der ersten Achse gemischt.

data = mx.nd.array([[0, 1, 2], [3, 4, 5], [6, 7, 8],[9,10,11]])
x = mx.sym.Variable('x')
y = mx.sym.random.shuffle(x)
y.eval(x=data)

Output

Sie sehen die folgende Ausgabe:

[
[[ 9. 10. 11.]
[ 0. 1. 2.]
[ 6. 7. 8.]
[ 3. 4. 5.]]
<NDArray 4x3 @cpu(0)>]

Example

y.eval(x=data)

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[
[[ 6. 7. 8.]
[ 0. 1. 2.]
[ 3. 4. 5.]
[ 9. 10. 11.]]
<NDArray 4x3 @cpu(0)>]

Im folgenden Beispiel werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gezogen. Hierfür wird die Funktion verwendetgeneralized_negative_binomial().

mx.sym.random.generalized_negative_binomial(10, 0.1)

Output

Die Ausgabe ist unten angegeben -

<Symbol _random_generalized_negative_binomial0>

symbol.sparse

Die Sparse Symbol API ist im Paket mxnet.symbol.sparse definiert. Wie der Name schon sagt, bietet es spärliche Diagramme für neuronale Netze und eine automatische Differenzierung auf der CPU.

Funktionen und ihre Parameter

Im Folgenden sind einige der wichtigen Funktionen (einschließlich Routinen zur Symbolerstellung, Routinen zur Symbolmanipulation, mathematische Funktionen, trigonometrische Funktion, hyberbolische Funktionen, Reduzierungsfunktionen, Rundung, Potenzen, neuronales Netzwerk) und deren Parameter aufgeführt mxnet.symbol.sparse API - -

Funktion und ihre Parameter Definition
ElementWiseSum (* args, ** kwargs) Diese Funktion fügt alle Eingabeargumente elementweise hinzu. Zum Beispiel _ (1,2,… = 1 + 2 + ⋯ +). Hier können wir sehen, dass add_n möglicherweise effizienter ist als das n-malige Aufrufen von add.
Einbetten ([Daten, Gewicht, input_dim,…]) Die Ganzzahlindizes werden Vektordarstellungen, dh Einbettungen, zugeordnet. Es ordnet Wörter tatsächlich realwertigen Vektoren im hochdimensionalen Raum zu, die als Worteinbettungen bezeichnet werden.
LinearRegressionOutput ([Daten, Label,…]) Es berechnet und optimiert den quadratischen Verlust während der Rückwärtsausbreitung und liefert nur Ausgabedaten während der Vorwärtsausbreitung.
LogisticRegressionOutput ([Daten, Label,…]) Wendet eine logistische Funktion, die auch als Sigmoid-Funktion bezeichnet wird, auf die Eingabe an. Die Funktion wird als 1/1 + exp (−x) berechnet.
MAERegressionOutput ([Daten, Label,…]) Dieser Operator berechnet den mittleren absoluten Fehler der Eingabe. MAE ist tatsächlich eine Risikometrik, die dem erwarteten Wert des absoluten Fehlers entspricht.
abs ([Daten, Name, attr, out]) Wie der Name schon sagt, gibt diese Funktion den elementweisen Absolutwert der Eingabe zurück.
adagrad_update ([Gewicht, Grad, Geschichte, lr,…]) Es ist eine Update-Funktion für AdaGrad optimizer.
adam_update ([Gewicht, Grad, Mittelwert, Var, lr,…]) Es ist eine Update-Funktion für Adam optimizer.
add_n (* args, ** kwargs) Wie der Name schon sagt, werden alle Eingabeargumente elementweise hinzugefügt.
arccos ([Daten, Name, attr, out]) Diese Funktion gibt den elementweisen inversen Kosinus des Eingabearrays zurück.
Punkt ([lhs, rhs, transpose_a, transpose_b,…]) Wie der Name schon sagt, ergibt sich das Punktprodukt zweier Arrays. Dies hängt von der Dimension des Eingabearrays ab: 1-D: inneres Produkt der Vektoren 2-D: Matrixmultiplikation ND: Ein Summenprodukt über der letzten Achse der ersten Eingabe und der ersten Achse der zweiten Eingabe.
elemwise_add ([lhs, rhs, name, attr, out]) Wie der Name schon sagt add Argumente elementweise.
elemwise_div ([lhs, rhs, name, attr, out]) Wie der Name schon sagt divide Argumente elementweise.
elemwise_mul ([lhs, rhs, name, attr, out]) Wie der Name schon sagt Multiply Argumente elementweise.
elemwise_sub ([lhs, rhs, name, attr, out]) Wie der Name schon sagt, werden Argumente elementweise subtrahiert.
exp ([Daten, Name, attr, out]) Diese Funktion gibt den elementweisen Exponentialwert der angegebenen Eingabe zurück.
sgd_update ([weight, grad, lr, wd,…]) Es fungiert als Aktualisierungsfunktion für den Stochastic Gradient Descent Optimizer.
Sigmoid ([Daten, Name, attr, out]) Wie der Name schon sagt, wird es berechnet sigmoid von x elementweise.
Zeichen ([Daten, Name, attr, out]) Es wird das elementweise Vorzeichen der angegebenen Eingabe zurückgegeben.
sin ([Daten, Name, attr, out]) Wie der Name schon sagt, berechnet diese Funktion den elementweisen Sinus des angegebenen Eingabearrays.

Implementierungsbeispiel

Im folgenden Beispiel werden wir die Elemente zufällig mit mischen ElementWiseSum()Funktion. Ganzzahlige Indizes werden Vektordarstellungen, dh Worteinbettungen, zugeordnet.

input_dim = 4
output_dim = 5

Example

/* Here every row in weight matrix y represents a word. So, y = (w0,w1,w2,w3)
y = [[ 0., 1., 2., 3., 4.],
[ 5., 6., 7., 8., 9.],
[ 10., 11., 12., 13., 14.],
[ 15., 16., 17., 18., 19.]]
/* Here input array x represents n-grams(2-gram). So, x = [(w1,w3), (w0,w2)]
x = [[ 1., 3.],
[ 0., 2.]]
/* Now, Mapped input x to its vector representation y.
Embedding(x, y, 4, 5) = [[[ 5., 6., 7., 8., 9.],
[ 15., 16., 17., 18., 19.]],
[[ 0., 1., 2., 3., 4.],
[ 10., 11., 12., 13., 14.]]]

Die Modul-API von Apache MXNet ähnelt einem FeedForward-Modell und ist einfacher zu erstellen als das Torch-Modul. Es besteht aus folgenden Klassen -

BaseModule ([Logger])

Es repräsentiert die Basisklasse eines Moduls. Ein Modul kann als Rechenkomponente oder Rechenmaschine betrachtet werden. Die Aufgabe eines Moduls besteht darin, Vorwärts- und Rückwärtsdurchläufe auszuführen. Außerdem werden Parameter in einem Modell aktualisiert.

Methoden

Die folgende Tabelle zeigt die Methoden, aus denen besteht BaseModule class- -

Diese Methode ruft Zustände von allen Geräten ab
Methoden Definition
rückwärts ([out_grads]) Wie der Name schon sagt, implementiert diese Methode die backward Berechnung.
bind (data_shapes [, label_shapes,…]) Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann.
fit (train_data [, eval_data, eval_metric,…]) Diese Methode trainiert die Modulparameter.
vorwärts (data_batch [, is_train]) Wie der Name schon sagt, implementiert diese Methode die Vorwärtsberechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen.
forward_backward (data_batch) Es ist eine praktische Funktion, wie der Name schon sagt, die sowohl vorwärts als auch rückwärts aufruft.
get_input_grads ([merge_multi_context]) Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden.
get_outputs ([merge_multi_context]) Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung.
get_params () Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden.
get_states ([merge_multi_context])
init_optimizer ([kvstore, optimizer,…]) Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen.
init_params ([initializer, arg_params,…]) Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände.
install_monitor (mon) Diese Methode installiert den Monitor auf allen Executoren.
iter_predict (eval_data [, num_batch, reset,…]) Diese Methode iteriert über Vorhersagen.
load_params (fname) Wie der Name schon sagt, werden Modellparameter aus der Datei geladen.
vorhersagen (eval_data [, num_batch,…]) Es wird die Vorhersage ausführen und auch die Ausgaben sammeln.
vorbereiten (data_batch [, sparse_row_id_fn]) Der Bediener bereitet das Modul für die Verarbeitung eines bestimmten Datenstapels vor.
save_params (fname) Wie der Name schon sagt, speichert diese Funktion die Modellparameter in einer Datei.
score (eval_data, eval_metric [, num_batch,…]) Es läuft die Vorhersage weiter eval_data und bewertet auch die Leistung gemäß den gegebenen eval_metric.
set_params (arg_params, aux_params [,…]) Diese Methode weist die Parameter- und Hilfszustandswerte zu.
set_states ([Zustände, Wert]) Diese Methode legt, wie der Name schon sagt, den Wert für Zustände fest.
aktualisieren() Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert.
update_metric (eval_metric, label [, pre_sliced]) Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie.
rückwärts ([out_grads]) Wie der Name schon sagt, implementiert diese Methode die backward Berechnung.
bind (data_shapes [, label_shapes,…]) Es richtet die Buckets ein und bindet den Executor für den Standard-Bucket-Schlüssel. Diese Methode repräsentiert die Bindung für aBucketingModule.
vorwärts (data_batch [, is_train]) Wie der Name schon sagt, implementiert diese Methode die Vorwärtsberechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen.
get_input_grads ([merge_multi_context]) Diese Methode erhält die Gradienten zu den Eingaben, die in der vorherigen Rückwärtsberechnung berechnet wurden.
get_outputs ([merge_multi_context]) Wie der Name schon sagt, erhält diese Methode Ausgaben aus der vorherigen Vorwärtsberechnung.
get_params () Es werden die aktuellen Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden.
get_states ([merge_multi_context]) Diese Methode ruft Zustände von allen Geräten ab.
init_optimizer ([kvstore, optimizer,…]) Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen.
init_params ([initializer, arg_params,…]) Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände.
install_monitor (mon) Diese Methode installiert den Monitor auf allen Executoren.
Laden (Präfix, Epoche [, sym_gen,…]) Diese Methode erstellt ein Modell aus dem zuvor gespeicherten Prüfpunkt.
load_dict ([sym_dict, sym_gen,…]) Diese Methode erstellt ein Modell aus einer Wörterbuchzuordnung (dict) bucket_keyzu Symbolen. Es teilt aucharg_params und aux_params.
vorbereiten (data_batch [, sparse_row_id_fn]) Der Bediener bereitet das Modul für die Verarbeitung eines bestimmten Datenstapels vor.
save_checkpoint (Präfix, Epoche [, remove_amp_cast]) Diese Methode speichert, wie der Name schon sagt, den aktuellen Fortschritt für alle Buckets in BucketingModule am Prüfpunkt. Es wird empfohlen, mx.callback.module_checkpoint als epoch_end_callback zu verwenden, um während des Trainings zu speichern.
set_params (arg_params, aux_params [,…]) Wie der Name schon sagt, weist diese Funktion Parameter und Hilfszustandswerte zu.
set_states ([Zustände, Wert]) Diese Methode legt, wie der Name schon sagt, den Wert für Zustände fest.
switch_bucket (Bucket_key, Datenformen [,…]) Es wird in einen anderen Eimer gewechselt.
aktualisieren() Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert.
update_metric (eval_metric, label [, pre_sliced]) Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie.

Attribute

Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen BaseModule Klasse -

Attribute Definition
Datennamen Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden.
Datenformen Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben.
label_shapes Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben.
Ausgabenamen Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls.
output_shapes Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben.
Symbol Wie angegeben, erhält dieses Attribut das diesem Modul zugeordnete Symbol.

data_shapes: Sie können auf den Link verweisen, der unter verfügbar ist https://mxnet.apache.orgfür Details. output_shapes: Mehr

output_shapes: Weitere Informationen finden Sie unter https://mxnet.apache.org/api/python

BucketingModule (sym_gen […])

Es repräsentiert die Bucketingmodule Klasse eines Moduls, mit dessen Hilfe Eingaben unterschiedlicher Länge effizient verarbeitet werden können.

Methoden

Die folgende Tabelle zeigt die Methoden, aus denen besteht BucketingModule class - -

Attribute

Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen BaseModule class - -

Attribute Definition
Datennamen Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden.
Datenformen Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben.
label_shapes Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben.
Ausgabenamen Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls.
output_shapes Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben.
Symbol Wie angegeben, erhält dieses Attribut das diesem Modul zugeordnete Symbol.

data_shapes - Sie können auf den Link unter verweisen https://mxnet.apache.org/api/python/docs für mehr Informationen.

output_shapes− Sie können auf den Link unter verweisen https://mxnet.apache.org/api/python/docs für mehr Informationen.

Modul (Symbol [, Datennamen, Labelnamen,…])

Es stellt ein Basismodul dar, das a umschließt symbol.

Methoden

Die folgende Tabelle zeigt die Methoden, aus denen besteht Module class - -

Methoden Definition
rückwärts ([out_grads]) Wie der Name schon sagt, implementiert diese Methode die backward Berechnung.
bind (data_shapes [, label_shapes,…]) Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann.
leihoptimierer (shared_module) Wie der Name schon sagt, leiht diese Methode den Optimierer von einem gemeinsam genutzten Modul aus.
vorwärts (data_batch [, is_train]) Wie der Name schon sagt, implementiert diese Methode die ForwardBerechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen.
get_input_grads ([merge_multi_context]) Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden.
get_outputs ([merge_multi_context]) Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung.
get_params () Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden.
get_states ([merge_multi_context]) Diese Methode ruft Zustände von allen Geräten ab
init_optimizer ([kvstore, optimizer,…]) Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen.
init_params ([initializer, arg_params,…]) Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände.
install_monitor (mon) Diese Methode installiert den Monitor auf allen Executoren.
Laden (Präfix, Epoche [, sym_gen,…]) Diese Methode erstellt ein Modell aus dem zuvor gespeicherten Prüfpunkt.
load_optimizer_states (fname) Diese Methode lädt einen Optimierer, dh den Updater-Status, aus einer Datei.
vorbereiten (data_batch [, sparse_row_id_fn]) Der Bediener bereitet das Modul für die Verarbeitung eines bestimmten Datenstapels vor.
umformen (data_shapes [, label_shapes]) Diese Methode formt das Modul, wie der Name schon sagt, für neue Eingabeformen um.
save_checkpoint (Präfix, Epoche [,…]) Es speichert den aktuellen Fortschritt zum Checkpoint.
save_optimizer_states (fname) Diese Methode speichert den Optimierer oder den Updater-Status in einer Datei.
set_params (arg_params, aux_params [,…]) Wie der Name schon sagt, weist diese Funktion Parameter und Hilfszustandswerte zu.
set_states ([Zustände, Wert]) Diese Methode legt, wie der Name schon sagt, den Wert für Zustände fest.
aktualisieren() Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert.
update_metric (eval_metric, label [, pre_sliced]) Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie.

Attribute

Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen Module class - -

Attribute Definition
Datennamen Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden.
Datenformen Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben.
label_shapes Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben.
Ausgabenamen Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls.
output_shapes Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben.
label_names Es besteht aus der Liste der Namen für Beschriftungen, die von diesem Modul benötigt werden.

data_shapes: Besuchen Sie den Link https://mxnet.apache.org/api/python/docs/api/module für weitere Details.

output_shapes: Der hier angegebene Link https://mxnet.apache.org/api/python/docs/api/module/index.html bietet weitere wichtige Informationen.

PythonLossModule ([Name, Datennamen,…])

Die Basis dieser Klasse ist mxnet.module.python_module.PythonModule. Die PythonLossModule-Klasse ist eine praktische Modulklasse, die alle oder viele Modul-APIs als leere Funktionen implementiert.

Methoden

Die folgende Tabelle zeigt die Methoden, aus denen besteht PythonLossModule Klasse:

Methoden Definition
rückwärts ([out_grads]) Wie der Name schon sagt, implementiert diese Methode die backward Berechnung.
vorwärts (data_batch [, is_train]) Wie der Name schon sagt, implementiert diese Methode die ForwardBerechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen.
get_input_grads ([merge_multi_context]) Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden.
get_outputs ([merge_multi_context]) Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung.
install_monitor (mon) Diese Methode installiert den Monitor auf allen Executoren.

PythonModule ([Datennamen, Labelnamen…])

Die Basis dieser Klasse ist mxnet.module.base_module.BaseModule. Die PythonModule-Klasse ist auch eine praktische Modulklasse, die alle oder viele Modul-APIs als leere Funktionen implementiert.

Methoden

Die folgende Tabelle zeigt die Methoden, aus denen besteht PythonModule Klasse -

Methoden Definition
bind (data_shapes [, label_shapes,…]) Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann.
get_params () Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden.
init_optimizer ([kvstore, optimizer,…]) Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen.
init_params ([initializer, arg_params,…]) Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände.
aktualisieren() Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert.
update_metric (eval_metric, label [, pre_sliced]) Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie.

Attribute

Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen PythonModule Klasse -

Attribute Definition
Datennamen Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden.
Datenformen Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben.
label_shapes Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben.
Ausgabenamen Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls.
output_shapes Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben.

data_shapes - Folgen Sie dem Link https://mxnet.apache.org für Details.

output_shapes - Weitere Informationen finden Sie unter dem Link unter https://mxnet.apache.org

SequentialModule ([Logger])

Die Basis dieser Klasse ist mxnet.module.base_module.BaseModule. Die SequentialModule-Klasse ist auch ein Containermodul, das mehr als zwei (mehrere) Module miteinander verketten kann.

Methoden

Die folgende Tabelle zeigt die Methoden, aus denen besteht SequentialModule Klasse

Methoden Definition
add (Modul, ** kwargs) Dies ist die wichtigste Funktion dieser Klasse. Es fügt der Kette ein Modul hinzu.
rückwärts ([out_grads]) Wie der Name schon sagt, implementiert diese Methode die Rückwärtsberechnung.
bind (data_shapes [, label_shapes,…]) Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann.
vorwärts (data_batch [, is_train]) Wie der Name schon sagt, implementiert diese Methode die Vorwärtsberechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen.
get_input_grads ([merge_multi_context]) Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden.
get_outputs ([merge_multi_context]) Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung.
get_params () Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden.
init_optimizer ([kvstore, optimizer,…]) Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen.
init_params ([initializer, arg_params,…]) Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände.
install_monitor (mon) Diese Methode installiert den Monitor auf allen Executoren.
aktualisieren() Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert.
update_metric (eval_metric, label [, pre_sliced]) Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie.

Attribute

Die folgende Tabelle zeigt die Attribute, die in den Methoden der BaseModule-Klasse enthalten sind -

Attribute Definition
Datennamen Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden.
Datenformen Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben.
label_shapes Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben.
Ausgabenamen Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls.
output_shapes Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben.
output_shapes Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben.

data_shapes - Der hier angegebene Link https://mxnet.apache.org wird Ihnen helfen, das Attribut im Detail zu verstehen.

output_shapes - Folgen Sie dem Link unter https://mxnet.apache.org/api für Details.

Implementierungsbeispiele

Im folgenden Beispiel erstellen wir eine mxnet Modul.

import mxnet as mx
input_data = mx.symbol.Variable('input_data')
f_connected1 = mx.symbol.FullyConnected(data, name='f_connected1', num_hidden=128)
activation_1 = mx.symbol.Activation(f_connected1, name='relu1', act_type="relu")
f_connected2 = mx.symbol.FullyConnected(activation_1, name = 'f_connected2', num_hidden = 64)
activation_2 = mx.symbol.Activation(f_connected2, name='relu2',
act_type="relu")
f_connected3 = mx.symbol.FullyConnected(activation_2, name='fc3', num_hidden=10)
out = mx.symbol.SoftmaxOutput(f_connected3, name = 'softmax')
mod = mx.mod.Module(out)
print(out)

Output

Die Ausgabe wird unten erwähnt -

<Symbol softmax>

Example

print(mod)

Output

Die Ausgabe wird unten gezeigt -

<mxnet.module.module.Module object at 0x00000123A9892F28>

In diesem Beispiel unten implementieren wir die Vorwärtsberechnung

import mxnet as mx
from collections import namedtuple
Batch = namedtuple('Batch', ['data'])
data = mx.sym.Variable('data')
out = data * 2
mod = mx.mod.Module(symbol=out, label_names=None)
mod.bind(data_shapes=[('data', (1, 10))])
mod.init_params()
data1 = [mx.nd.ones((1, 10))]
mod.forward(Batch(data1))
print (mod.get_outputs()[0].asnumpy())

Output

Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:

[[2. 2. 2. 2. 2. 2. 2. 2. 2. 2.]]

Example

data2 = [mx.nd.ones((3, 5))]

mod.forward(Batch(data2))
print (mod.get_outputs()[0].asnumpy())

Output

Unten ist die Ausgabe des Codes angegeben -

[[2. 2. 2. 2. 2.]
[2. 2. 2. 2. 2.]
[2. 2. 2. 2. 2.]]