Apache MXNet - Kurzanleitung
In diesem Kapitel werden die Funktionen von Apache MXNet vorgestellt und die neueste Version dieses Deep-Learning-Software-Frameworks vorgestellt.
Was ist MXNet?
Apache MXNet ist ein leistungsstarkes Open-Source-Framework-Instrument für Deep-Learning-Software, mit dem Entwickler Deep-Learning-Modelle erstellen, trainieren und bereitstellen können. In den letzten Jahren waren die Auswirkungen des tiefen Lernens von der Gesundheitsversorgung über den Transport bis zur Herstellung und in der Tat in allen Bereichen unseres täglichen Lebens weit verbreitet. Heutzutage suchen Unternehmen nach tiefem Lernen, um einige schwierige Probleme wie Gesichtserkennung, Objekterkennung, optische Zeichenerkennung (OCR), Spracherkennung und maschinelle Übersetzung zu lösen.
Aus diesem Grund wird Apache MXNet unterstützt von:
Einige große Unternehmen wie Intel, Baidu, Microsoft, Wolfram Research usw.
Öffentliche Cloud-Anbieter, einschließlich Amazon Web Services (AWS) und Microsoft Azure
Einige große Forschungsinstitute wie Carnegie Mellon, MIT, die University of Washington und die Hong Kong University of Science & Technology.
Warum Apache MXNet?
Es gibt verschiedene Deep-Learning-Plattformen wie Torch7, Caffe, Theano, TensorFlow, Keras, Microsoft Cognitive Toolkit usw. Dann fragen Sie sich vielleicht, warum Apache MXNet? Schauen wir uns einige der Gründe dafür an:
Apache MXNet löst eines der größten Probleme bestehender Deep-Learning-Plattformen. Das Problem ist, dass man, um Deep-Learning-Plattformen nutzen zu können, ein anderes System für eine andere Programmiervariante lernen muss.
Mit Hilfe von Apache MXNet können Entwickler die vollen Funktionen von GPUs sowie Cloud Computing nutzen.
Apache MXNet kann jede numerische Berechnung beschleunigen und legt besonderen Wert darauf, die Entwicklung und Bereitstellung von DNN (Deep Neural Networks) in großem Maßstab zu beschleunigen.
Es bietet den Benutzern die Möglichkeiten der imperativen und symbolischen Programmierung.
Verschiedene Funktionen
Wenn Sie nach einer flexiblen Deep-Learning-Bibliothek suchen, um schnell aktuelle Deep-Learning-Forschung zu entwickeln, oder nach einer robusten Plattform, um die Produktionsarbeitslast zu steigern, endet Ihre Suche bei Apache MXNet. Dies liegt an den folgenden Merkmalen:
Verteiltes Training
Ob Multi-GPU- oder Multi-Host-Training mit nahezu linearer Skalierungseffizienz - mit Apache MXNet können Entwickler das Beste aus ihrer Hardware herausholen. MXNet unterstützt auch die Integration mit Horovod, einem Open Source-Framework für verteiltes Deep Learning, das bei Uber erstellt wurde.
Für diese Integration sind im Folgenden einige der in Horovod definierten gängigen verteilten APIs aufgeführt:
horovod.broadcast()
horovod.allgather()
horovod.allgather()
In dieser Hinsicht bietet uns MXNet die folgenden Funktionen:
Device Placement - Mit Hilfe von MXNet können wir einfach jede Datenstruktur (DS) spezifizieren.
Automatic Differentiation - Apache MXNet automatisiert die Differenzierung, dh Ableitungsberechnungen.
Multi-GPU training - Mit MXNet können wir mit der Anzahl der verfügbaren GPUs eine Skalierungseffizienz erzielen.
Optimized Predefined Layers - Wir können unsere eigenen Layer in MXNet codieren sowie die vordefinierten Layer auch auf Geschwindigkeit optimieren.
Hybridisierung
Apache MXNet bietet seinen Benutzern ein hybrides Front-End. Mit Hilfe der Gluon Python API kann es die Lücke zwischen seinen imperativen und symbolischen Fähigkeiten schließen. Dies kann durch Aufrufen der Hybridisierungsfunktionalität erfolgen.
Schnellere Berechnung
Die linearen Operationen wie Dutzende oder Hunderte von Matrixmultiplikationen sind der rechnerische Engpass für tiefe neuronale Netze. Um diesen Engpass zu beheben, bietet MXNet -
Optimierte numerische Berechnung für GPUs
Optimierte numerische Berechnung für verteilte Ökosysteme
Automatisierung gängiger Workflows, mit deren Hilfe der Standard-NN kurz ausgedrückt werden kann.
Sprachbindungen
MXNet ist tief in Hochsprachen wie Python und R integriert. Es bietet auch Unterstützung für andere Programmiersprachen wie z.
Scala
Julia
Clojure
Java
C/C++
Perl
Wir müssen keine neue Programmiersprache lernen, stattdessen ermöglicht MXNet in Kombination mit der Hybridisierungsfunktion einen außergewöhnlich reibungslosen Übergang von Python zur Bereitstellung in der Programmiersprache unserer Wahl.
Neueste Version MXNet 1.6.0
Die Apache Software Foundation (ASF) hat am 21. Februar 2020 die stabile Version 1.6.0 von Apache MXNet unter Apache License 2.0 veröffentlicht. Dies ist die letzte MXNet-Version, die Python 2 unterstützt, da die MXNet-Community dafür gestimmt hat, Python 2 in weiteren Versionen nicht mehr zu unterstützen. Schauen wir uns einige der neuen Funktionen an, die diese Version für ihre Benutzer bietet.
NumPy-kompatible Schnittstelle
Aufgrund seiner Flexibilität und Allgemeingültigkeit wurde NumPy von Praktikern, Wissenschaftlern und Studenten des maschinellen Lernens häufig verwendet. Da wir jedoch wissen, dass heutzutage Hardwarebeschleuniger wie GPUs (Graphical Processing Units) zunehmend in verschiedene Toolkits für maschinelles Lernen (ML) integriert werden, müssen die NumPy-Benutzer auf neue Frameworks umsteigen, um die Geschwindigkeit von GPUs nutzen zu können mit unterschiedlicher Syntax.
Mit MXNet 1.6.0 entwickelt sich Apache MXNet zu einem NumPy-kompatiblen Programmiererlebnis. Die neue Benutzeroberfläche bietet Anwendern, die mit der NumPy-Syntax vertraut sind, eine gleichwertige Benutzerfreundlichkeit und Ausdruckskraft. Zusammen mit diesem MXNet 1.6.0 kann das vorhandene Numpy-System auch Hardwarebeschleuniger wie GPUs verwenden, um umfangreiche Berechnungen zu beschleunigen.
Integration mit Apache TVM
Apache TVM, ein Open-Source-End-to-End-Deep-Learning-Compiler-Stack für Hardware-Backends wie CPUs, GPUs und spezialisierte Beschleuniger, soll die Lücke zwischen produktivitätsorientierten Deep-Learning-Frameworks und leistungsorientierten Hardware-Backends schließen . Mit der neuesten Version MXNet 1.6.0 können Benutzer Apache (Inkubation) TVM nutzen, um leistungsstarke Operator-Kernel in der Programmiersprache Python zu implementieren. Zwei Hauptvorteile dieser neuen Funktion sind folgende:
Vereinfacht den früheren C ++ - basierten Entwicklungsprozess.
Ermöglicht die gemeinsame Nutzung derselben Implementierung für mehrere Hardware-Backends wie CPUs, GPUs usw.
Verbesserungen an vorhandenen Funktionen
Neben den oben aufgeführten Funktionen von MXNet 1.6.0 bietet es auch einige Verbesserungen gegenüber den vorhandenen Funktionen. Die Verbesserungen sind wie folgt:
Elementweise Operation für GPU gruppieren
Wie wir wissen, ist die Leistung von elementweisen Operationen die Speicherbandbreite, und das ist der Grund, warum das Verketten solcher Operationen die Gesamtleistung verringern kann. Apache MXNet 1.6.0 führt eine elementweise Operationsfusion durch, die nach Möglichkeit Just-in-Time-Fusionsoperationen generiert. Eine solche elementweise Betriebsfusion reduziert auch den Speicherbedarf und verbessert die Gesamtleistung.
Gemeinsame Ausdrücke vereinfachen
MXNet 1.6.0 eliminiert die redundanten Ausdrücke und vereinfacht die allgemeinen Ausdrücke. Eine solche Verbesserung verbessert auch die Speichernutzung und die Gesamtausführungszeit.
Optimierungen
MXNet 1.6.0 bietet außerdem verschiedene Optimierungen für vorhandene Funktionen und Operatoren:
Automatische gemischte Präzision
Gluon Fit API
MKL-DNN
Große Tensorunterstützung
TensorRT Integration
Gradientenunterstützung höherer Ordnung
Operators
Operator Performance Profiler
ONNX Import / Export
Verbesserungen an Gluon-APIs
Verbesserungen an Symbol-APIs
Mehr als 100 Fehlerkorrekturen
Um mit MXNet zu beginnen, müssen wir es zunächst auf unserem Computer installieren. Apache MXNet funktioniert auf nahezu allen verfügbaren Plattformen, einschließlich Windows, Mac und Linux.
Linux-Betriebssystem
Wir können MXNet unter Linux auf folgende Weise installieren:
Grafische Verarbeitungseinheit (GPU)
Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir GPU für die Verarbeitung verwenden -
Mit der Pip-Methode
Mit dem folgenden Befehl können Sie MXNet auf Ihrem Linus-Betriebssystem installieren:
pip install mxnet
Apache MXNet bietet auch MKL-Pip-Pakete an, die auf Intel-Hardware viel schneller sind. Hier zum Beispielmxnet-cu101mkl bedeutet, dass -
Das Paket wird mit CUDA / cuDNN erstellt
Das Paket ist MKL-DNN-fähig
Die CUDA-Version ist 10.1
Für andere Optionen können Sie auch verweisen https://pypi.org/project/mxnet/.
Mit Docker
Sie finden die Docker-Images mit MXNet bei DockerHub, das unter verfügbar ist https://hub.docker.com/u/mxnet Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit GPU zu installieren.
Step 1- Befolgen Sie zunächst die Docker-Installationsanweisungen, die unter verfügbar sind https://docs.docker.com/engine/install/ubuntu/. Wir müssen Docker auf unserem Computer installieren.
Step 2- Um die Verwendung von GPUs aus den Docker-Containern zu ermöglichen, müssen wir als nächstes das nvidia-Docker-Plugin installieren. Sie können den Installationsanweisungen unter folgenhttps://github.com/NVIDIA/nvidia-docker/wiki.
Step 3- Mit dem folgenden Befehl können Sie das MXNet-Docker-Image abrufen. -
$ sudo docker pull mxnet/python:gpu
Um zu sehen, ob das Abrufen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:
$ sudo docker images
Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden. Überprüfen Sie die folgenden Befehle -
$ sudo docker pull mxnet/python:1.3.0_cpu_mkl $ sudo docker images
Aus der Quelle
Um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode mit der GPU zu erstellen, müssen Sie zunächst die Umgebung für CUDA und cuDNN wie folgt einrichten
Laden Sie das CUDA-Toolkit herunter und installieren Sie es. Hier wird CUDA 9.2 empfohlen.
Nächster Download cuDNN 7.1.4.
Jetzt müssen wir die Datei entpacken. Es ist auch erforderlich, in das Stammverzeichnis cuDNN zu wechseln. Verschieben Sie außerdem den Header und die Bibliotheken wie folgt in den lokalen CUDA Toolkit-Ordner:
tar xvzf cudnn-9.2-linux-x64-v7.1
sudo cp -P cuda/include/cudnn.h /usr/local/cuda/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
sudo ldconfig
Führen Sie nach dem Einrichten der Umgebung für CUDA und cuDNN die folgenden Schritte aus, um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode zu erstellen.
Step 1- Zuerst müssen wir die erforderlichen Pakete installieren. Diese Abhängigkeiten sind ab Ubuntu Version 16.04 erforderlich.
sudo apt-get update
sudo apt-get install -y build-essential git ninja-build ccache libopenblas-dev
libopencv-dev cmake
Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zuerst das Repository mit dem folgenden Befehl klonen
git clone –recursive https://github.com/apache/incubator-mxnet.git mxnet
cd mxnet
cp config/linux_gpu.cmake #for build with CUDA
Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen
rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .
Two important points regarding the above step is as follows−
Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:
cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..
Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen:
cmake --build . --parallel N
Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Ordner in Ihrem MXNet project root, du wirst finden libmxnet.so Dies ist erforderlich, um Sprachbindungen zu installieren (optional).
Central Processing Unit (CPU)
Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir CPU für die Verarbeitung verwenden -
Mit der Pip-Methode
Mit dem folgenden Befehl können Sie MXNet auf Ihrem Linus OS installieren
pip install mxnet
Apache MXNet bietet auch MKL-DNN-fähige Pip-Pakete an, die viel schneller sind, wenn sie auf Intel-Hardware ausgeführt werden.
pip install mxnet-mkl
Mit Docker
Sie finden die Docker-Images mit MXNet bei DockerHub, das unter verfügbar ist https://hub.docker.com/u/mxnet. Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit CPU zu installieren.
Step 1- Befolgen Sie zunächst die Docker-Installationsanweisungen, die unter verfügbar sind https://docs.docker.com/engine/install/ubuntu/. Wir müssen Docker auf unserem Computer installieren.
Step 2- Mit dem folgenden Befehl können Sie das Docker-Image von MXNet abrufen:
$ sudo docker pull mxnet/python
Um zu sehen, ob das Abrufen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:
$ sudo docker images
Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden.
Überprüfen Sie die folgenden Befehle -
$ sudo docker pull mxnet/python:1.3.0_cpu_mkl $ sudo docker images
Aus der Quelle
Führen Sie die folgenden Schritte aus, um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode mit der CPU zu erstellen:
Step 1- Zuerst müssen wir die erforderlichen Pakete installieren. Diese Abhängigkeiten sind ab Ubuntu Version 16.04 erforderlich.
sudo apt-get update
sudo apt-get install -y build-essential git ninja-build ccache libopenblas-dev libopencv-dev cmake
Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zuerst das Repository mit dem folgenden Befehl klonen:
git clone –recursive https://github.com/apache/incubator-mxnet.git mxnet
cd mxnet
cp config/linux.cmake config.cmake
Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen:
rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .
Two important points regarding the above step is as follows−
Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:
cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..
Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen
cmake --build . --parallel N
Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Im Ordner in Ihrem MXNet-Projektstamm finden Sie libmxnet.so, das zum Installieren von Sprachbindungen erforderlich ist (optional).
Mac OS
Wir können MXNet unter MacOS auf folgende Arten installieren:
Grafische Verarbeitungseinheit (GPU)
Wenn Sie MXNet unter MacOS mit GPU erstellen möchten, steht KEINE Pip- und Docker-Methode zur Verfügung. Die einzige Methode in diesem Fall besteht darin, es aus dem Quellcode zu erstellen.
Aus der Quelle
Um die gemeinsam genutzte MXNet-Bibliothek aus dem Quellcode mit der GPU zu erstellen, müssen Sie zuerst die Umgebung für CUDA und cuDNN einrichten. Sie müssen dem folgenNVIDIA CUDA Installation Guide welches bei erhältlich ist https://docs.nvidia.com und cuDNN Installation Guide, welches bei erhältlich ist https://docs.nvidia.com/deeplearning für Mac OS.
Bitte beachten Sie, dass CUDA 2019 die Unterstützung von macOS eingestellt hat. Zukünftige Versionen von CUDA unterstützen möglicherweise auch nicht macOS.
Führen Sie nach dem Einrichten der Umgebung für CUDA und cuDNN die folgenden Schritte aus, um MXNet von der Quelle unter OS X (Mac) zu installieren.
Step 1- Da wir einige Abhängigkeiten von OS x benötigen, müssen wir zuerst die erforderlichen Pakete installieren.
xcode-select –-install #Install OS X Developer Tools
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" #Install Homebrew
brew install cmake ninja ccache opencv # Install dependencies
Wir können MXNet auch ohne OpenCV erstellen, da opencv eine optionale Abhängigkeit ist.
Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zuerst das Repository mit dem folgenden Befehl klonen
git clone –-recursive https://github.com/apache/incubator-mxnet.git mxnet
cd mxnet
cp config/linux.cmake config.cmake
Bei einer GPU-fähigen Version müssen zuerst die CUDA-Abhängigkeiten installiert werden, da MXNet-Build Ihre GPU-Architektur nicht automatisch erkennen kann, wenn versucht wird, einen GPU-fähigen Build auf einem Computer ohne GPU zu erstellen. In solchen Fällen zielt MXNet auf alle verfügbaren GPU-Architekturen ab.
Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen
rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .
Zwei wichtige Punkte in Bezug auf den obigen Schritt sind wie folgt:
Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:
cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..
Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen:
cmake --build . --parallel N
Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Ordner in Ihrem MXNet project root, du wirst finden libmxnet.dylib, Dies ist erforderlich, um Sprachbindungen zu installieren (optional).
Central Processing Unit (CPU)
Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir CPU für die Verarbeitung verwenden
Mit der Pip-Methode
Mit dem folgenden Befehl können Sie MXNet auf Ihrem Linus-Betriebssystem installieren
pip install mxnet
Mit Docker
Sie finden die Docker-Images mit MXNet bei DockerHub, das unter verfügbar ist https://hub.docker.com/u/mxnet. Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit CPU− zu installieren
Step 1- Folgen Sie zunächst den Anweisungen docker installation instructions welche verfügbar sind bei https://docs.docker.com/docker-for-mac Wir müssen Docker auf unserem Computer installieren.
Step 2- Mit dem folgenden Befehl können Sie das MXNet-Docker-Image abrufen
$ docker pull mxnet/python
Um zu sehen, ob das Ziehen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:
$ docker images
Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden. Überprüfen Sie die folgenden Befehle
$ docker pull mxnet/python:1.3.0_cpu_mkl
$ docker images
Aus der Quelle
Führen Sie die folgenden Schritte aus, um MXNet von der Quelle unter OS X (Mac) zu installieren.
Step 1- Da wir einige Abhängigkeiten von OS x benötigen, müssen wir zuerst die erforderlichen Pakete installieren.
xcode-select –-install #Install OS X Developer Tools
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" #Install Homebrew
brew install cmake ninja ccache opencv # Install dependencies
Wir können MXNet auch ohne OpenCV erstellen, da opencv eine optionale Abhängigkeit ist.
Step 2- In diesem Schritt laden wir die MXNet-Quelle herunter und konfigurieren sie. Lassen Sie uns zunächst das Repository mit dem folgenden Befehl klonen
git clone –-recursive https://github.com/apache/incubator-mxnet.git mxnet
cd mxnet
cp config/linux.cmake config.cmake
Step 3- Mit den folgenden Befehlen können Sie eine gemeinsam genutzte MXNet-Kernbibliothek erstellen:
rm -rf build
mkdir -p build && cd build
cmake -GNinja ..
cmake --build .
Two important points regarding the above step is as follows−
Wenn Sie die Debug-Version erstellen möchten, geben Sie Folgendes an:
cmake -DCMAKE_BUILD_TYPE=Debug -GNinja ..
Geben Sie Folgendes an, um die Anzahl der parallelen Kompilierungsjobs festzulegen
cmake --build . --parallel N
Sobald Sie die gemeinsam genutzte MXNet-Kernbibliothek erfolgreich erstellt haben, finden Sie in der build Ordner in Ihrem MXNet project root, du wirst finden libmxnet.dylib, Dies ist erforderlich, um Sprachbindungen zu installieren (optional).
Windows-Betriebssystem
Für die Installation von MXNet unter Windows gelten folgende Voraussetzungen:
Minimale Systemvoraussetzungen
Windows 7, 10, Server 2012 R2 oder Server 2016
Visual Studio 2015 oder 2017 (beliebiger Typ)
Python 2.7 oder 3.6
pip
Empfohlene Systemanforderungen
Windows 10, Server 2012 R2 oder Server 2016
Visual Studio 2017
Mindestens eine NVIDIA CUDA-fähige GPU
MKL-fähige CPU: Intel® Xeon®-Prozessor, Intel® Core ™ -Prozessorfamilie, Intel Atom®-Prozessor oder Intel® Xeon Phi ™ -Prozessor
Python 2.7 oder 3.6
pip
Grafische Verarbeitungseinheit (GPU)
Mit der Pip-Methode−
Wenn Sie MXNet unter Windows mit NVIDIA-GPUs erstellen möchten, gibt es zwei Möglichkeiten, MXNet mit CUDA-Unterstützung mit einem Python-Paket zu installieren
Installation mit CUDA-Unterstützung
Im Folgenden sind die Schritte aufgeführt, mit deren Hilfe wir MXNet mit CUDA einrichten können.
Step 1- Installieren Sie zuerst Microsoft Visual Studio 2017 oder Microsoft Visual Studio 2015.
Step 2- Laden Sie als Nächstes NVIDIA CUDA herunter und installieren Sie es. Es wird empfohlen, CUDA-Versionen 9.2 oder 9.0 zu verwenden, da in der Vergangenheit einige Probleme mit CUDA 9.1 festgestellt wurden.
Step 3- Laden Sie jetzt NVIDIA_CUDA_DNN herunter und installieren Sie es.
Step 4- Installieren Sie schließlich mit dem folgenden Befehl pip MXNet mit CUDA−
pip install mxnet-cu92
Installation mit CUDA- und MKL-Unterstützung
Im Folgenden sind die Schritte aufgeführt, mit deren Hilfe wir MXNet mit CUDA und MKL einrichten können.
Step 1- Installieren Sie zuerst Microsoft Visual Studio 2017 oder Microsoft Visual Studio 2015.
Step 2- Laden Sie als Nächstes Intel MKL herunter und installieren Sie es
Step 3- Laden Sie jetzt NVIDIA CUDA herunter und installieren Sie es.
Step 4- Laden Sie jetzt NVIDIA_CUDA_DNN herunter und installieren Sie es.
Step 5- Installieren Sie schließlich mit dem folgenden Befehl pip MXNet mit MKL.
pip install mxnet-cu92mkl
Aus der Quelle
Um die MXNet-Kernbibliothek aus dem Quellcode mit der GPU zu erstellen, haben wir die folgenden zwei Optionen:
Option 1− Build with Microsoft Visual Studio 2017
Um MXNet mithilfe von Microsoft Visual Studio 2017 selbst zu erstellen und zu installieren, benötigen Sie die folgenden Abhängigkeiten.
Install/update Microsoft Visual Studio.
Wenn Microsoft Visual Studio noch nicht auf Ihrem Computer installiert ist, laden Sie es zuerst herunter und installieren Sie es.
Sie werden aufgefordert, Git zu installieren. Installieren Sie es auch.
Wenn Microsoft Visual Studio bereits auf Ihrem Computer installiert ist, Sie es jedoch aktualisieren möchten, fahren Sie mit dem nächsten Schritt fort, um Ihre Installation zu ändern. Hier haben Sie die Möglichkeit, auch Microsoft Visual Studio zu aktualisieren.
Befolgen Sie die Anweisungen zum Öffnen des Visual Studio-Installationsprogramms unter https://docs.microsoft.com/en-us Einzelne Komponenten ändern.
Aktualisieren Sie in der Visual Studio Installer-Anwendung nach Bedarf. Danach suchen und überprüfenVC++ 2017 version 15.4 v14.11 toolset und klicken Sie auf Modify.
Ändern Sie nun mit dem folgenden Befehl die Version von Microsoft VS2017 in v14.11−
"C:\Program Files (x86)\Microsoft Visual Studio\2017\Community\VC\Auxiliary\Build\vcvars64.bat" -vcvars_ver=14.11
Als nächstes müssen Sie herunterladen und installieren CMake verfügbar um https://cmake.org/download/ Es wird empfohlen, zu verwenden CMake v3.12.2 welches bei erhältlich ist https://cmake.org/download/ weil es mit MXNet getestet wird.
Laden Sie jetzt das herunter und führen Sie es aus OpenCV Paket erhältlich bei https://sourceforge.net/projects/opencvlibrary/Dadurch werden mehrere Dateien entpackt. Es liegt an Ihnen, ob Sie sie in einem anderen Verzeichnis ablegen möchten oder nicht. Hier werden wir den Pfad verwendenC:\utils(mkdir C:\utils) als unser Standardpfad.
Als Nächstes müssen wir die Umgebungsvariable OpenCV_DIR so einstellen, dass sie auf das OpenCV-Buildverzeichnis verweist, das wir gerade entpackt haben. Öffnen Sie dazu die Eingabeaufforderung und geben Sie einset OpenCV_DIR=C:\utils\opencv\build.
Ein wichtiger Punkt ist, dass Sie die Intel MKL (Math Kernel Library) installieren können, wenn Sie sie nicht installiert haben.
Ein weiteres Open Source-Paket, das Sie verwenden können, ist OpenBLAS. Hier für die weiteren Anweisungen gehen wir davon aus, dass Sie verwendenOpenBLAS.
Laden Sie also die OpenBlas Paket, das verfügbar ist bei https://sourceforge.net und entpacken Sie die Datei, benennen Sie sie in um OpenBLAS und lege es unter C:\utils.
Als nächstes müssen wir die Umgebungsvariable setzen OpenBLAS_HOME um auf das OpenBLAS-Verzeichnis zu verweisen, das das enthält include und libVerzeichnisse. Öffnen Sie dazu die Eingabeaufforderung und geben Sie einset OpenBLAS_HOME=C:\utils\OpenBLAS.
Laden Sie jetzt CUDA herunter und installieren Sie es unter https://developer.nvidia.com. Beachten Sie, dass Sie CUDA jetzt neu installieren müssen, wenn Sie bereits CUDA hatten und dann Microsoft VS2017 installiert haben, damit Sie die CUDA-Toolkit-Komponenten für die Microsoft VS2017-Integration erhalten können.
Als nächstes müssen Sie cuDNN herunterladen und installieren.
Als nächstes müssen Sie git herunterladen und installieren, das sich bei befindet https://gitforwindows.org/ ebenfalls.
Nachdem Sie alle erforderlichen Abhängigkeiten installiert haben, führen Sie die folgenden Schritte aus, um den MXNet-Quellcode zu erstellen
Step 1- Öffnen Sie die Eingabeaufforderung in Windows.
Step 2- Laden Sie jetzt mit dem folgenden Befehl den MXNet-Quellcode von GitHub herunter:
cd C:\
git clone https://github.com/apache/incubator-mxnet.git --recursive
Step 3- Überprüfen Sie als Nächstes Folgendes -
DCUDNN_INCLUDE and DCUDNN_LIBRARY Umgebungsvariablen zeigen auf die include Ordner und cudnn.lib Datei Ihres CUDA-Installationsorts
C:\incubator-mxnet ist der Speicherort des Quellcodes, den Sie gerade im vorherigen Schritt geklont haben.
Step 4- Erstellen Sie als Nächstes mit dem folgenden Befehl einen Build directory und gehen Sie auch in das Verzeichnis, zum Beispiel -
mkdir C:\incubator-mxnet\build
cd C:\incubator-mxnet\build
Step 5- Kompilieren Sie nun mithilfe von cmake den MXNet-Quellcode wie folgt:
cmake -G "Visual Studio 15 2017 Win64" -T cuda=9.2,host=x64 -DUSE_CUDA=1 -DUSE_CUDNN=1 -DUSE_NVRTC=1 -DUSE_OPENCV=1 -DUSE_OPENMP=1 -DUSE_BLAS=open -DUSE_LAPACK=1 -DUSE_DIST_KVSTORE=0 -DCUDA_ARCH_LIST=Common -DCUDA_TOOLSET=9.2 -DCUDNN_INCLUDE=C:\cuda\include -DCUDNN_LIBRARY=C:\cuda\lib\x64\cudnn.lib "C:\incubator-mxnet"
Step 6- Verwenden Sie nach erfolgreichem Abschluss des CMake den folgenden Befehl, um den MXNet-Quellcode zu kompilieren
msbuild mxnet.sln /p:Configuration=Release;Platform=x64 /maxcpucount
Option 2: Build with Microsoft Visual Studio 2015
Um MXNet mithilfe von Microsoft Visual Studio 2015 selbst zu erstellen und zu installieren, benötigen Sie die folgenden Abhängigkeiten.
Installieren / Aktualisieren von Microsoft Visual Studio 2015. Die Mindestanforderung zum Erstellen von MXnet aus dem Quellcode ist Update 3 von Microsoft Visual Studio 2015. Sie können es verwenden Tools -> Extensions and Updates... | Product Updates Menü, um es zu aktualisieren.
Als nächstes müssen Sie herunterladen und installieren CMake welches bei erhältlich ist https://cmake.org/download/. Es wird empfohlen, zu verwendenCMake v3.12.2 das ist bei https://cmake.org/download/, weil es mit MXNet getestet wird.
Laden Sie jetzt das OpenCV-Paket herunter und führen Sie es aus, das unter verfügbar ist https://excellmedia.dl.sourceforge.netDadurch werden mehrere Dateien entpackt. Es liegt an Ihnen, ob Sie sie in einem anderen Verzeichnis ablegen möchten oder nicht.
Als nächstes müssen wir die Umgebungsvariable setzen OpenCV_DIR auf die zeigen OpenCVBuild-Verzeichnis, das wir gerade entpackt haben. Öffnen Sie dazu die Eingabeaufforderung und geben Sie set einOpenCV_DIR=C:\opencv\build\x64\vc14\bin.
Ein wichtiger Punkt ist, dass Sie die Intel MKL (Math Kernel Library) installieren können, wenn Sie sie nicht installiert haben.
Ein weiteres Open Source-Paket, das Sie verwenden können, ist OpenBLAS. Hier für die weiteren Anweisungen gehen wir davon aus, dass Sie verwendenOpenBLAS.
Laden Sie also die OpenBLAS Paket erhältlich bei https://excellmedia.dl.sourceforge.net und entpacken Sie die Datei, benennen Sie sie in OpenBLAS um und legen Sie sie unter C: \ utils ab.
Als nächstes müssen wir die Umgebungsvariable OpenBLAS_HOME so einstellen, dass sie auf das OpenBLAS-Verzeichnis verweist, das die Verzeichnisse include und lib enthält. Sie finden das Verzeichnis inC:\Program files (x86)\OpenBLAS\
Wenn Sie bereits CUDA hatten und dann Microsoft VS2015 installiert haben, müssen Sie CUDA jetzt neu installieren, damit Sie die CUDA-Toolkit-Komponenten für die Microsoft VS2017-Integration erhalten.
Als nächstes müssen Sie cuDNN herunterladen und installieren.
Jetzt müssen wir die Umgebungsvariable CUDACXX so einstellen, dass sie auf die zeigt CUDA Compiler(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.1\bin\nvcc.exe zum Beispiel).
In ähnlicher Weise müssen wir auch die Umgebungsvariable festlegen CUDNN_ROOT auf die zeigen cuDNN Verzeichnis, das das enthält include, lib und bin Verzeichnisse (C:\Downloads\cudnn-9.1-windows7-x64-v7\cuda zum Beispiel).
Nachdem Sie alle erforderlichen Abhängigkeiten installiert haben, führen Sie die folgenden Schritte aus, um den MXNet-Quellcode zu erstellen
Step 1- Laden Sie zunächst den MXNet-Quellcode von GitHub− herunter
cd C:\
git clone https://github.com/apache/incubator-mxnet.git --recursive
Step 2- Verwenden Sie als Nächstes CMake, um ein Visual Studio in ./build zu erstellen.
Step 3- In Visual Studio müssen wir jetzt die Lösungsdatei öffnen..slnund kompiliere es. Diese Befehle erzeugen eine Bibliothek namensmxnet.dll in dem ./build/Release/ or ./build/Debug Mappe
Step 4- Verwenden Sie nach erfolgreichem Abschluss von CMake den folgenden Befehl, um den MXNet-Quellcode zu kompilieren
msbuild mxnet.sln /p:Configuration=Release;Platform=x64 /maxcpucount
Central Processing Unit (CPU)
Hier werden wir verschiedene Methoden verwenden, nämlich Pip, Docker und Source, um MXNet zu installieren, wenn wir CPU für die Verarbeitung verwenden
Mit der Pip-Methode
Wenn Sie MXNet unter Windows mit CPUs erstellen möchten, gibt es zwei Möglichkeiten, MXNet mithilfe eines Python-Pakets zu installieren
Install with CPUs
Verwenden Sie den folgenden Befehl, um MXNet mit CPU mit Python− zu installieren
pip install mxnet
Install with Intel CPUs
Wie oben erläutert, bietet MXNet experimentelle Unterstützung für Intel MKL sowie MKL-DNN. Verwenden Sie den folgenden Befehl, um MXNet mit Intel CPU mit Python− zu installieren
pip install mxnet-mkl
Mit Docker
Sie finden die Docker-Bilder mit MXNet unter DockerHub, verfügbar um https://hub.docker.com/u/mxnet Sehen wir uns die folgenden Schritte an, um MXNet mithilfe von Docker mit CPU− zu installieren
Step 1- Befolgen Sie zunächst die Docker-Installationsanweisungen, die unter gelesen werden können https://docs.docker.com/docker-for-mac/install. Wir müssen Docker auf unserem Computer installieren.
Step 2- Mit dem folgenden Befehl können Sie das MXNet-Docker-Image abrufen
$ docker pull mxnet/python
Um zu sehen, ob das Ziehen von mxnet / python-Docker-Bildern erfolgreich war, können wir Docker-Bilder wie folgt auflisten:
$ docker images
Für die schnellsten Inferenzgeschwindigkeiten mit MXNet wird empfohlen, das neueste MXNet mit Intel MKL-DNN zu verwenden.
Überprüfen Sie die folgenden Befehle
$ docker pull mxnet/python:1.3.0_cpu_mkl $ docker images
Installieren von MXNet in der Cloud und auf Geräten
In diesem Abschnitt wird erläutert, wie Sie Apache MXNet in der Cloud und auf Geräten installieren. Beginnen wir mit der Installation von MXNet in der Cloud.
MXNet in der Cloud installieren
Sie können Apache MXNet auch bei mehreren Cloud-Anbietern mit herunterladen Graphical Processing Unit (GPU)Unterstützung. Zwei andere Arten von Unterstützung, die Sie finden können, sind wie folgt:
- GPU / CPU-Hybrid-Unterstützung für Anwendungsfälle wie skalierbare Inferenz.
- Faktorielle GPU-Unterstützung mit AWS Elastic Inference.
Im Folgenden finden Sie Cloud-Anbieter, die GPU-Unterstützung mit verschiedenen virtuellen Maschinen für Apache MXNet− anbieten
Die Alibaba-Konsole
Sie können die erstellen NVIDIA GPU Cloud Virtual Machine (VM) verfügbar um https://docs.nvidia.com/ngc mit der Alibaba-Konsole und verwenden Sie Apache MXNet.
Amazon Web Services
Es bietet auch GPU-Unterstützung und bietet die folgenden Dienste für Apache MXNet−
Amazon SageMaker
Es verwaltet die Schulung und Bereitstellung von Apache MXNet-Modellen.
AWS Deep Learning AMI
Es bietet eine vorinstallierte Conda-Umgebung für Python 2 und Python 3 mit Apache MXNet, CUDA, cuDNN, MKL-DNN und AWS Elastic Inference.
Dynamisches Training auf AWS
Es bietet Schulungen für das experimentelle manuelle EC2-Setup sowie für das halbautomatische CloudFormation-Setup.
Sie können verwenden NVIDIA VM verfügbar um https://aws.amazon.com mit Amazon Web Services.
Google Cloud Platform
Google bietet auch NVIDIA GPU cloud image welches bei erhältlich ist https://console.cloud.google.com mit Apache MXNet arbeiten.
Microsoft Azure
Microsoft Azure Marketplace bietet ebenfalls NVIDIA GPU cloud image verfügbar um https://azuremarketplace.microsoft.com mit Apache MXNet arbeiten.
Oracle Cloud
Oracle bietet auch NVIDIA GPU cloud image verfügbar um https://docs.cloud.oracle.com mit Apache MXNet arbeiten.
Central Processing Unit (CPU)
Apache MXNet funktioniert auf der Nur-CPU-Instanz jedes Cloud-Anbieters. Es gibt verschiedene Methoden zur Installation, wie z
Installationsanweisungen für Python Pip.
Docker-Anweisungen.
Vorinstallierte Option wie Amazon Web Services, die AWS Deep Learning AMI bereitstellt (mit vorinstallierter Conda-Umgebung für Python 2 und Python 3 mit MXNet und MKL-DNN).
MXNet auf Geräten installieren
Lassen Sie uns lernen, wie Sie MXNet auf Geräten installieren.
Himbeer-Pi
Sie können Apache MXNet auch auf Raspberry Pi 3B-Geräten ausführen, da MXNet auch das auf Respbian ARM basierende Betriebssystem unterstützt. Um MXNet reibungslos auf dem Raspberry Pi3 ausführen zu können, wird empfohlen, ein Gerät mit mehr als 1 GB RAM und eine SD-Karte mit mindestens 4 GB freiem Speicherplatz zu verwenden.
Im Folgenden finden Sie die Möglichkeiten, mit denen Sie MXNet für den Raspberry Pi erstellen und die Python-Bindungen auch für die Bibliothek installieren können
Schnelle Installation
Das vorgefertigte Python-Rad kann für eine schnelle Installation auf einem Raspberry Pi 3B mit Stretch verwendet werden. Eines der wichtigen Probleme bei dieser Methode ist, dass wir mehrere Abhängigkeiten installieren müssen, damit Apache MXNet funktioniert.
Docker-Installation
Sie können den Docker-Installationsanweisungen folgen, die unter verfügbar sind https://docs.docker.com/engine/install/ubuntu/um Docker auf Ihrem Computer zu installieren. Zu diesem Zweck können wir auch die Community Edition (CE) installieren und verwenden.
Native Build (aus der Quelle)
Um MXNet von der Quelle aus zu installieren, müssen Sie die folgenden zwei Schritte ausführen:
Schritt 1
Build the shared library from the Apache MXNet C++ source code
Um die gemeinsam genutzte Bibliothek auf Raspberry-Version Wheezy und höher aufzubauen, benötigen wir die folgenden Abhängigkeiten:
Git- Es ist erforderlich, Code von GitHub abzurufen.
Libblas- Es ist für lineare algebraische Operationen erforderlich.
Libopencv- Es ist für Operationen im Zusammenhang mit Computer Vision erforderlich. Es ist jedoch optional, wenn Sie RAM und Speicherplatz sparen möchten.
C++ Compiler- Es ist erforderlich, MXNet-Quellcode zu kompilieren und zu erstellen. Im Folgenden sind die unterstützten Compiler aufgeführt, die C ++ 11− unterstützen
G ++ (Version 4.8 oder höher)
Clang(3.9-6)
Verwenden Sie die folgenden Befehle, um die oben genannten Abhängigkeiten zu installieren
sudo apt-get update
sudo apt-get -y install git cmake ninja-build build-essential g++-4.9 c++-4.9 liblapack*
libblas* libopencv*
libopenblas* python3-dev python-dev virtualenv
Als nächstes müssen wir das MXNet-Quellcode-Repository klonen. Verwenden Sie dazu den folgenden Befehl git in Ihrem Home-Verzeichnis
git clone https://github.com/apache/incubator-mxnet.git --recursive
cd incubator-mxnet
Erstellen Sie nun mithilfe der folgenden Befehle die gemeinsam genutzte Bibliothek:
mkdir -p build && cd build
cmake \
-DUSE_SSE=OFF \
-DUSE_CUDA=OFF \
-DUSE_OPENCV=ON \
-DUSE_OPENMP=ON \
-DUSE_MKL_IF_AVAILABLE=OFF \
-DUSE_SIGNAL_HANDLER=ON \
-DCMAKE_BUILD_TYPE=Release \
-GNinja ..
ninja -j$(nproc)
Sobald Sie die obigen Befehle ausgeführt haben, wird der Erstellungsprozess gestartet, dessen Abschluss einige Stunden dauern wird. Sie erhalten eine Datei mit dem Namenlibmxnet.so im Erstellungsverzeichnis.
Schritt 2
Install the supported language-specific packages for Apache MXNet
In diesem Schritt installieren wir MXNet Pythin-Bindungen. Dazu müssen wir den folgenden Befehl im MXNet-Verzeichnis ausführen
cd python
pip install --upgrade pip
pip install -e .
Alternativ können Sie mit dem folgenden Befehl auch eine erstellen whl package installierbar mit pip- -
ci/docker/runtime_functions.sh build_wheel python/ $(realpath build)
NVIDIA Jetson-Geräte
Sie können Apache MXNet auch auf NVIDIA Jetson-Geräten ausführen, z TX2 oder Nanoals MXNet unterstützt auch das Ubuntu Arch64-basierte Betriebssystem. Damit MXNet reibungslos auf den NVIDIA Jetson-Geräten ausgeführt werden kann, muss CUDA auf Ihrem Jetson-Gerät installiert sein.
Im Folgenden finden Sie die Möglichkeiten, mit denen Sie MXNet für NVIDIA Jetson-Geräte erstellen können:
Mit einem Jetson MXNet Pip Wheel für die Python-Entwicklung
Aus der Quelle
Bevor Sie MXNet jedoch auf eine der oben genannten Arten erstellen, müssen Sie die folgenden Abhängigkeiten von Ihren Jetson-Geräten installieren
Python-Abhängigkeiten
Um die Python-API verwenden zu können, benötigen wir die folgenden Abhängigkeiten
sudo apt update
sudo apt -y install \
build-essential \
git \
graphviz \
libatlas-base-dev \
libopencv-dev \
python-pip
sudo pip install --upgrade \
pip \
setuptools
sudo pip install \
graphviz==0.8.4 \
jupyter \
numpy==1.15.2
Klonen Sie das MXNet-Quellcode-Repository
Klonen Sie das MXNet-Quellcode-Repository mit dem folgenden Befehl git in Ihrem Home-Verzeichnis
git clone --recursive https://github.com/apache/incubator-mxnet.git mxnet
Umgebungsvariablen einrichten
Fügen Sie Folgendes in Ihr .profile Datei in Ihrem Home-Verzeichnis−
export PATH=/usr/local/cuda/bin:$PATH export MXNET_HOME=$HOME/mxnet/
export PYTHONPATH=$MXNET_HOME/python:$PYTHONPATH
Wenden Sie die Änderung jetzt sofort mit dem folgenden Befehl an
source .profile
Konfigurieren Sie CUDA
Bevor Sie CUDA mit nvcc konfigurieren, müssen Sie überprüfen, welche Version von CUDA ausgeführt wird
nvcc --version
Angenommen, wenn mehr als eine CUDA-Version auf Ihrem Gerät oder Computer installiert ist und Sie die CUDA-Versionen wechseln möchten, verwenden Sie Folgendes und ersetzen Sie den symbolischen Link zu der gewünschten Version
sudo rm /usr/local/cuda
sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda
Der obige Befehl wechselt zu CUDA 10.0, das auf dem NVIDIA Jetson-Gerät vorinstalliert ist Nano.
Nachdem Sie die oben genannten Voraussetzungen erfüllt haben, können Sie MXNet jetzt auf NVIDIA Jetson-Geräten installieren. Lassen Sie uns die Möglichkeiten verstehen, mit denen Sie MXNet− installieren können
By using a Jetson MXNet pip wheel for Python development- Wenn Sie ein vorbereitetes Python-Rad verwenden möchten, laden Sie Folgendes auf Ihren Jetson herunter und führen Sie es aus
MXNet 1.4.0 (für Python 3) erhältlich bei https://docs.docker.com
MXNet 1.4.0 (für Python 2) erhältlich bei https://docs.docker.com
Native Build (aus der Quelle)
Um MXNet von der Quelle aus zu installieren, müssen Sie die folgenden zwei Schritte ausführen:
Schritt 1
Build the shared library from the Apache MXNet C++ source code
Um die gemeinsam genutzte Bibliothek aus dem Apache MXNet C ++ - Quellcode zu erstellen, können Sie entweder die Docker-Methode verwenden oder dies manuell tun
Docker-Methode
Bei dieser Methode müssen Sie zuerst Docker installieren und es ohne sudo ausführen können (was auch in den vorherigen Schritten erläutert wurde). Führen Sie anschließend die folgenden Schritte aus, um die Cross-Kompilierung über Docker− auszuführen
$MXNET_HOME/ci/build.py -p jetson
Handbuch
Bei dieser Methode müssen Sie die bearbeiten Makefile (mit dem folgenden Befehl) So installieren Sie das MXNet mit CUDA-Bindungen, um die Grafikprozessoren (GPU) auf NVIDIA Jetson-Geräten zu nutzen:
cp $MXNET_HOME/make/crosscompile.jetson.mk config.mk
Nach dem Bearbeiten des Makefiles müssen Sie die Datei config.mk bearbeiten, um einige zusätzliche Änderungen für das NVIDIA Jetson-Gerät vorzunehmen.
Aktualisieren Sie dazu die folgenden Einstellungen
Aktualisieren Sie den CUDA-Pfad: USE_CUDA_PATH = / usr / local / cuda
Fügen Sie der Einstellung CUDA_ARCH -gencode arch = compute-63, code = sm_62 hinzu.
Aktualisieren Sie die NVCC-Einstellungen: NVCCFLAGS: = -m64
Aktivieren Sie OpenCV: USE_OPENCV = 1
Um sicherzustellen, dass das MXNet mit Pascals Hardwarebeschleunigung mit geringer Genauigkeit erstellt wird, müssen wir das Mshadow-Makefile wie folgt bearbeiten:
MSHADOW_CFLAGS += -DMSHADOW_USE_PASCAL=1
Schließlich können Sie mit Hilfe des folgenden Befehls die vollständige Apache MXNet-Bibliothek erstellen
cd $MXNET_HOME make -j $(nproc)
Sobald Sie die obigen Befehle ausgeführt haben, wird der Erstellungsprozess gestartet, dessen Abschluss einige Stunden dauern wird. Sie erhalten eine Datei mit dem Namenlibmxnet.so in dem mxnet/lib directory.
Schritt 2
Install the Apache MXNet Python Bindings
In diesem Schritt installieren wir MXNet Python-Bindungen. Dazu müssen wir den folgenden Befehl im MXNet-Verzeichnis ausführen
cd $MXNET_HOME/python
sudo pip install -e .
Nachdem Sie die obigen Schritte ausgeführt haben, können Sie MXNet jetzt auf Ihren NVIDIA Jetson-Geräten TX2 oder Nano ausführen. Dies kann mit dem folgenden Befehl überprüft werden
import mxnet
mxnet.__version__
Die Versionsnummer wird zurückgegeben, wenn alles ordnungsgemäß funktioniert.
Um die Forschung und Entwicklung von Deep Learning-Anwendungen in vielen Bereichen zu unterstützen, bietet Apache MXNet ein reichhaltiges Ökosystem an Toolkits, Bibliotheken und vielem mehr. Lassen Sie uns sie erkunden -
ToolKits
Im Folgenden finden Sie einige der am häufigsten verwendeten und wichtigsten Toolkits von MXNet:
GluonCV
Wie der Name schon sagt, ist GluonCV ein Gluon-Toolkit für Computer Vision, das von MXNet unterstützt wird. Es bietet die Implementierung modernster DL-Algorithmen (Deep Learning) in Computer Vision (CV). Mit Hilfe des GluonCV-Toolkits können Ingenieure, Forscher und Studenten neue Ideen validieren und den Lebenslauf einfach lernen.
Im Folgenden sind einige der features of GluonCV - -
Es trainiert Skripte für die Reproduktion der neuesten Ergebnisse, die in neuesten Forschungsergebnissen veröffentlicht wurden.
Mehr als 170 hochwertige, vorgefertigte Modelle.
Umfassen Sie flexibles Entwicklungsmuster.
GluonCV ist einfach zu optimieren. Wir können es bereitstellen, ohne das schwere DL-Framework beizubehalten.
Es bietet sorgfältig gestaltete APIs, die die Komplexität der Implementierung erheblich verringern.
Gemeinschaftliche Unterstützung.
Einfach zu verstehende Implementierungen.
Es folgen die supported applications von GluonCV Toolkit:
Bildklassifizierung
Objekterkennung
Semantische Segmentierung
Instanzsegmentierung
Posenschätzung
Video-Aktionserkennung
Wir können GluonCV mithilfe von pip wie folgt installieren:
pip install --upgrade mxnet gluoncv
GluonNLP
Wie der Name schon sagt, ist GluonNLP ein Gluon-Toolkit für die Verarbeitung natürlicher Sprache (NLP), das von MXNet unterstützt wird. Es bietet die Implementierung modernster DL-Modelle (Deep Learning) in NLP.
Mithilfe des GluonNLP-Toolkits können Ingenieure, Forscher und Studenten Blöcke für Textdaten-Pipelines und -Modelle erstellen. Basierend auf diesen Modellen können sie schnell Prototypen der Forschungsideen und des Produkts erstellen.
Im Folgenden sind einige der Funktionen von GluonNLP aufgeführt:
Es trainiert Skripte für die Reproduktion der neuesten Ergebnisse, die in neuesten Forschungsergebnissen veröffentlicht wurden.
Satz vorab trainierter Modelle für allgemeine NLP-Aufgaben.
Es bietet sorgfältig gestaltete APIs, die die Komplexität der Implementierung erheblich verringern.
Gemeinschaftliche Unterstützung.
Es enthält auch Tutorials, die Ihnen den Einstieg in neue NLP-Aufgaben erleichtern.
Im Folgenden sind die NLP-Aufgaben aufgeführt, die wir mit dem GluonNLP-Toolkit implementieren können:
Worteinbettung
Sprachmodell
Maschinenübersetzung
Textklassifizierung
Stimmungsanalyse
Inferenz natürlicher Sprache
Texterzeugung
Abhängigkeitsanalyse
Named Entity Recognition
Absichtsklassifizierung und Slot-Kennzeichnung
Wir können GluonNLP mithilfe von pip wie folgt installieren:
pip install --upgrade mxnet gluonnlp
Gluonen
Wie der Name schon sagt, ist GluonTS ein Gluon-Toolkit für die probabilistische Zeitreihenmodellierung, das von MXNet unterstützt wird.
Es bietet die folgenden Funktionen:
Deep-Learning-Modelle nach dem neuesten Stand der Technik (SOTA), die für das Training bereit sind.
Die Dienstprogramme zum Laden und Durchlaufen von Zeitreihendatensätzen.
Bausteine zur Definition Ihres eigenen Modells.
Mithilfe des GluonTS-Toolkits können Ingenieure, Forscher und Studenten jedes der integrierten Modelle anhand ihrer eigenen Daten trainieren und bewerten, schnell mit verschiedenen Lösungen experimentieren und eine Lösung für ihre Zeitreihenaufgaben finden.
Sie können die bereitgestellten Abstraktionen und Bausteine auch verwenden, um benutzerdefinierte Zeitreihenmodelle zu erstellen und diese schnell mit Basisalgorithmen zu vergleichen.
Wir können GluonTS mithilfe von pip wie folgt installieren:
pip install gluonts
GluonFR
Wie der Name schon sagt, handelt es sich um ein Apache MXNet Gluon-Toolkit für FR (Gesichtserkennung). Es bietet die folgenden Funktionen:
Deep-Learning-Modelle nach dem neuesten Stand der Technik (SOTA) zur Gesichtserkennung.
Die Implementierung von SoftmaxCrossEntropyLoss, ArcLoss, TripletLoss, RingLoss, CosLoss / AMsoftmax, L2-Softmax, A-Softmax, CenterLoss, ContrastiveLoss und LGM Loss usw.
Um Gluon Face zu installieren, benötigen wir Python 3.5 oder höher. Wir müssen auch zuerst GluonCV und MXNet wie folgt installieren:
pip install gluoncv --pre
pip install mxnet-mkl --pre --upgrade
pip install mxnet-cuXXmkl --pre –upgrade # if cuda XX is installed
Nachdem Sie die Abhängigkeiten installiert haben, können Sie GluonFR mit dem folgenden Befehl installieren:
From Source
pip install git+https://github.com/THUFutureLab/gluon-face.git@master
Pip
pip install gluonfr
Ökosystem
Lassen Sie uns nun die umfangreichen Bibliotheken, Pakete und Frameworks von MXNet erkunden.
Trainer RL
Coach, ein RL-Framework (Python Reinforcement Learning), das vom Intel AI Lab erstellt wurde. Es ermöglicht ein einfaches Experimentieren mit hochmodernen RL-Algorithmen. Coach RL unterstützt Apache MXNet als Backend und ermöglicht die einfache Integration neuer Umgebungen.
Um vorhandene Komponenten problemlos zu erweitern und wiederzuverwenden, hat Coach RL die grundlegenden Komponenten des Verstärkungslernens wie Algorithmen, Umgebungen, NN-Architekturen und Explorationsrichtlinien sehr gut entkoppelt.
Im Folgenden sind die Agenten und unterstützten Algorithmen für das Coach RL-Framework aufgeführt:
Value Optimization Agents
Deep Q Network (DQN)
Double Deep Q Network (DDQN)
Duell Q Network
Gemischtes Monte Carlo (MMC)
Persistent Advantage Learning (PAL)
Kategoriales Deep Q-Netzwerk (C51)
Quantiles Regressions-Deep-Q-Netzwerk (QR-DQN)
N-Schritt Q Lernen
Neuronale episodische Kontrolle (NEC)
Normalisierte Vorteilsfunktionen (NAF)
Rainbow
Agenten zur Richtlinienoptimierung
Policy Gradients (PG)
Asynchronous Advantage Actor-Critic (A3C)
Deep Deterministic Policy Gradients (DDPG)
Proximale Richtlinienoptimierung (PPO)
Clipped Proximal Policy Optimization (CPPO)
Generalized Advantage Estimation (GAE)
Beispiel für einen effizienten Schauspieler-Kritiker mit Erfahrungswiederholung (ACER)
Soft Actor-Critic (SAC)
Twin Delayed Deep Deterministic Policy Gradient (TD3)
Generalvertreter
Direkte Zukunftsprognose (DFP)
Imitation Learning Agents
Behavioral Cloning (BC)
Bedingtes Nachahmungslernen
Hierarchical Reinforcement Learning Agents
Hierarchical Actor Critic (HAC)
Deep Graph Library
Die Deep Graph Library (DGL), die von den NYU- und AWS-Teams in Shanghai entwickelt wurde, ist ein Python-Paket, das eine einfache Implementierung von Graph Neural Networks (GNNs) über MXNet bietet. Es bietet auch eine einfache Implementierung von GNNs zusätzlich zu anderen vorhandenen großen Deep-Learning-Bibliotheken wie PyTorch, Gluon usw.
Deep Graph Library ist eine kostenlose Software. Es ist auf allen Linux-Distributionen später als Ubuntu 16.04, macOS X und Windows 7 oder höher verfügbar. Es erfordert auch die Python 3.5-Version oder höher.
Im Folgenden sind die Funktionen von DGL aufgeführt:
No Migration cost - Für die Verwendung von DGL fallen keine Migrationskosten an, da es auf den gängigen DL-Frameworks basiert.
Message Passing- DGL bietet die Weitergabe von Nachrichten und hat eine vielseitige Kontrolle darüber. Die Nachrichtenübermittlung reicht von Operationen auf niedriger Ebene wie dem Senden entlang ausgewählter Kanten bis hin zur Steuerung auf hoher Ebene wie grafikweiten Funktionsaktualisierungen.
Smooth Learning Curve - DGL ist recht einfach zu erlernen und zu verwenden, da die leistungsstarken benutzerdefinierten Funktionen sowohl flexibel als auch benutzerfreundlich sind.
Transparent Speed Optimization - DGL bietet eine transparente Geschwindigkeitsoptimierung durch automatische Stapelverarbeitung von Berechnungen und Multiplikation mit geringer Matrix.
High performance - Um maximale Effizienz zu erzielen, stapelt DGL das DNN-Training (Deep Neural Networks) automatisch in einem oder mehreren Diagrammen.
Easy & friendly interface - DGL bietet uns einfache und benutzerfreundliche Schnittstellen für den Zugriff auf Kantenfunktionen sowie für die Manipulation der Diagrammstruktur.
InsightFace
InsightFace, ein Deep Learning Toolkit für die Gesichtsanalyse, das die Implementierung des SOTA-Gesichtsanalysealgorithmus (Stand der Technik) in Computer Vision mit MXNet ermöglicht. Es bietet -
Hochwertiger großer Satz vorgefertigter Modelle.
Schulungsskripte nach dem neuesten Stand der Technik (SOTA).
InsightFace ist einfach zu optimieren. Wir können es bereitstellen, ohne das schwere DL-Framework beizubehalten.
Es bietet sorgfältig gestaltete APIs, die die Komplexität der Implementierung erheblich verringern.
Bausteine zur Definition Ihres eigenen Modells.
Wir können InsightFace mithilfe von pip wie folgt installieren:
pip install --upgrade insightface
Bitte beachten Sie, dass Sie vor der Installation von InsightFace das richtige MXNet-Paket entsprechend Ihrer Systemkonfiguration installieren müssen.
Keras-MXNet
Da wir wissen, dass Keras eine in Python geschriebene NN-API (High-Level Neural Network) ist, bietet Keras-MXNet eine Backend-Unterstützung für Keras. Es kann auf einem leistungsstarken und skalierbaren Apache MXNet DL-Framework ausgeführt werden.
Die Funktionen von Keras-MXNet werden unten aufgeführt -
Ermöglicht Benutzern ein einfaches, reibungsloses und schnelles Prototyping. Dies alles geschieht durch Benutzerfreundlichkeit, Modularität und Erweiterbarkeit.
Unterstützt sowohl CNN (Convolutional Neural Networks) als auch RNN (Recurrent Neural Networks) sowie die Kombination von beiden.
Läuft einwandfrei auf der Central Processing Unit (CPU) und der Graphical Processing Unit (GPU).
Kann auf einer oder mehreren GPUs ausgeführt werden.
Um mit diesem Backend arbeiten zu können, müssen Sie zuerst keras-mxnet wie folgt installieren:
pip install keras-mxnet
Wenn Sie jetzt GPUs verwenden, installieren Sie MXNet mit CUDA 9-Unterstützung wie folgt:
pip install mxnet-cu90
Wenn Sie jedoch nur die CPU verwenden, installieren Sie das grundlegende MXNet wie folgt:
pip install mxnet
MXBoard
MXBoard ist ein in Python geschriebenes Protokollierungswerkzeug, mit dem MXNet-Datenrahmen aufgezeichnet und in TensorBoard angezeigt werden. Mit anderen Worten, das MXBoard soll der Tensorboard-Pytorch-API folgen. Es unterstützt die meisten Datentypen in TensorBoard.
Einige von ihnen sind unten erwähnt -
Graph
Scalar
Histogram
Embedding
Image
Text
Audio
Präzisionsrückrufkurve
MXFusion
MXFusion ist eine modulare probabilistische Programmierbibliothek mit tiefem Lernen. Mit MXFusion können wir die Modularität, die ein Schlüsselmerkmal von Deep-Learning-Bibliotheken ist, für die probabilistische Programmierung voll ausnutzen. Es ist einfach zu bedienen und bietet den Benutzern eine bequeme Oberfläche zum Entwerfen probabilistischer Modelle und zum Anwenden auf die realen Probleme.
MXFusion wird unter Python Version 3.4 und höher unter MacOS und Linux OS überprüft. Um MXFusion zu installieren, müssen zuerst die folgenden Abhängigkeiten installiert werden:
MXNet> = 1,3
Networkx> = 2.1
Mit Hilfe des folgenden Befehls pip können Sie MXFusion installieren -
pip install mxfusion
TVM
Apache TVM, ein Open-Source-End-to-End-Deep-Learning-Compiler-Stack für Hardware-Backends wie CPUs, GPUs und spezialisierte Beschleuniger, soll die Lücke zwischen produktivitätsorientierten Deep-Learning-Frameworks und leistungsorientierten Hardware-Backends schließen . Mit der neuesten Version MXNet 1.6.0 können Benutzer Apache (Inkubation) TVM nutzen, um leistungsstarke Operator-Kernel in der Programmiersprache Python zu implementieren.
Apache TVM startete tatsächlich als Forschungsprojekt an der SAMPL-Gruppe der Paul G. Allen School für Informatik und Ingenieurwesen der Universität von Washington. Jetzt wird es bei der Apache Software Foundation (ASF) inkubiert, die von einem OSC ( Open Source Community), an der mehrere Industrie- und akademische Einrichtungen nach Apache-Art beteiligt sind.
Im Folgenden sind die Hauptfunktionen von Apache (Inkubation) TVM aufgeführt:
Vereinfacht den früheren C ++ - basierten Entwicklungsprozess.
Ermöglicht die gemeinsame Nutzung derselben Implementierung für mehrere Hardware-Backends wie CPUs, GPUs usw.
TVM bietet die Kompilierung von DL-Modellen in verschiedenen Frameworks wie Kears, MXNet, PyTorch, Tensorflow, CoreML und DarkNet zu minimal bereitstellbaren Modulen auf verschiedenen Hardware-Backends.
Es bietet uns auch die Infrastruktur, um automatisch Tensoroperatoren mit besserer Leistung zu generieren und zu optimieren.
XFer
Xfer, ein Transfer-Lernframework, ist in Python geschrieben. Grundsätzlich wird ein MXNet-Modell verwendet und ein Metamodell trainiert oder das Modell auch für einen neuen Zieldatensatz geändert.
Mit einfachen Worten, Xfer ist eine Python-Bibliothek, mit der Benutzer schnell und einfach Wissen übertragen können, das in DNN (Deep Neural Networks) gespeichert ist.
Xfer kann verwendet werden -
Zur Klassifizierung von Daten beliebigen numerischen Formats.
Zu den häufigsten Fällen von Bildern oder Textdaten.
Als Pipeline, die Spam vom Extrahieren von Features bis zum Trainieren eines Repurposers (eines Objekts, das eine Klassifizierung in der Zielaufgabe durchführt).
Im Folgenden sind die Funktionen von Xfer aufgeführt:
Ressourceneffizienz
Dateneffizienz
Einfacher Zugang zu neuronalen Netzen
Unsicherheitsmodellierung
Rapid-Prototyping
Dienstprogramme zum Extrahieren von Features aus NN
Dieses Kapitel hilft Ihnen beim Verständnis der MXNet-Systemarchitektur. Beginnen wir mit den MXNet-Modulen.
MXNet-Module
Das folgende Diagramm zeigt die MXNet-Systemarchitektur und zeigt die wichtigsten Module und Komponenten von MXNet modules and their interaction.
Im obigen Diagramm -
Die Module in blauen Farbfeldern sind User Facing Modules.
Die Module in grünen Farbfeldern sind System Modules.
Ein durchgehender Pfeil steht für eine hohe Abhängigkeit, dh er hängt stark von der Schnittstelle ab.
Der gepunktete Pfeil steht für die Lichtabhängigkeit, dh die verwendete Datenstruktur zur Vereinfachung und Konsistenz der Benutzeroberfläche. In der Tat kann es durch die Alternativen ersetzt werden.
Lassen Sie uns mehr über Benutzer- und Systemmodule diskutieren.
Benutzerbezogene Module
Die benutzerbezogenen Module sind wie folgt:
NDArray- Es bietet flexible Imperativprogramme für Apache MXNet. Sie sind dynamische und asynchrone n-dimensionale Arrays.
KVStore- Es fungiert als Schnittstelle für eine effiziente Parametersynchronisation. In KVStore steht KV für Key-Value. Es handelt sich also um eine Schnittstelle zum Speichern von Schlüsselwerten.
Data Loading (IO) - Dieses benutzerbezogene Modul wird zum effizienten Laden und Erweitern verteilter Daten verwendet.
Symbol Execution- Es ist ein statischer symbolischer Graph Executor. Es bietet eine effiziente Ausführung und Optimierung symbolischer Diagramme.
Symbol Construction - Dieses benutzerbezogene Modul bietet dem Benutzer die Möglichkeit, ein Berechnungsdiagramm, dh eine Netzkonfiguration, zu erstellen.
Systemmodule
Die Systemmodule sind wie folgt:
Storage Allocator - Dieses Systemmodul weist, wie der Name schon sagt, Speicherblöcke auf dem Host, dh der CPU und verschiedenen Geräten, dh GPUs, effizient zu und recycelt sie effizient.
Runtime Dependency Engine - Runtime Dependency Engine-Modul plant und führt die Operationen gemäß ihrer Lese- / Schreibabhängigkeit aus.
Resource Manager - Das Resource Manager (RM) -Systemmodul verwaltet globale Ressourcen wie den Zufallszahlengenerator und den zeitlichen Raum.
Operator - Das Betriebssystemmodul besteht aus allen Operatoren, die die statische Vorwärts- und Gradientenberechnung, dh die Rückausbreitung, definieren.
Hier werden die Systemkomponenten in Apache MXNet ausführlich erläutert. Zunächst werden wir uns mit der Ausführungs-Engine in MXNet befassen.
Ausführungs-Engine
Die Ausführungs-Engine von Apache MXNet ist sehr vielseitig. Wir können es für tiefes Lernen sowie für jedes domänenspezifische Problem verwenden: Führen Sie eine Reihe von Funktionen aus, die ihren Abhängigkeiten folgen. Es ist so konzipiert, dass die Funktionen mit Abhängigkeiten serialisiert werden, während die Funktionen ohne Abhängigkeiten parallel ausgeführt werden können.
Kernschnittstelle
Die unten angegebene API ist die Kernschnittstelle für die Ausführungs-Engine von Apache MXNet.
virtual void PushSync(Fn exec_fun, Context exec_ctx,
std::vector<VarHandle> const& const_vars,
std::vector<VarHandle> const& mutate_vars) = 0;
Die obige API hat Folgendes:
exec_fun - Mit der Kernschnittstellen-API von MXNet können wir die Funktion exec_fun zusammen mit ihren Kontextinformationen und Abhängigkeiten an die Ausführungs-Engine senden.
exec_ctx - Die Kontextinformationen, in denen die oben genannte Funktion exec_fun ausgeführt werden soll.
const_vars - Dies sind die Variablen, aus denen die Funktion liest.
mutate_vars - Dies sind die Variablen, die geändert werden sollen.
Die Ausführungs-Engine bietet dem Benutzer die Garantie, dass die Ausführung von zwei beliebigen Funktionen, die eine gemeinsame Variable ändern, in ihrer Push-Reihenfolge serialisiert wird.
Funktion
Es folgt der Funktionstyp der Ausführungsengine von Apache MXNet -
using Fn = std::function<void(RunContext)>;
In der obigen Funktion RunContextenthält die Laufzeitinformationen. Die Laufzeitinformationen sollten von der Ausführungsengine bestimmt werden. Die Syntax vonRunContext ist wie folgt -
struct RunContext {
// stream pointer which could be safely cast to
// cudaStream_t* type
void *stream;
};
Im Folgenden finden Sie einige wichtige Punkte zu den Funktionen der Ausführungs-Engine:
Alle Funktionen werden von den internen Threads der MXNet-Ausführungs-Engine ausgeführt.
Es ist nicht gut, das Blockieren der Funktion auf die Ausführungs-Engine zu übertragen, da damit die Funktion den Ausführungsthread belegt und auch den Gesamtdurchsatz verringert.
Hierfür bietet MXNet eine weitere asynchrone Funktion wie folgt:
using Callback = std::function<void()>;
using AsyncFn = std::function<void(RunContext, Callback)>;
In diesem AsyncFn Funktion können wir den schweren Teil unserer Threads übergeben, aber die Ausführungs-Engine betrachtet die Funktion erst dann als beendet, wenn wir die aufrufen callback Funktion.
Kontext
Im Contextkönnen wir den Kontext der Funktion angeben, in der ausgeführt werden soll. Dies beinhaltet normalerweise Folgendes:
Ob die Funktion auf einer CPU oder einer GPU ausgeführt werden soll.
Wenn wir im Kontext eine GPU angeben, welche GPU dann verwendet werden soll.
Es gibt einen großen Unterschied zwischen Context und RunContext. Der Kontext hat den Gerätetyp und die Geräte-ID, während RunContext die Informationen enthält, die nur zur Laufzeit festgelegt werden können.
VarHandle
VarHandle, mit dem die Abhängigkeiten von Funktionen angegeben werden, ähnelt einem Token (insbesondere von der Ausführungs-Engine bereitgestellt), mit dem wir die externen Ressourcen darstellen können, die die Funktion ändern oder verwenden kann.
Es stellt sich jedoch die Frage, warum wir VarHandle verwenden müssen. Dies liegt daran, dass die Apache MXNet-Engine so konzipiert ist, dass sie von anderen MXNet-Modulen entkoppelt ist.
Im Folgenden sind einige wichtige Punkte zu VarHandle aufgeführt:
Das Erstellen, Löschen oder Kopieren einer Variablen ist leicht und verursacht nur geringe Betriebskosten.
Wir müssen die unveränderlichen Variablen angeben, dh die Variablen, die in der verwendet werden const_vars.
Wir müssen die veränderlichen Variablen angeben, dh die Variablen, die in der geändert werden mutate_vars.
Die Regel, die von der Ausführungs-Engine zum Auflösen der Abhängigkeiten zwischen Funktionen verwendet wird, lautet, dass die Ausführung von zwei beliebigen Funktionen, wenn eine von ihnen mindestens eine gemeinsame Variable ändert, in ihrer Push-Reihenfolge serialisiert wird.
Zum Erstellen einer neuen Variablen können wir die verwenden NewVar() API.
Zum Löschen einer Variablen können wir die verwenden PushDelete API.
Lassen Sie uns anhand eines einfachen Beispiels verstehen, wie es funktioniert -
Angenommen, wir haben zwei Funktionen, nämlich F1 und F2, und beide mutieren die Variable V2. In diesem Fall wird garantiert, dass F2 nach F1 ausgeführt wird, wenn F2 nach F1 gedrückt wird. Wenn andererseits F1 und F2 beide V2 verwenden, kann ihre tatsächliche Ausführungsreihenfolge zufällig sein.
Drücken und warten
Push und wait sind zwei weitere nützliche API der Ausführungs-Engine.
Es folgen zwei wichtige Merkmale von Push API:
Alle Push-APIs sind asynchron, was bedeutet, dass der API-Aufruf sofort zurückgegeben wird, unabhängig davon, ob die Push-Funktion beendet ist oder nicht.
Die Push-API ist nicht threadsicher, was bedeutet, dass jeweils nur ein Thread Engine-API-Aufrufe ausführen sollte.
Wenn wir nun über die Warte-API sprechen, stellen folgende Punkte sie dar:
Wenn ein Benutzer warten möchte, bis eine bestimmte Funktion abgeschlossen ist, sollte er eine Rückruffunktion in den Abschluss aufnehmen. Rufen Sie die Funktion am Ende der Funktion auf.
Wenn ein Benutzer andererseits warten möchte, bis alle Funktionen, an denen eine bestimmte Variable beteiligt ist, abgeschlossen sind, sollte er sie verwenden WaitForVar(var) API.
Wenn jemand warten möchte, bis alle Push-Funktionen abgeschlossen sind, verwenden Sie die WaitForAll () API.
Wird verwendet, um die Abhängigkeiten von Funktionen anzugeben, ist wie ein Token.
Betreiber
Der Operator in Apache MXNet ist eine Klasse, die die tatsächliche Berechnungslogik sowie Zusatzinformationen enthält und das System bei der Durchführung der Optimierung unterstützt.
Bedienoberfläche
Forward ist die zentrale Bedienoberfläche, deren Syntax wie folgt lautet:
virtual void Forward(const OpContext &ctx,
const std::vector<TBlob> &in_data,
const std::vector<OpReqType> &req,
const std::vector<TBlob> &out_data,
const std::vector<TBlob> &aux_states) = 0;
Die Struktur von OpContext, definiert in Forward() ist wie folgt:
struct OpContext {
int is_train;
RunContext run_ctx;
std::vector<Resource> requested;
}
Das OpContextbeschreibt den Zustand des Betreibers (ob in der Zug- oder Testphase), auf welchem Gerät der Betreiber betrieben werden soll und auch die angeforderten Ressourcen. zwei weitere nützliche API der Ausführungs-Engine.
Von Oben Forward Kernschnittstelle können wir die angeforderten Ressourcen wie folgt verstehen:
in_data und out_data repräsentieren die Eingangs- und Ausgangstensoren.
req gibt an, wie das Ergebnis der Berechnung in das geschrieben wird out_data.
Das OpReqType kann definiert werden als -
enum OpReqType {
kNullOp,
kWriteTo,
kWriteInplace,
kAddTo
};
Wie Forward Betreiber können wir optional die implementieren Backward Schnittstelle wie folgt -
virtual void Backward(const OpContext &ctx,
const std::vector<TBlob> &out_grad,
const std::vector<TBlob> &in_data,
const std::vector<TBlob> &out_data,
const std::vector<OpReqType> &req,
const std::vector<TBlob> &in_grad,
const std::vector<TBlob> &aux_states);
Mehrere Aufgaben
Operator Schnittstelle ermöglicht den Benutzern, die folgenden Aufgaben zu erledigen -
Der Benutzer kann direkte Aktualisierungen angeben und die Kosten für die Speicherzuweisung reduzieren
Um es sauberer zu machen, kann der Benutzer einige interne Argumente vor Python verbergen.
Der Benutzer kann die Beziehung zwischen den Tensoren und den Ausgangstensoren definieren.
Um eine Berechnung durchzuführen, kann der Benutzer zusätzlichen temporären Speicherplatz vom System abrufen.
Betreiber-Eigenschaft
Wie wir wissen, hat eine Faltung im Convolutional Neural Network (CNN) mehrere Implementierungen. Um die beste Leistung zu erzielen, möchten wir möglicherweise zwischen diesen verschiedenen Windungen wechseln.
Aus diesem Grund trennt Apache MXNet die semantische Operatorschnittstelle von der Implementierungsschnittstelle. Diese Trennung erfolgt in Form vonOperatorProperty Klasse, die aus den folgenden besteht -
InferShape - Die InferShape-Oberfläche dient zwei Zwecken:
Der erste Zweck besteht darin, dem System die Größe jedes Eingangs- und Ausgangstensors mitzuteilen, damit der Raum vorher zugewiesen werden kann Forward und Backward Anruf.
Der zweite Zweck besteht darin, eine Größenprüfung durchzuführen, um sicherzustellen, dass vor dem Ausführen kein Fehler vorliegt.
Die Syntax ist unten angegeben -
virtual bool InferShape(mxnet::ShapeVector *in_shape,
mxnet::ShapeVector *out_shape,
mxnet::ShapeVector *aux_shape) const = 0;
Request Resource- Was ist, wenn Ihr System den Berechnungsarbeitsbereich für Vorgänge wie cudnnConvolutionForward verwalten kann? Ihr System kann Optimierungen wie die Wiederverwendung des Speicherplatzes und vieles mehr durchführen. Hier erreicht MXNet dies auf einfache Weise mithilfe der folgenden zwei Schnittstellen
virtual std::vector<ResourceRequest> ForwardResource(
const mxnet::ShapeVector &in_shape) const;
virtual std::vector<ResourceRequest> BackwardResource(
const mxnet::ShapeVector &in_shape) const;
Aber was ist, wenn die ForwardResource und BackwardResourceNicht leere Arrays zurückgeben? In diesem Fall bietet das System entsprechende Ressourcen durchctx Parameter in der Forward und Backward Schnittstelle von Operator.
Backward dependency - Apache MXNet verfügt über zwei verschiedene Operatorsignaturen, um die Rückwärtsabhängigkeit zu bewältigen. -
void FullyConnectedForward(TBlob weight, TBlob in_data, TBlob out_data);
void FullyConnectedBackward(TBlob weight, TBlob in_data, TBlob out_grad, TBlob in_grad);
void PoolingForward(TBlob in_data, TBlob out_data);
void PoolingBackward(TBlob in_data, TBlob out_data, TBlob out_grad, TBlob in_grad);
Hier sind die beiden wichtigen Punkte zu beachten -
Die out_data in FullyConnectedForward werden von FullyConnectedBackward und nicht verwendet
PoolingBackward erfordert alle Argumente von PoolingForward.
Deshalb für FullyConnectedForward, das out_dataEinmal verbrauchter Tensor könnte sicher befreit werden, da die Rückwärtsfunktion ihn nicht benötigt. Mit Hilfe dieses Systems konnte man einige Tensoren so früh wie möglich als Müll einsammeln.
In place Option- Apache MXNet bietet den Benutzern eine weitere Schnittstelle, um die Kosten für die Speicherzuweisung zu sparen. Die Schnittstelle eignet sich für elementweise Operationen, bei denen sowohl Eingangs- als auch Ausgangstensoren dieselbe Form haben.
Im Folgenden finden Sie die Syntax zum Festlegen des direkten Updates:
Beispiel zum Erstellen eines Operators
Mit Hilfe von OperatorProperty können wir einen Operator erstellen. Führen Sie dazu die folgenden Schritte aus:
virtual std::vector<std::pair<int, void*>> ElewiseOpProperty::ForwardInplaceOption(
const std::vector<int> &in_data,
const std::vector<void*> &out_data)
const {
return { {in_data[0], out_data[0]} };
}
virtual std::vector<std::pair<int, void*>> ElewiseOpProperty::BackwardInplaceOption(
const std::vector<int> &out_grad,
const std::vector<int> &in_data,
const std::vector<int> &out_data,
const std::vector<void*> &in_grad)
const {
return { {out_grad[0], in_grad[0]} }
}
Schritt 1
Create Operator
Implementieren Sie zunächst die folgende Schnittstelle in OperatorProperty:
virtual Operator* CreateOperator(Context ctx) const = 0;
Das Beispiel ist unten angegeben -
class ConvolutionOp {
public:
void Forward( ... ) { ... }
void Backward( ... ) { ... }
};
class ConvolutionOpProperty : public OperatorProperty {
public:
Operator* CreateOperator(Context ctx) const {
return new ConvolutionOp;
}
};
Schritt 2
Parameterize Operator
Wenn Sie einen Faltungsoperator implementieren möchten, müssen Sie die Kernelgröße, die Schrittgröße, die Auffüllgröße usw. kennen. Warum, weil diese Parameter vor dem Aufruf von any an den Operator übergeben werden solltenForward oder backward Schnittstelle.
Dazu müssen wir a definieren ConvolutionParam Struktur wie unten -
#include <dmlc/parameter.h>
struct ConvolutionParam : public dmlc::Parameter<ConvolutionParam> {
mxnet::TShape kernel, stride, pad;
uint32_t num_filter, num_group, workspace;
bool no_bias;
};
Jetzt müssen wir das einfügen ConvolutionOpProperty und geben Sie es wie folgt an den Bediener weiter -
class ConvolutionOp {
public:
ConvolutionOp(ConvolutionParam p): param_(p) {}
void Forward( ... ) { ... }
void Backward( ... ) { ... }
private:
ConvolutionParam param_;
};
class ConvolutionOpProperty : public OperatorProperty {
public:
void Init(const vector<pair<string, string>& kwargs) {
// initialize param_ using kwargs
}
Operator* CreateOperator(Context ctx) const {
return new ConvolutionOp(param_);
}
private:
ConvolutionParam param_;
};
Schritt 3
Register the Operator Property Class and the Parameter Class to Apache MXNet
Zuletzt müssen wir die Operator-Eigenschaftsklasse und die Parameterklasse bei MXNet registrieren. Dies kann mit Hilfe der folgenden Makros erfolgen -
DMLC_REGISTER_PARAMETER(ConvolutionParam);
MXNET_REGISTER_OP_PROPERTY(Convolution, ConvolutionOpProperty);
Im obigen Makro ist das erste Argument die Namenszeichenfolge und das zweite der Name der Eigenschaftsklasse.
Dieses Kapitel enthält Informationen zur Unified Operator Application Programming Interface (API) in Apache MXNet.
SimpleOp
SimpleOp ist eine neue einheitliche Operator-API, die verschiedene aufrufende Prozesse vereinheitlicht. Nach dem Aufrufen kehrt es zu den grundlegenden Elementen der Operatoren zurück. Der einheitliche Operator wurde speziell für unäre und binäre Operationen entwickelt. Dies liegt daran, dass die meisten mathematischen Operatoren sich um einen oder zwei Operanden kümmern und mehrere Operanden die Optimierung in Bezug auf die Abhängigkeit nützlich machen.
Wir werden den vereinfachten Operator SimpleOp anhand eines Beispiels verstehen. In diesem Beispiel erstellen wir einen Operator, der alssmooth l1 loss, das ist eine Mischung aus l1 und l2 Verlust. Wir können den Verlust wie folgt definieren und schreiben -
loss = outside_weight .* f(inside_weight .* (data - label))
grad = outside_weight .* inside_weight .* f'(inside_weight .* (data - label))
Hier im obigen Beispiel
. * steht für elementweise Multiplikation
f, f’ ist die glatte l1-Verlustfunktion, von der wir annehmen, dass sie in ist mshadow.
Es scheint unmöglich, diesen bestimmten Verlust als unären oder binären Operator zu implementieren, aber MXNet bietet seinen Benutzern eine automatische Differenzierung in der symbolischen Ausführung, die den Verlust für f und f 'direkt vereinfacht. Deshalb können wir diesen besonderen Verlust sicherlich als unären Operator implementieren.
Formen definieren
Wie wir wissen, MXNet mshadow libraryerfordert eine explizite Speicherzuweisung, daher müssen wir alle Datenformen bereitstellen, bevor eine Berechnung erfolgt. Bevor wir Funktionen und Farbverläufe definieren, müssen wir die Konsistenz der Eingabeform und die Ausgabeform wie folgt bereitstellen:
typedef mxnet::TShape (*UnaryShapeFunction)(const mxnet::TShape& src,
const EnvArguments& env);
typedef mxnet::TShape (*BinaryShapeFunction)(const mxnet::TShape& lhs,
const mxnet::TShape& rhs,
const EnvArguments& env);
Die Funktion mxnet :: Tshape wird verwendet, um die Form der Eingabedaten und die angegebene Form der Ausgabedaten zu überprüfen. Wenn Sie diese Funktion nicht definieren, entspricht die Standardausgabeform der Eingabeform. Beispielsweise wird im Fall eines binären Operators die Form von lhs und rhs standardmäßig als dieselbe überprüft.
Kommen wir nun zu unserem smooth l1 loss example. Dazu müssen wir in der Header-Implementierung eine XPU für CPU oder GPU definieren smooth_l1_unary-inl.h. Der Grund ist, denselben Code in wiederzuverwenden smooth_l1_unary.cc und smooth_l1_unary.cu.
#include <mxnet/operator_util.h>
#if defined(__CUDACC__)
#define XPU gpu
#else
#define XPU cpu
#endif
Wie bei uns smooth l1 loss example,Die Ausgabe hat die gleiche Form wie die Quelle. Wir können das Standardverhalten verwenden. Es kann wie folgt geschrieben werden:
inline mxnet::TShape SmoothL1Shape_(const mxnet::TShape& src,const EnvArguments& env) {
return mxnet::TShape(src);
}
Funktionen definieren
Wir können eine unäre oder binäre Funktion mit einem Eingang wie folgt erstellen:
typedef void (*UnaryFunction)(const TBlob& src,
const EnvArguments& env,
TBlob* ret,
OpReqType req,
RunContext ctx);
typedef void (*BinaryFunction)(const TBlob& lhs,
const TBlob& rhs,
const EnvArguments& env,
TBlob* ret,
OpReqType req,
RunContext ctx);
Es folgt die RunContext ctx struct welches die Informationen enthält, die zur Laufzeit für die Ausführung benötigt werden -
struct RunContext {
void *stream; // the stream of the device, can be NULL or Stream<gpu>* in GPU mode
template<typename xpu> inline mshadow::Stream<xpu>* get_stream() // get mshadow stream from Context
} // namespace mxnet
Nun wollen wir sehen, wie wir die Berechnungsergebnisse schreiben können ret.
enum OpReqType {
kNullOp, // no operation, do not write anything
kWriteTo, // write gradient to provided space
kWriteInplace, // perform an in-place write
kAddTo // add to the provided space
};
Kommen wir nun zu unserem smooth l1 loss example. Dazu verwenden wir UnaryFunction, um die Funktion dieses Operators wie folgt zu definieren:
template<typename xpu>
void SmoothL1Forward_(const TBlob& src,
const EnvArguments& env,
TBlob *ret,
OpReqType req,
RunContext ctx) {
using namespace mshadow;
using namespace mshadow::expr;
mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
real_t sigma2 = env.scalar * env.scalar;
MSHADOW_TYPE_SWITCH(ret->type_flag_, DType, {
mshadow::Tensor<xpu, 2, DType> out = ret->get<xpu, 2, DType>(s);
mshadow::Tensor<xpu, 2, DType> in = src.get<xpu, 2, DType>(s);
ASSIGN_DISPATCH(out, req,
F<mshadow_op::smooth_l1_loss>(in, ScalarExp<DType>(sigma2)));
});
}
Farbverläufe definieren
Außer Input, TBlob, und OpReqTypeverdoppelt werden, haben Gradientenfunktionen von Binäroperatoren eine ähnliche Struktur. Schauen wir uns unten an, wo wir eine Verlaufsfunktion mit verschiedenen Arten von Eingaben erstellt haben:
// depending only on out_grad
typedef void (*UnaryGradFunctionT0)(const OutputGrad& out_grad,
const EnvArguments& env,
TBlob* in_grad,
OpReqType req,
RunContext ctx);
// depending only on out_value
typedef void (*UnaryGradFunctionT1)(const OutputGrad& out_grad,
const OutputValue& out_value,
const EnvArguments& env,
TBlob* in_grad,
OpReqType req,
RunContext ctx);
// depending only on in_data
typedef void (*UnaryGradFunctionT2)(const OutputGrad& out_grad,
const Input0& in_data0,
const EnvArguments& env,
TBlob* in_grad,
OpReqType req,
RunContext ctx);
Wie oben definiert Input0, Input, OutputValue, und OutputGrad Alle teilen die Struktur von GradientFunctionArgument. Es ist wie folgt definiert:
struct GradFunctionArgument {
TBlob data;
}
Kommen wir nun zu unserem smooth l1 loss example. Damit dies die Kettenregel des Gradienten ermöglicht, müssen wir multiplizierenout_grad von oben bis zum Ergebnis von in_grad.
template<typename xpu>
void SmoothL1BackwardUseIn_(const OutputGrad& out_grad, const Input0& in_data0,
const EnvArguments& env,
TBlob *in_grad,
OpReqType req,
RunContext ctx) {
using namespace mshadow;
using namespace mshadow::expr;
mshadow::Stream<xpu> *s = ctx.get_stream<xpu>();
real_t sigma2 = env.scalar * env.scalar;
MSHADOW_TYPE_SWITCH(in_grad->type_flag_, DType, {
mshadow::Tensor<xpu, 2, DType> src = in_data0.data.get<xpu, 2, DType>(s);
mshadow::Tensor<xpu, 2, DType> ograd = out_grad.data.get<xpu, 2, DType>(s);
mshadow::Tensor<xpu, 2, DType> igrad = in_grad->get<xpu, 2, DType>(s);
ASSIGN_DISPATCH(igrad, req,
ograd * F<mshadow_op::smooth_l1_gradient>(src, ScalarExp<DType>(sigma2)));
});
}
Registrieren Sie SimpleOp bei MXNet
Nachdem wir Form, Funktion und Verlauf erstellt haben, müssen wir sie sowohl in einem NDArray-Operator als auch in einem symbolischen Operator wiederherstellen. Hierfür können wir das Registrierungsmakro wie folgt verwenden:
MXNET_REGISTER_SIMPLE_OP(Name, DEV)
.set_shape_function(Shape)
.set_function(DEV::kDevMask, Function<XPU>, SimpleOpInplaceOption)
.set_gradient(DEV::kDevMask, Gradient<XPU>, SimpleOpInplaceOption)
.describe("description");
Das SimpleOpInplaceOption kann wie folgt definiert werden -
enum SimpleOpInplaceOption {
kNoInplace, // do not allow inplace in arguments
kInplaceInOut, // allow inplace in with out (unary)
kInplaceOutIn, // allow inplace out_grad with in_grad (unary)
kInplaceLhsOut, // allow inplace left operand with out (binary)
kInplaceOutLhs // allow inplace out_grad with lhs_grad (binary)
};
Kommen wir nun zu unserem smooth l1 loss example. Zu diesem Zweck haben wir eine Verlaufsfunktion, die auf Eingabedaten basiert, sodass die Funktion nicht an Ort und Stelle geschrieben werden kann.
MXNET_REGISTER_SIMPLE_OP(smooth_l1, XPU)
.set_function(XPU::kDevMask, SmoothL1Forward_<XPU>, kNoInplace)
.set_gradient(XPU::kDevMask, SmoothL1BackwardUseIn_<XPU>, kInplaceOutIn)
.set_enable_scalar(true)
.describe("Calculate Smooth L1 Loss(lhs, scalar)");
SimpleOp auf EnvArguments
Wie wir wissen, benötigen einige Operationen möglicherweise Folgendes:
Ein Skalar als Eingabe, z. B. eine Gradientenskala
Eine Reihe von Schlüsselwortargumenten, die das Verhalten steuern
Ein temporärer Bereich, um Berechnungen zu beschleunigen.
Die Verwendung von EnvArguments bietet den Vorteil, dass zusätzliche Argumente und Ressourcen bereitgestellt werden, um Berechnungen skalierbarer und effizienter zu gestalten.
Beispiel
Definieren wir zuerst die Struktur wie folgt -
struct EnvArguments {
real_t scalar; // scalar argument, if enabled
std::vector<std::pair<std::string, std::string> > kwargs; // keyword arguments
std::vector<Resource> resource; // pointer to the resources requested
};
Als nächstes müssen wir zusätzliche Ressourcen wie anfordern mshadow::Random<xpu> und temporärer Speicherplatz von EnvArguments.resource. Dies kann wie folgt erfolgen:
struct ResourceRequest {
enum Type { // Resource type, indicating what the pointer type is
kRandom, // mshadow::Random<xpu> object
kTempSpace // A dynamic temp space that can be arbitrary size
};
Type type; // type of resources
};
Jetzt fordert die Registrierung die deklarierte Ressourcenanforderung von an mxnet::ResourceManager. Danach werden die Ressourcen in platziert std::vector<Resource> resource in EnvAgruments.
Wir können mit Hilfe des folgenden Codes auf die Ressourcen zugreifen:
auto tmp_space_res = env.resources[0].get_space(some_shape, some_stream);
auto rand_res = env.resources[0].get_random(some_stream);
Wenn Sie in unserem Beispiel für einen glatten l1-Verlust sehen, wird eine skalare Eingabe benötigt, um den Wendepunkt einer Verlustfunktion zu markieren. Deshalb verwenden wir bei der Registrierungset_enable_scalar(true), und env.scalar in Funktions- und Gradientendeklarationen.
Gebäudetensorbetrieb
Hier stellt sich die Frage, warum wir Tensoroperationen herstellen müssen. Die Gründe sind wie folgt:
Für die Berechnung wird die mshadow-Bibliothek verwendet, und manchmal stehen keine Funktionen zur Verfügung.
Wenn eine Operation nicht elementweise ausgeführt wird, z. B. Softmax-Verlust und Gradient.
Beispiel
Hier verwenden wir das obige Beispiel für einen glatten l1-Verlust. Wir werden zwei Mapper erstellen, nämlich die skalaren Fälle von glattem l1-Verlust und Gradienten:
namespace mshadow_op {
struct smooth_l1_loss {
// a is x, b is sigma2
MSHADOW_XINLINE static real_t Map(real_t a, real_t b) {
if (a > 1.0f / b) {
return a - 0.5f / b;
} else if (a < -1.0f / b) {
return -a - 0.5f / b;
} else {
return 0.5f * a * a * b;
}
}
};
}
In diesem Kapitel geht es um das verteilte Training in Apache MXNet. Beginnen wir mit dem Verständnis der Berechnungsmodi in MXNet.
Berechnungsmodi
MXNet, eine mehrsprachige ML-Bibliothek, bietet seinen Benutzern die folgenden zwei Berechnungsmodi:
Imperativer Modus
Dieser Berechnungsmodus macht eine Schnittstelle wie die NumPy-API verfügbar. Verwenden Sie in MXNet beispielsweise den folgenden Imperativcode, um einen Tensor von Nullen sowohl auf der CPU als auch auf der GPU zu erstellen.
import mxnet as mx
tensor_cpu = mx.nd.zeros((100,), ctx=mx.cpu())
tensor_gpu= mx.nd.zeros((100,), ctx=mx.gpu(0))
Wie wir im obigen Code sehen, gibt MXNets den Ort an, an dem der Tensor gehalten werden soll, entweder in der CPU oder im GPU-Gerät. Im obigen Beispiel befindet es sich an Position 0. MXNet erreicht eine unglaubliche Auslastung des Geräts, da alle Berechnungen nicht sofort, sondern träge erfolgen.
Symbolischer Modus
Der imperative Modus ist zwar sehr nützlich, aber einer der Nachteile dieses Modus ist seine Starrheit, dh alle Berechnungen müssen im Voraus zusammen mit vordefinierten Datenstrukturen bekannt sein.
Andererseits zeigt der symbolische Modus ein Berechnungsdiagramm wie TensorFlow an. Der Nachteil der imperativen API wird beseitigt, indem MXNet anstelle von festen / vordefinierten Datenstrukturen mit Symbolen oder Variablen arbeiten kann. Danach können die Symbole wie folgt als eine Reihe von Operationen interpretiert werden:
import mxnet as mx
x = mx.sym.Variable(“X”)
y = mx.sym.Variable(“Y”)
z = (x+y)
m = z/100
Arten von Parallelität
Apache MXNet unterstützt verteiltes Training. Es ermöglicht uns, mehrere Maschinen für ein schnelleres und effektives Training zu nutzen.
Im Folgenden finden Sie zwei Möglichkeiten, wie wir die Arbeitslast für das Training eines NN auf mehrere Geräte, CPU- oder GPU-Geräte verteilen können:
Datenparallelität
Bei dieser Art von Parallelität speichert jedes Gerät eine vollständige Kopie des Modells und arbeitet mit einem anderen Teil des Datensatzes. Geräte aktualisieren auch gemeinsam ein freigegebenes Modell. Wir können alle Geräte auf einer einzelnen Maschine oder auf mehreren Maschinen lokalisieren.
Modellparallelität
Es ist eine andere Art von Parallelität, die nützlich ist, wenn Modelle so groß sind, dass sie nicht in den Gerätespeicher passen. Bei der Modellparallelität wird verschiedenen Geräten die Aufgabe zugewiesen, verschiedene Teile des Modells zu lernen. Der wichtige Punkt hierbei ist, dass Apache MXNet derzeit Modellparallelität nur auf einem einzelnen Computer unterstützt.
Arbeiten von verteilten Schulungen
Die folgenden Konzepte sind der Schlüssel zum Verständnis der Funktionsweise verteilter Schulungen in Apache MXNet.
Arten von Prozessen
Prozesse kommunizieren miteinander, um das Training eines Modells durchzuführen. Apache MXNet hat die folgenden drei Prozesse:
Arbeiter
Die Aufgabe des Arbeiterknotens besteht darin, eine Schulung für eine Reihe von Schulungsmustern durchzuführen. Die Worker-Knoten ziehen Gewichte vom Server, bevor sie jeden Stapel verarbeiten. Die Worker-Knoten senden Farbverläufe an den Server, sobald der Stapel verarbeitet wurde.
Server
MXNet kann mehrere Server zum Speichern der Modellparameter und zur Kommunikation mit den Arbeitsknoten haben.
Planer
Die Rolle des Schedulers besteht darin, den Cluster einzurichten. Dazu gehört das Warten auf Nachrichten, die von jedem Knoten gesendet wurden und welchen Port der Knoten abhört. Nach dem Einrichten des Clusters informiert der Scheduler alle Prozesse über jeden anderen Knoten im Cluster. Dies liegt daran, dass die Prozesse miteinander kommunizieren können. Es gibt nur einen Scheduler.
KV Store
KV Stores steht für Key-ValueGeschäft. Es ist eine wichtige Komponente für das Training mit mehreren Geräten. Dies ist wichtig, da die Kommunikation von Parametern zwischen Geräten auf einem oder mehreren Computern über einen oder mehrere Server mit einem KVStore für die Parameter übertragen wird. Lassen Sie uns die Arbeitsweise von KVStore anhand der folgenden Punkte verstehen:
Jeder Wert in KVStore wird durch a dargestellt key und ein value.
Jedem Parameterarray im Netzwerk ist a zugeordnet key und auf die Gewichte dieses Parameterarrays wird verwiesen value.
Danach die Worker-Knoten pushFarbverläufe nach der Bearbeitung einer Charge. Sie auchpull Aktualisierte Gewichte vor der Verarbeitung einer neuen Charge.
Der Begriff des KVStore-Servers existiert nur während des verteilten Trainings und der verteilte Modus wird durch Aufrufen aktiviert mxnet.kvstore.create Funktion mit einem String-Argument, das das Wort enthält dist - -
kv = mxnet.kvstore.create(‘dist_sync’)
Verteilung der Schlüssel
Es ist nicht erforderlich, dass alle Server alle Parameterarrays oder -schlüssel speichern, sie sind jedoch auf verschiedene Server verteilt. Eine solche Verteilung von Schlüsseln auf verschiedene Server wird vom KVStore transparent behandelt, und die Entscheidung, auf welchem Server ein bestimmter Schlüssel gespeichert wird, wird zufällig getroffen.
Wie oben erläutert, stellt KVStore sicher, dass bei jedem Ziehen des Schlüssels seine Anforderung an diesen Server gesendet wird, der den entsprechenden Wert hat. Was ist, wenn der Wert eines Schlüssels groß ist? In diesem Fall kann es von verschiedenen Servern gemeinsam genutzt werden.
Trainingsdaten teilen
Als Benutzer möchten wir, dass jeder Computer an verschiedenen Teilen des Datensatzes arbeitet, insbesondere wenn verteiltes Training im datenparallelen Modus ausgeführt wird. Wir wissen, dass wir einen Stapel von Stichproben, die vom Dateniterator für datenparalleles Training bereitgestellt werden, auf einen einzelnen Mitarbeiter aufteilen können, den wir verwenden könnenmxnet.gluon.utils.split_and_load Laden Sie dann jeden Teil des Stapels auf das Gerät, das ihn weiter verarbeitet.
Auf der anderen Seite müssen wir im Fall eines verteilten Trainings zu Beginn den Datensatz in unterteilen nverschiedene Teile, so dass jeder Arbeiter ein anderes Teil bekommt. Einmal erhalten, kann jeder Arbeiter dann verwendensplit_and_loadum diesen Teil des Datensatzes erneut auf verschiedene Geräte auf einem einzelnen Computer aufzuteilen. All dies geschieht durch einen Dateniterator.mxnet.io.MNISTIterator und mxnet.io.ImageRecordIter Es gibt zwei solche Iteratoren in MXNet, die diese Funktion unterstützen.
Gewichte aktualisieren
Zum Aktualisieren der Gewichte unterstützt KVStore die folgenden zwei Modi:
Die erste Methode aggregiert die Farbverläufe und aktualisiert die Gewichte mithilfe dieser Farbverläufe.
Bei der zweiten Methode aggregiert der Server nur Farbverläufe.
Wenn Sie Gluon verwenden, können Sie durch Übergeben zwischen den oben genannten Methoden wählen update_on_kvstoreVariable. Lassen Sie es uns verstehen, indem Sie das erstellentrainer Objekt wie folgt -
trainer = gluon.Trainer(net.collect_params(), optimizer='sgd',
optimizer_params={'learning_rate': opt.lr,
'wd': opt.wd,
'momentum': opt.momentum,
'multi_precision': True},
kvstore=kv,
update_on_kvstore=True)
Modi des verteilten Trainings
Wenn die KVStore-Erstellungszeichenfolge das Wort dist enthält, bedeutet dies, dass das verteilte Training aktiviert ist. Im Folgenden finden Sie verschiedene Modi für verteiltes Training, die mithilfe verschiedener KVStore-Typen aktiviert werden können:
dist_sync
Wie der Name schon sagt, bedeutet dies synchrones verteiltes Training. Dabei verwenden alle Mitarbeiter zu Beginn jeder Charge denselben synchronisierten Satz von Modellparametern.
Der Nachteil dieses Modus besteht darin, dass der Server nach jedem Stapel warten muss, um Farbverläufe von jedem Worker zu erhalten, bevor er die Modellparameter aktualisiert. Dies bedeutet, dass ein Absturz eines Arbeitnehmers den Fortschritt aller Arbeiter stoppen würde.
dist_async
Wie der Name schon sagt, bedeutet dies synchrones verteiltes Training. Dabei empfängt der Server Farbverläufe von einem Mitarbeiter und aktualisiert sofort seinen Speicher. Der Server verwendet den aktualisierten Speicher, um auf weitere Zugriffe zu reagieren.
Der Vorteil im Vergleich zu dist_sync modeist, dass ein Mitarbeiter, der die Verarbeitung eines Stapels beendet hat, die aktuellen Parameter vom Server abrufen und den nächsten Stapel starten kann. Der Arbeiter kann dies tun, auch wenn der andere Arbeiter die Verarbeitung der früheren Charge noch nicht abgeschlossen hat. Es ist auch schneller als der dist_sync-Modus, da die Konvergenz mehr Epochen dauern kann, ohne dass Synchronisationskosten anfallen.
dist_sync_device
Dieser Modus ist der gleiche wie dist_syncModus. Der einzige Unterschied besteht darin, dass auf jedem Knoten mehrere GPUs verwendet werdendist_sync_device aggregiert Farbverläufe und aktualisiert Gewichte auf der GPU, während dist_sync aggregiert Farbverläufe und aktualisiert Gewichte im CPU-Speicher.
Es reduziert die teure Kommunikation zwischen GPU und CPU. Deshalb ist es schneller alsdist_sync. Der Nachteil ist, dass es die Speichernutzung auf der GPU erhöht.
dist_async_device
Dieser Modus funktioniert genauso wie dist_sync_device Modus, aber im asynchronen Modus.
In diesem Kapitel erfahren Sie mehr über die in Apache MXNet verfügbaren Python-Pakete.
Wichtige MXNet Python-Pakete
MXNet verfügt über die folgenden wichtigen Python-Pakete, die wir einzeln diskutieren werden:
Autograd (automatische Differenzierung)
NDArray
KVStore
Gluon
Visualization
Beginnen wir zuerst mit Autograd Python-Paket für Apache MXNet.
Autograd
Autograd steht für automatic differentiationwird verwendet, um die Gradienten von der Verlustmetrik zurück zu jedem der Parameter zu propagieren. Zusammen mit der Backpropagation wird ein dynamischer Programmieransatz verwendet, um die Gradienten effizient zu berechnen. Es wird auch als automatische Differenzierung im umgekehrten Modus bezeichnet. Diese Technik ist sehr effizient in "Fan-In" -Situationen, in denen viele Parameter eine einzelne Verlustmetrik beeinflussen.
Was sind Farbverläufe?
Gradienten sind die Grundlagen für den Prozess des neuronalen Netzwerktrainings. Sie erklären uns im Grunde, wie wir die Parameter des Netzwerks ändern können, um seine Leistung zu verbessern.
Wie wir wissen, bestehen neuronale Netze (NN) aus Operatoren wie Summen, Produkten, Faltungen usw. Diese Operatoren verwenden für ihre Berechnungen Parameter wie die Gewichte in Faltungskernen. Wir sollten die optimalen Werte für diese Parameter finden müssen, und Gradienten zeigen uns den Weg und führen uns auch zur Lösung.
Wir sind an der Auswirkung der Änderung eines Parameters auf die Leistung des Netzwerks interessiert, und Gradienten geben an, um wie viel eine bestimmte Variable zunimmt oder abnimmt, wenn wir eine Variable ändern, von der sie abhängt. Die Leistung wird normalerweise mithilfe einer Verlustmetrik definiert, die wir zu minimieren versuchen. Zum Beispiel könnten wir für die Regression versuchen, zu minimierenL2 Verlust zwischen unseren Vorhersagen und dem genauen Wert, während wir für die Klassifizierung die minimieren könnten cross-entropy loss.
Sobald wir den Gradienten jedes Parameters in Bezug auf den Verlust berechnet haben, können wir einen Optimierer verwenden, z. B. den stochastischen Gradientenabstieg.
Wie berechnet man Gradienten?
Wir haben die folgenden Optionen, um Farbverläufe zu berechnen:
Symbolic Differentiation- Die allererste Option ist die symbolische Differenzierung, bei der die Formeln für jeden Gradienten berechnet werden. Der Nachteil dieser Methode ist, dass sie schnell zu unglaublich langen Formeln führt, wenn das Netzwerk tiefer und die Bediener komplexer werden.
Finite Differencing- Eine andere Möglichkeit besteht darin, eine endliche Differenzierung zu verwenden, bei der geringfügige Unterschiede für jeden Parameter versucht werden und festgestellt wird, wie die Verlustmetrik reagiert. Der Nachteil dieses Verfahrens besteht darin, dass es rechenintensiv wäre und möglicherweise eine schlechte numerische Genauigkeit aufweist.
Automatic differentiation- Die Lösung für die Nachteile der obigen Methoden besteht darin, eine automatische Differenzierung zu verwenden, um die Gradienten von der Verlustmetrik zurück zu jedem der Parameter zu verbreiten. Die Ausbreitung ermöglicht uns einen dynamischen Programmieransatz zur effizienten Berechnung der Gradienten. Diese Methode wird auch als automatische Differenzierung im umgekehrten Modus bezeichnet.
Automatische Differenzierung (autograd)
Hier werden wir die Arbeitsweise von Autograd im Detail verstehen. Es funktioniert grundsätzlich in zwei Schritten:
Stage 1 - Diese Stufe heißt ‘Forward Pass’des Trainings. Wie der Name schon sagt, wird in dieser Phase die Aufzeichnung des Betreibers erstellt, der vom Netzwerk verwendet wird, um Vorhersagen zu treffen und die Verlustmetrik zu berechnen.
Stage 2 - Diese Stufe heißt ‘Backward Pass’des Trainings. Wie der Name schon sagt, funktioniert es in dieser Phase rückwärts durch diesen Datensatz. Wenn Sie rückwärts gehen, werden die partiellen Ableitungen jedes Operators bis zum Netzwerkparameter ausgewertet.
Vorteile von Autograd
Im Folgenden sind die Vorteile der automatischen Differenzierung (Autograd) aufgeführt:
Flexible- Flexibilität, die wir bei der Definition unseres Netzwerks erhalten, ist einer der großen Vorteile der Verwendung von Autograd. Wir können die Operationen bei jeder Iteration ändern. Diese werden als dynamische Diagramme bezeichnet, deren Implementierung in Frameworks, die statische Diagramme erfordern, viel komplexer ist. Selbst in solchen Fällen kann Autograd die Farbverläufe immer noch korrekt rückpropagieren.
Automatic- Autograd ist automatisch, dh die Komplexität des Backpropagation-Verfahrens wird von Ihnen für Sie erledigt. Wir müssen nur angeben, welche Verläufe wir berechnen möchten.
Efficient - Autogard berechnet die Verläufe sehr effizient.
Can use native Python control flow operators- Wir können die nativen Python-Steuerungsflussoperatoren verwenden, z. B. if-Bedingung und while-Schleife. Der Autograd kann die Gradienten weiterhin effizient und korrekt zurückpropagieren.
Verwenden von Autograd in MXNet Gluon
Hier sehen wir anhand eines Beispiels, wie wir es verwenden können autograd in MXNet Gluon.
Implementierungsbeispiel
Im folgenden Beispiel implementieren wir das Regressionsmodell mit zwei Ebenen. Nach der Implementierung verwenden wir Autograd, um den Gradienten des Verlusts unter Bezugnahme auf jeden der Gewichtsparameter automatisch zu berechnen.
Importieren Sie zuerst den Autogrard und andere erforderliche Pakete wie folgt:
from mxnet import autograd
import mxnet as mx
from mxnet.gluon.nn import HybridSequential, Dense
from mxnet.gluon.loss import L2Loss
Jetzt müssen wir das Netzwerk wie folgt definieren:
N_net = HybridSequential()
N_net.add(Dense(units=3))
N_net.add(Dense(units=1))
N_net.initialize()
Jetzt müssen wir den Verlust wie folgt definieren:
loss_function = L2Loss()
Als nächstes müssen wir die Dummy-Daten wie folgt erstellen:
x = mx.nd.array([[0.5, 0.9]])
y = mx.nd.array([[1.5]])
Jetzt sind wir bereit für unseren ersten Vorwärtsdurchlauf durch das Netzwerk. Wir möchten, dass Autograd den Rechengraphen aufzeichnet, damit wir die Gradienten berechnen können. Dazu müssen wir den Netzwerkcode im Umfang von ausführenautograd.record Kontext wie folgt -
with autograd.record():
y_hat = N_net(x)
loss = loss_function(y_hat, y)
Jetzt sind wir bereit für den Rückwärtsdurchlauf, bei dem wir zunächst die Rückwärtsmethode für die interessierende Menge aufrufen. Die Quatität des Interesses in unserem Beispiel ist Verlust, weil wir versuchen, den Verlustgradienten unter Bezugnahme auf die Parameter zu berechnen -
loss.backward()
Jetzt haben wir Gradienten für jeden Parameter des Netzwerks, die vom Optimierer verwendet werden, um den Parameterwert für eine verbesserte Leistung zu aktualisieren. Schauen wir uns die Farbverläufe der 1. Ebene wie folgt an:
N_net[0].weight.grad()
Output
Die Ausgabe ist wie folgt
[[-0.00470527 -0.00846948]
[-0.03640365 -0.06552657]
[ 0.00800354 0.01440637]]
<NDArray 3x2 @cpu(0)>
Vollständiges Implementierungsbeispiel
Im Folgenden finden Sie das vollständige Implementierungsbeispiel.
from mxnet import autograd
import mxnet as mx
from mxnet.gluon.nn import HybridSequential, Dense
from mxnet.gluon.loss import L2Loss
N_net = HybridSequential()
N_net.add(Dense(units=3))
N_net.add(Dense(units=1))
N_net.initialize()
loss_function = L2Loss()
x = mx.nd.array([[0.5, 0.9]])
y = mx.nd.array([[1.5]])
with autograd.record():
y_hat = N_net(x)
loss = loss_function(y_hat, y)
loss.backward()
N_net[0].weight.grad()
In diesem Kapitel werden wir uns mit dem mehrdimensionalen Array-Format von MXNet befassen ndarray.
Umgang mit Daten mit NDArray
Zuerst werden wir sehen, wie wir mit Daten mit NDArray umgehen können. Nachfolgend sind die Voraussetzungen dafür aufgeführt -
Voraussetzungen
Um zu verstehen, wie wir mit Daten mit diesem mehrdimensionalen Array-Format umgehen können, müssen wir die folgenden Voraussetzungen erfüllen:
MXNet in einer Python-Umgebung installiert
Python 2.7.x oder Python 3.x.
Implementierungsbeispiel
Lassen Sie uns die Grundfunktionalität anhand eines unten angegebenen Beispiels verstehen -
Zuerst müssen wir MXNet und ndarray wie folgt aus MXNet importieren:
import mxnet as mx
from mxnet import nd
Sobald wir die erforderlichen Bibliotheken importiert haben, werden wir mit den folgenden grundlegenden Funktionen fortfahren:
Ein einfaches 1-D-Array mit einer Python-Liste
Example
x = nd.array([1,2,3,4,5,6,7,8,9,10])
print(x)
Output
Die Ausgabe ist wie unten erwähnt -
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
<NDArray 10 @cpu(0)>
Ein 2-D-Array mit einer Python-Liste
Example
y = nd.array([[1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10]])
print(y)
Output
Die Ausgabe ist wie unten angegeben -
[[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]]
<NDArray 3x10 @cpu(0)>
Erstellen eines NDArray ohne Initialisierung
Hier erstellen wir mithilfe von eine Matrix mit 3 Zeilen und 4 Spalten .emptyFunktion. Wir werden auch verwenden.full Funktion, die einen zusätzlichen Operator für den Wert benötigt, den Sie in das Array einfügen möchten.
Example
x = nd.empty((3, 4))
print(x)
x = nd.full((3,4), 8)
print(x)
Output
Die Ausgabe ist unten angegeben -
[[0.000e+00 0.000e+00 0.000e+00 0.000e+00]
[0.000e+00 0.000e+00 2.887e-42 0.000e+00]
[0.000e+00 0.000e+00 0.000e+00 0.000e+00]]
<NDArray 3x4 @cpu(0)>
[[8. 8. 8. 8.]
[8. 8. 8. 8.]
[8. 8. 8. 8.]]
<NDArray 3x4 @cpu(0)>
Matrix aller Nullen mit der Funktion .zeros
Example
x = nd.zeros((3, 8))
print(x)
Output
Die Ausgabe ist wie folgt -
[[0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 3x8 @cpu(0)>
Matrix aller mit der .ones-Funktion
Example
x = nd.ones((3, 8))
print(x)
Output
Die Ausgabe wird unten erwähnt -
[[1. 1. 1. 1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1. 1. 1. 1.]]
<NDArray 3x8 @cpu(0)>
Erstellen eines Arrays, dessen Werte zufällig abgetastet werden
Example
y = nd.random_normal(0, 1, shape=(3, 4))
print(y)
Output
Die Ausgabe ist unten angegeben -
[[ 1.2673576 -2.0345826 -0.32537818 -1.4583491 ]
[-0.11176403 1.3606371 -0.7889914 -0.17639421]
[-0.2532185 -0.42614475 -0.12548696 1.4022992 ]]
<NDArray 3x4 @cpu(0)>
Finden der Dimension jedes NDArray
Example
y.shape
Output
Die Ausgabe ist wie folgt -
(3, 4)
Ermitteln der Größe jedes NDArray
Example
y.size
Output
12
Ermitteln des Datentyps jedes NDArray
Example
y.dtype
Output
numpy.float32
NDArray-Operationen
In diesem Abschnitt stellen wir Ihnen die Array-Operationen von MXNet vor. NDArray unterstützt eine große Anzahl von mathematischen Standard- und In-Place-Operationen.
Mathematische Standardoperationen
Es folgen mathematische Standardoperationen, die von NDArray unterstützt werden:
Elementweise Addition
Zuerst müssen wir MXNet und ndarray wie folgt aus MXNet importieren:
import mxnet as mx
from mxnet import nd
x = nd.ones((3, 5))
y = nd.random_normal(0, 1, shape=(3, 5))
print('x=', x)
print('y=', y)
x = x + y
print('x = x + y, x=', x)
Output
Die Ausgabe wird hiermit gegeben -
x=
[[1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1.]]
<NDArray 3x5 @cpu(0)>
y=
[[-1.0554522 -1.3118273 -0.14674698 0.641493 -0.73820823]
[ 2.031364 0.5932667 0.10228804 1.179526 -0.5444829 ]
[-0.34249446 1.1086396 1.2756858 -1.8332436 -0.5289873 ]]
<NDArray 3x5 @cpu(0)>
x = x + y, x=
[[-0.05545223 -0.3118273 0.853253 1.6414931 0.26179177]
[ 3.031364 1.5932667 1.102288 2.1795259 0.4555171 ]
[ 0.6575055 2.1086397 2.2756858 -0.8332436 0.4710127 ]]
<NDArray 3x5 @cpu(0)>
Elementweise Multiplikation
Example
x = nd.array([1, 2, 3, 4])
y = nd.array([2, 2, 2, 1])
x * y
Output
Sie sehen die folgende Ausgabe -
[2. 4. 6. 4.]
<NDArray 4 @cpu(0)>
Potenzierung
Example
nd.exp(x)
Output
Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:
[ 2.7182817 7.389056 20.085537 54.59815 ]
<NDArray 4 @cpu(0)>
Matrixtransponierung zur Berechnung des Matrix-Matrix-Produkts
Example
nd.dot(x, y.T)
Output
Unten ist die Ausgabe des Codes angegeben -
[16.]
<NDArray 1 @cpu(0)>
In-Place-Operationen
Jedes Mal, wenn wir im obigen Beispiel eine Operation ausgeführt haben, haben wir einen neuen Speicher zugewiesen, um das Ergebnis zu hosten.
Wenn wir beispielsweise A = A + B schreiben, dereferenzieren wir die Matrix, auf die A zeigte, und zeigen sie stattdessen auf den neu zugewiesenen Speicher. Lassen Sie es uns anhand des folgenden Beispiels verstehen, das die Funktion id () von Python verwendet -
print('y=', y)
print('id(y):', id(y))
y = y + x
print('after y=y+x, y=', y)
print('id(y):', id(y))
Output
Bei der Ausführung erhalten Sie folgende Ausgabe:
y=
[2. 2. 2. 1.]
<NDArray 4 @cpu(0)>
id(y): 2438905634376
after y=y+x, y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)>
id(y): 2438905685664
Tatsächlich können wir das Ergebnis auch wie folgt einem zuvor zugewiesenen Array zuweisen:
print('x=', x)
z = nd.zeros_like(x)
print('z is zeros_like x, z=', z)
print('id(z):', id(z))
print('y=', y)
z[:] = x + y
print('z[:] = x + y, z=', z)
print('id(z) is the same as before:', id(z))
Output
Die Ausgabe wird unten gezeigt -
x=
[1. 2. 3. 4.]
<NDArray 4 @cpu(0)>
z is zeros_like x, z=
[0. 0. 0. 0.]
<NDArray 4 @cpu(0)>
id(z): 2438905790760
y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)>
z[:] = x + y, z=
[4. 6. 8. 9.]
<NDArray 4 @cpu(0)>
id(z) is the same as before: 2438905790760
Aus der obigen Ausgabe können wir ersehen, dass x + y immer noch einen temporären Puffer zum Speichern des Ergebnisses zuweist, bevor es nach z kopiert wird. Jetzt können wir Vorgänge vor Ort ausführen, um den Speicher besser zu nutzen und temporären Puffer zu vermeiden. Zu diesem Zweck geben wir das Argument out keyword an, das jeder Operator unterstützt, wie folgt:
print('x=', x, 'is in id(x):', id(x))
print('y=', y, 'is in id(y):', id(y))
print('z=', z, 'is in id(z):', id(z))
nd.elemwise_add(x, y, out=z)
print('after nd.elemwise_add(x, y, out=z), x=', x, 'is in id(x):', id(x))
print('after nd.elemwise_add(x, y, out=z), y=', y, 'is in id(y):', id(y))
print('after nd.elemwise_add(x, y, out=z), z=', z, 'is in id(z):', id(z))
Output
Wenn Sie das obige Programm ausführen, erhalten Sie das folgende Ergebnis:
x=
[1. 2. 3. 4.]
<NDArray 4 @cpu(0)> is in id(x): 2438905791152
y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)> is in id(y): 2438905685664
z=
[4. 6. 8. 9.]
<NDArray 4 @cpu(0)> is in id(z): 2438905790760
after nd.elemwise_add(x, y, out=z), x=
[1. 2. 3. 4.]
<NDArray 4 @cpu(0)> is in id(x): 2438905791152
after nd.elemwise_add(x, y, out=z), y=
[3. 4. 5. 5.]
<NDArray 4 @cpu(0)> is in id(y): 2438905685664
after nd.elemwise_add(x, y, out=z), z=
[4. 6. 8. 9.]
<NDArray 4 @cpu(0)> is in id(z): 2438905790760
NDArray-Kontexte
In Apache MXNet hat jedes Array einen Kontext und ein Kontext kann die CPU sein, während andere Kontexte mehrere GPUs sein können. Die Dinge können noch schlimmer werden, wenn wir die Arbeit auf mehreren Servern bereitstellen. Deshalb müssen wir Arrays intelligent Kontexte zuweisen. Dadurch wird der Zeitaufwand für die Datenübertragung zwischen Geräten minimiert.
Versuchen Sie beispielsweise, ein Array wie folgt zu initialisieren:
from mxnet import nd
z = nd.ones(shape=(3,3), ctx=mx.cpu(0))
print(z)
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[[1. 1. 1.]
[1. 1. 1.]
[1. 1. 1.]]
<NDArray 3x3 @cpu(0)>
Wir können das angegebene NDArray von einem Kontext in einen anderen Kontext kopieren, indem wir die copyto () -Methode wie folgt verwenden:
x_gpu = x.copyto(gpu(0))
print(x_gpu)
NumPy-Array vs. NDArray
Wir alle kennen NumPy-Arrays, aber Apache MXNet bietet eine eigene Array-Implementierung namens NDArray an. Eigentlich war es ursprünglich so konzipiert, dass es NumPy ähnelt, aber es gibt einen entscheidenden Unterschied:
Der Hauptunterschied besteht in der Art und Weise, wie Berechnungen in NumPy und NDArray ausgeführt werden. Jede NDArray-Manipulation in MXNet erfolgt asynchron und nicht blockierend. Wenn wir also Code wie c = a * b schreiben, wird die Funktion an die gesendetExecution Engine, wodurch die Berechnung gestartet wird.
Hier sind a und b beide NDArrays. Der Vorteil der Verwendung besteht darin, dass die Funktion sofort zurückgegeben wird und der Benutzer-Thread die Ausführung fortsetzen kann, obwohl die vorherige Berechnung möglicherweise noch nicht abgeschlossen wurde.
Funktionsweise der Execution Engine
Wenn wir über die Funktionsweise der Ausführungs-Engine sprechen, wird das Berechnungsdiagramm erstellt. Das Berechnungsdiagramm kann einige Berechnungen neu anordnen oder kombinieren, berücksichtigt jedoch immer die Abhängigkeitsreihenfolge.
Wenn beispielsweise später im Programmiercode andere Manipulationen mit 'X' vorgenommen werden, beginnt die Execution Engine damit, sobald das Ergebnis von 'X' verfügbar ist. Die Ausführungs-Engine übernimmt einige wichtige Aufgaben für die Benutzer, z. B. das Schreiben von Rückrufen, um die Ausführung des nachfolgenden Codes zu starten.
In Apache MXNet müssen wir mit Hilfe von NDArray nur auf die resultierende Variable zugreifen, um das Ergebnis der Berechnung zu erhalten. Der Codefluss wird blockiert, bis die Berechnungsergebnisse der resultierenden Variablen zugewiesen sind. Auf diese Weise wird die Codeleistung erhöht, während der zwingende Programmiermodus weiterhin unterstützt wird.
Konvertieren von NDArray in NumPy Array
Lassen Sie uns lernen, wie wir NDArray in MXNet in NumPy Array konvertieren können.
Combining higher-level operator with the help of few lower-level operators
Manchmal können wir einen übergeordneten Operator mithilfe der vorhandenen Operatoren zusammenstellen. Eines der besten Beispiele dafür ist dasnp.full_like()Operator, der in der NDArray-API nicht vorhanden ist. Es kann wie folgt leicht durch eine Kombination vorhandener Operatoren ersetzt werden:
from mxnet import nd
import numpy as np
np_x = np.full_like(a=np.arange(7, dtype=int), fill_value=15)
nd_x = nd.ones(shape=(7,)) * 15
np.array_equal(np_x, nd_x.asnumpy())
Output
Wir werden die Ausgabe wie folgt erhalten -
True
Finding similar operator with different name and/or signature
Einige der Operatoren haben einen leicht unterschiedlichen Namen, sind jedoch hinsichtlich der Funktionalität ähnlich. Ein Beispiel dafür istnd.ravel_index() mit np.ravel()Funktionen. Auf die gleiche Weise haben einige Operatoren möglicherweise ähnliche Namen, aber unterschiedliche Signaturen. Ein Beispiel dafür istnp.split() und nd.split() sind ähnlich.
Lassen Sie es uns mit dem folgenden Programmierbeispiel verstehen:
def pad_array123(data, max_length):
data_expanded = data.reshape(1, 1, 1, data.shape[0])
data_padded = nd.pad(data_expanded,
mode='constant',
pad_width=[0, 0, 0, 0, 0, 0, 0, max_length - data.shape[0]],
constant_value=0)
data_reshaped_back = data_padded.reshape(max_length)
return data_reshaped_back
pad_array123(nd.array([1, 2, 3]), max_length=10)
Output
Die Ausgabe ist unten angegeben -
[1. 2. 3. 0. 0. 0. 0. 0. 0. 0.]
<NDArray 10 @cpu(0)>
Minimierung der Auswirkungen des Blockierens von Anrufen
In einigen Fällen müssen wir entweder verwenden .asnumpy() oder .asscalar()Methoden, aber dies zwingt MXNet, die Ausführung zu blockieren, bis das Ergebnis abgerufen werden kann. Wir können die Auswirkungen eines blockierenden Anrufs durch einen Anruf minimieren.asnumpy() oder .asscalar() Methoden in dem Moment, in dem wir denken, dass die Berechnung dieses Wertes bereits abgeschlossen ist.
Implementierungsbeispiel
Example
from __future__ import print_function
import mxnet as mx
from mxnet import gluon, nd, autograd
from mxnet.ndarray import NDArray
from mxnet.gluon import HybridBlock
import numpy as np
class LossBuffer(object):
"""
Simple buffer for storing loss value
"""
def __init__(self):
self._loss = None
def new_loss(self, loss):
ret = self._loss
self._loss = loss
return ret
@property
def loss(self):
return self._loss
net = gluon.nn.Dense(10)
ce = gluon.loss.SoftmaxCELoss()
net.initialize()
data = nd.random.uniform(shape=(1024, 100))
label = nd.array(np.random.randint(0, 10, (1024,)), dtype='int32')
train_dataset = gluon.data.ArrayDataset(data, label)
train_data = gluon.data.DataLoader(train_dataset, batch_size=128, shuffle=True, num_workers=2)
trainer = gluon.Trainer(net.collect_params(), optimizer='sgd')
loss_buffer = LossBuffer()
for data, label in train_data:
with autograd.record():
out = net(data)
# This call saves new loss and returns previous loss
prev_loss = loss_buffer.new_loss(ce(out, label))
loss_buffer.loss.backward()
trainer.step(data.shape[0])
if prev_loss is not None:
print("Loss: {}".format(np.mean(prev_loss.asnumpy())))
Output
Die Ausgabe wird unten zitiert:
Loss: 2.3373236656188965
Loss: 2.3656985759735107
Loss: 2.3613128662109375
Loss: 2.3197104930877686
Loss: 2.3054862022399902
Loss: 2.329197406768799
Loss: 2.318927526473999
Ein weiteres wichtiges MXNet Python-Paket ist Gluon. In diesem Kapitel werden wir dieses Paket diskutieren. Gluon bietet eine klare, präzise und einfache API für DL-Projekte. Es ermöglicht Apache MXNet, DL-Modelle zu prototypisieren, zu bauen und zu trainieren, ohne die Trainingsgeschwindigkeit zu beeinträchtigen.
Blöcke
Blöcke bilden die Grundlage für komplexere Netzwerkdesigns. In einem neuronalen Netzwerk müssen wir mit zunehmender Komplexität des neuronalen Netzwerks vom Entwurf einzelner zu ganzen Schichten von Neuronen übergehen. Zum Beispiel haben NN-Designs wie ResNet-152 einen sehr angemessenen Grad an Regelmäßigkeit, indem sie ausblocks von wiederholten Schichten.
Beispiel
In dem unten angegebenen Beispiel schreiben wir Code in einen einfachen Block, nämlich einen Block für ein mehrschichtiges Perzeptron.
from mxnet import nd
from mxnet.gluon import nn
x = nd.random.uniform(shape=(2, 20))
N_net = nn.Sequential()
N_net.add(nn.Dense(256, activation='relu'))
N_net.add(nn.Dense(10))
N_net.initialize()
N_net(x)
Output
Dies erzeugt die folgende Ausgabe:
[[ 0.09543004 0.04614332 -0.00286655 -0.07790346 -0.05130241 0.02942038
0.08696645 -0.0190793 -0.04122177 0.05088576]
[ 0.0769287 0.03099706 0.00856576 -0.044672 -0.06926838 0.09132431
0.06786592 -0.06187843 -0.03436674 0.04234696]]
<NDArray 2x10 @cpu(0)>
Schritte, die von der Definition von Ebenen zur Definition von Blöcken einer oder mehrerer Ebenen erforderlich sind -
Step 1 - Block nehmen die Daten als Eingabe.
Step 2- Jetzt speichern Blöcke den Status in Form von Parametern. Im obigen Codierungsbeispiel enthält der Block beispielsweise zwei verborgene Ebenen, und wir benötigen einen Speicherort für die Parameter.
Step 3- Der nächste Block ruft die Vorwärtsfunktion auf, um die Vorwärtsausbreitung durchzuführen. Es wird auch Vorwärtsberechnung genannt. Als Teil des ersten Weiterleitungsaufrufs initialisieren Blöcke die Parameter auf träge Weise.
Step 4- Zuletzt rufen die Blöcke die Rückwärtsfunktion auf und berechnen den Gradienten anhand ihrer Eingabe. In der Regel wird dieser Schritt automatisch ausgeführt.
Sequentieller Block
Ein sequentieller Block ist eine spezielle Art von Block, bei dem die Daten durch eine Folge von Blöcken fließen. Dabei wird jeder Block zuvor auf die Ausgabe von eins angewendet, wobei der erste Block auf die Eingabedaten selbst angewendet wird.
Mal sehen wie sequential Klasse funktioniert -
from mxnet import nd
from mxnet.gluon import nn
class MySequential(nn.Block):
def __init__(self, **kwargs):
super(MySequential, self).__init__(**kwargs)
def add(self, block):
self._children[block.name] = block
def forward(self, x):
for block in self._children.values():
x = block(x)
return x
x = nd.random.uniform(shape=(2, 20))
N_net = MySequential()
N_net.add(nn.Dense(256, activation
='relu'))
N_net.add(nn.Dense(10))
N_net.initialize()
N_net(x)
Output
Die Ausgabe wird hiermit gegeben -
[[ 0.09543004 0.04614332 -0.00286655 -0.07790346 -0.05130241 0.02942038
0.08696645 -0.0190793 -0.04122177 0.05088576]
[ 0.0769287 0.03099706 0.00856576 -0.044672 -0.06926838 0.09132431
0.06786592 -0.06187843 -0.03436674 0.04234696]]
<NDArray 2x10 @cpu(0)>
Benutzerdefinierter Block
Wir können leicht über die Verkettung mit dem oben definierten sequentiellen Block hinausgehen. Aber wenn wir Anpassungen vornehmen möchten, dann dieBlockKlasse bietet uns auch die erforderliche Funktionalität. Die Blockklasse verfügt über einen Modellkonstruktor, der im Modul nn bereitgestellt wird. Wir können diesen Modellkonstruktor erben, um das gewünschte Modell zu definieren.
Im folgenden Beispiel wird die MLP class überschreibt die __init__ und Weiterleitungsfunktionen der Block-Klasse.
Lassen Sie uns sehen, wie es funktioniert.
class MLP(nn.Block):
def __init__(self, **kwargs):
super(MLP, self).__init__(**kwargs)
self.hidden = nn.Dense(256, activation='relu') # Hidden layer
self.output = nn.Dense(10) # Output layer
def forward(self, x):
hidden_out = self.hidden(x)
return self.output(hidden_out)
x = nd.random.uniform(shape=(2, 20))
N_net = MLP()
N_net.initialize()
N_net(x)
Output
Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:
[[ 0.07787763 0.00216403 0.01682201 0.03059879 -0.00702019 0.01668715
0.04822846 0.0039432 -0.09300035 -0.04494302]
[ 0.08891078 -0.00625484 -0.01619131 0.0380718 -0.01451489 0.02006172
0.0303478 0.02463485 -0.07605448 -0.04389168]]
<NDArray 2x10 @cpu(0)>
Benutzerdefinierte Ebenen
Die Gluon-API von Apache MXNet enthält eine bescheidene Anzahl vordefinierter Ebenen. Aber irgendwann stellen wir möglicherweise fest, dass eine neue Ebene benötigt wird. Wir können einfach eine neue Ebene in der Gluon-API hinzufügen. In diesem Abschnitt werden wir sehen, wie wir eine neue Ebene von Grund auf neu erstellen können.
Die einfachste benutzerdefinierte Ebene
Um eine neue Ebene in der Gluon-API zu erstellen, müssen wir eine Klasse erstellen, die von der Block-Klasse erbt und die grundlegendste Funktionalität bietet. Wir können alle vordefinierten Ebenen direkt oder über andere Unterklassen davon erben.
Zum Erstellen der neuen Ebene muss nur die Instanzmethode implementiert werden forward (self, x). Diese Methode definiert, was genau unsere Schicht während der Vorwärtsausbreitung tun wird. Wie bereits erwähnt, wird der Back-Propagation-Pass für Blöcke automatisch von Apache MXNet selbst ausgeführt.
Beispiel
Im folgenden Beispiel definieren wir eine neue Ebene. Wir werden auch implementierenforward() Methode zum Normalisieren der Eingabedaten durch Anpassen in einen Bereich von [0, 1].
from __future__ import print_function
import mxnet as mx
from mxnet import nd, gluon, autograd
from mxnet.gluon.nn import Dense
mx.random.seed(1)
class NormalizationLayer(gluon.Block):
def __init__(self):
super(NormalizationLayer, self).__init__()
def forward(self, x):
return (x - nd.min(x)) / (nd.max(x) - nd.min(x))
x = nd.random.uniform(shape=(2, 20))
N_net = NormalizationLayer()
N_net.initialize()
N_net(x)
Output
Wenn Sie das obige Programm ausführen, erhalten Sie das folgende Ergebnis:
[[0.5216355 0.03835821 0.02284337 0.5945146 0.17334817 0.69329053
0.7782702 1. 0.5508242 0. 0.07058554 0.3677264
0.4366546 0.44362497 0.7192635 0.37616986 0.6728799 0.7032008
0.46907538 0.63514024]
[0.9157533 0.7667402 0.08980197 0.03593295 0.16176797 0.27679572
0.07331014 0.3905285 0.6513384 0.02713427 0.05523694 0.12147208
0.45582628 0.8139887 0.91629887 0.36665893 0.07873632 0.78268915
0.63404864 0.46638715]]
<NDArray 2x20 @cpu(0)>
Hybridisierung
Es kann als ein Prozess definiert werden, der von Apache MXNets verwendet wird, um einen symbolischen Graphen einer Vorwärtsberechnung zu erstellen. Durch die Hybridisierung kann MXNet die Rechenleistung durch Optimierung des rechnergestützten symbolischen Diagramms steigern. Anstatt direkt von zu erbenBlockIn der Tat können wir feststellen, dass während der Implementierung vorhandener Ebenen ein Block von a erbt HybridBlock.
Im Folgenden sind die Gründe dafür aufgeführt:
Allows us to write custom layers: Mit HybridBlock können wir benutzerdefinierte Ebenen schreiben, die sowohl in der imperativen als auch in der symbolischen Programmierung verwendet werden können.
Increase computation performance- HybridBlock optimiert den rechnergestützten symbolischen Graphen, wodurch MXNet die Rechenleistung steigern kann.
Beispiel
In diesem Beispiel schreiben wir unsere oben erstellte Beispielebene mithilfe von HybridBlock neu:
class NormalizationHybridLayer(gluon.HybridBlock):
def __init__(self):
super(NormalizationHybridLayer, self).__init__()
def hybrid_forward(self, F, x):
return F.broadcast_div(F.broadcast_sub(x, F.min(x)), (F.broadcast_sub(F.max(x), F.min(x))))
layer_hybd = NormalizationHybridLayer()
layer_hybd(nd.array([1, 2, 3, 4, 5, 6], ctx=mx.cpu()))
Output
Die Ausgabe ist unten angegeben:
[0. 0.2 0.4 0.6 0.8 1. ]
<NDArray 6 @cpu(0)>
Die Hybridisierung hat nichts mit der Berechnung auf der GPU zu tun, und man kann sowohl hybridisierte als auch nicht hybridisierte Netzwerke sowohl auf der CPU als auch auf der GPU trainieren.
Unterschied zwischen Block und HybridBlock
Wenn wir das vergleichen Block Klasse und HybridBlock, wir werden sehen HybridBlock hat schon seine forward() Methode implementiert. HybridBlock definiert a hybrid_forward()Methode, die beim Erstellen der Ebenen implementiert werden muss. Das Argument F erzeugt den Hauptunterschied zwischenforward() und hybrid_forward(). In der MXNet-Community wird das F-Argument als Backend bezeichnet. F kann sich entweder beziehenmxnet.ndarray API (für imperative Programmierung verwendet) oder mxnet.symbol API (wird für die symbolische Programmierung verwendet).
Wie füge ich einem Netzwerk eine benutzerdefinierte Ebene hinzu?
Anstatt benutzerdefinierte Ebenen separat zu verwenden, werden diese Ebenen mit vordefinierten Ebenen verwendet. Wir können entweder verwendenSequential oder HybridSequentialContainer aus einem sequentiellen neuronalen Netzwerk. Wie bereits erwähnt,Sequential Container erben von Block und HybridSequential geerbt von HybridBlock beziehungsweise.
Beispiel
Im folgenden Beispiel erstellen wir ein einfaches neuronales Netzwerk mit einer benutzerdefinierten Ebene. Die Ausgabe vonDense (5) Ebene wird die Eingabe von sein NormalizationHybridLayer. Die Ausgabe vonNormalizationHybridLayer wird die Eingabe von Dense (1) Schicht.
net = gluon.nn.HybridSequential()
with net.name_scope():
net.add(Dense(5))
net.add(NormalizationHybridLayer())
net.add(Dense(1))
net.initialize(mx.init.Xavier(magnitude=2.24))
net.hybridize()
input = nd.random_uniform(low=-10, high=10, shape=(10, 2))
net(input)
Output
Sie sehen die folgende Ausgabe -
[[-1.1272651]
[-1.2299833]
[-1.0662932]
[-1.1805027]
[-1.3382034]
[-1.2081106]
[-1.1263978]
[-1.2524893]
[-1.1044774]
[-1.316593 ]]
<NDArray 10x1 @cpu(0)>
Benutzerdefinierte Ebenenparameter
In einem neuronalen Netzwerk ist einer Schicht eine Reihe von Parametern zugeordnet. Wir bezeichnen sie manchmal als Gewichte, was der interne Zustand einer Schicht ist. Diese Parameter spielen unterschiedliche Rollen -
Manchmal sind dies diejenigen, die wir während des Backpropagation-Schritts lernen möchten.
Manchmal sind dies nur Konstanten, die wir beim Vorwärtsdurchlauf verwenden möchten.
Wenn wir über das Programmierkonzept sprechen, werden diese Parameter (Gewichte) eines Blocks gespeichert und über abgerufen ParameterDict Klasse, die beim Initialisieren, Aktualisieren, Speichern und Laden hilft.
Beispiel
Im folgenden Beispiel definieren wir zwei folgende Parametersätze:
Parameter weights- Dies ist trainierbar und seine Form ist während der Bauphase unbekannt. Es wird beim ersten Durchlauf der Vorwärtsausbreitung abgeleitet.
Parameter scale- Dies ist eine Konstante, deren Wert sich nicht ändert. Im Gegensatz zu Parametergewichten wird seine Form während der Konstruktion definiert.
class NormalizationHybridLayer(gluon.HybridBlock):
def __init__(self, hidden_units, scales):
super(NormalizationHybridLayer, self).__init__()
with self.name_scope():
self.weights = self.params.get('weights',
shape=(hidden_units, 0),
allow_deferred_init=True)
self.scales = self.params.get('scales',
shape=scales.shape,
init=mx.init.Constant(scales.asnumpy()),
differentiable=False)
def hybrid_forward(self, F, x, weights, scales):
normalized_data = F.broadcast_div(F.broadcast_sub(x, F.min(x)),
(F.broadcast_sub(F.max(x), F.min(x))))
weighted_data = F.FullyConnected(normalized_data, weights, num_hidden=self.weights.shape[0], no_bias=True)
scaled_data = F.broadcast_mul(scales, weighted_data)
return scaled_data
Dieses Kapitel befasst sich mit den Python-Paketen KVStore und Visualisierung.
KVStore-Paket
KV Stores steht für Key-Value Store. Es ist eine wichtige Komponente für das Training mit mehreren Geräten. Dies ist wichtig, da die Kommunikation von Parametern zwischen Geräten auf einem oder mehreren Computern über einen oder mehrere Server mit einem KVStore für die Parameter übertragen wird.
Lassen Sie uns die Arbeitsweise von KVStore anhand folgender Punkte verstehen:
Jeder Wert in KVStore wird durch a dargestellt key und ein value.
Jedem Parameterarray im Netzwerk ist a zugeordnet key und auf die Gewichte dieses Parameterarrays wird verwiesen value.
Danach die Worker-Knoten pushFarbverläufe nach der Bearbeitung einer Charge. Sie auchpull Aktualisierte Gewichte vor der Verarbeitung einer neuen Charge.
Mit einfachen Worten können wir sagen, dass KVStore ein Ort für den Datenaustausch ist, an dem jedes Gerät Daten ein- und ausziehen kann.
Daten Push-In und Pull-Out
KVStore kann als einzelnes Objekt betrachtet werden, das von verschiedenen Geräten wie GPUs und Computern gemeinsam genutzt wird, wobei jedes Gerät Daten ein- und ausziehen kann.
Im Folgenden sind die Implementierungsschritte aufgeführt, die von Geräten ausgeführt werden müssen, um Daten einzuschieben und herauszuziehen:
Implementierungsschritte
Initialisation- Der erste Schritt besteht darin, die Werte zu initialisieren. In unserem Beispiel initialisieren wir ein Paar (int, NDArray) in KVStrore und ziehen danach die Werte heraus -
import mxnet as mx
kv = mx.kv.create('local') # create a local KVStore.
shape = (3,3)
kv.init(3, mx.nd.ones(shape)*2)
a = mx.nd.zeros(shape)
kv.pull(3, out = a)
print(a.asnumpy())
Output
Dies erzeugt die folgende Ausgabe -
[[2. 2. 2.]
[2. 2. 2.]
[2. 2. 2.]]
Push, Aggregate, and Update - Nach der Initialisierung können wir einen neuen Wert mit der gleichen Form auf den Schlüssel in den KVStore übertragen. -
kv.push(3, mx.nd.ones(shape)*8)
kv.pull(3, out = a)
print(a.asnumpy())
Output
Die Ausgabe ist unten angegeben -
[[8. 8. 8.]
[8. 8. 8.]
[8. 8. 8.]]
Die zum Pushen verwendeten Daten können auf jedem Gerät wie GPUs oder Computern gespeichert werden. Wir können auch mehrere Werte in dieselbe Taste drücken. In diesem Fall summiert der KVStore zuerst alle diese Werte und überträgt dann den aggregierten Wert wie folgt:
contexts = [mx.cpu(i) for i in range(4)]
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.push(3, b)
kv.pull(3, out = a)
print(a.asnumpy())
Output
Sie sehen die folgende Ausgabe -
[[4. 4. 4.]
[4. 4. 4.]
[4. 4. 4.]]
Für jeden Push, den Sie angewendet haben, kombiniert KVStore den Push-Wert mit dem bereits gespeicherten Wert. Dies erfolgt mit Hilfe eines Updaters. Hier ist der Standard-Updater ASSIGN.
def update(key, input, stored):
print("update on key: %d" % key)
stored += input * 2
kv.set_updater(update)
kv.pull(3, out=a)
print(a.asnumpy())
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[[4. 4. 4.]
[4. 4. 4.]
[4. 4. 4.]]
Example
kv.push(3, mx.nd.ones(shape))
kv.pull(3, out=a)
print(a.asnumpy())
Output
Unten ist die Ausgabe des Codes angegeben -
update on key: 3
[[6. 6. 6.]
[6. 6. 6.]
[6. 6. 6.]]
Pull - Wie bei Push können wir den Wert auch mit einem einzigen Aufruf wie folgt auf mehrere Geräte übertragen: -
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.pull(3, out = b)
print(b[1].asnumpy())
Output
Die Ausgabe ist unten angegeben -
[[6. 6. 6.]
[6. 6. 6.]
[6. 6. 6.]]
Vollständiges Implementierungsbeispiel
Im Folgenden finden Sie das vollständige Implementierungsbeispiel -
import mxnet as mx
kv = mx.kv.create('local')
shape = (3,3)
kv.init(3, mx.nd.ones(shape)*2)
a = mx.nd.zeros(shape)
kv.pull(3, out = a)
print(a.asnumpy())
kv.push(3, mx.nd.ones(shape)*8)
kv.pull(3, out = a) # pull out the value
print(a.asnumpy())
contexts = [mx.cpu(i) for i in range(4)]
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.push(3, b)
kv.pull(3, out = a)
print(a.asnumpy())
def update(key, input, stored):
print("update on key: %d" % key)
stored += input * 2
kv._set_updater(update)
kv.pull(3, out=a)
print(a.asnumpy())
kv.push(3, mx.nd.ones(shape))
kv.pull(3, out=a)
print(a.asnumpy())
b = [mx.nd.ones(shape, ctx) for ctx in contexts]
kv.pull(3, out = b)
print(b[1].asnumpy())
Umgang mit Schlüsselwertpaaren
Alle oben implementierten Vorgänge umfassen einen einzelnen Schlüssel, aber KVStore bietet auch eine Schnittstelle für a list of key-value pairs - -
Für ein einzelnes Gerät
Das folgende Beispiel zeigt eine KVStore-Schnittstelle für eine Liste von Schlüssel-Wert-Paaren für ein einzelnes Gerät:
keys = [5, 7, 9]
kv.init(keys, [mx.nd.ones(shape)]*len(keys))
kv.push(keys, [mx.nd.ones(shape)]*len(keys))
b = [mx.nd.zeros(shape)]*len(keys)
kv.pull(keys, out = b)
print(b[1].asnumpy())
Output
Sie erhalten folgende Ausgabe:
update on key: 5
update on key: 7
update on key: 9
[[3. 3. 3.]
[3. 3. 3.]
[3. 3. 3.]]
Für mehrere Geräte
Das folgende Beispiel zeigt eine KVStore-Schnittstelle für eine Liste von Schlüssel-Wert-Paaren für mehrere Geräte:
b = [[mx.nd.ones(shape, ctx) for ctx in contexts]] * len(keys)
kv.push(keys, b)
kv.pull(keys, out = b)
print(b[1][1].asnumpy())
Output
Sie sehen die folgende Ausgabe -
update on key: 5
update on key: 7
update on key: 9
[[11. 11. 11.]
[11. 11. 11.]
[11. 11. 11.]]
Visualisierungspaket
Das Visualisierungspaket ist ein Apache MXNet-Paket, mit dem das neuronale Netzwerk (NN) als Berechnungsdiagramm dargestellt wird, das aus Knoten und Kanten besteht.
Visualisieren Sie das neuronale Netzwerk
Im folgenden Beispiel werden wir verwenden mx.viz.plot_networkneuronales Netzwerk zu visualisieren. Folgendes sind die Voraussetzungen dafür -
Prerequisites
Jupyter Notizbuch
Graphviz-Bibliothek
Implementierungsbeispiel
Im folgenden Beispiel werden wir ein Beispiel NN für die lineare Matrixfaktorisierung visualisieren -
import mxnet as mx
user = mx.symbol.Variable('user')
item = mx.symbol.Variable('item')
score = mx.symbol.Variable('score')
# Set the dummy dimensions
k = 64
max_user = 100
max_item = 50
# The user feature lookup
user = mx.symbol.Embedding(data = user, input_dim = max_user, output_dim = k)
# The item feature lookup
item = mx.symbol.Embedding(data = item, input_dim = max_item, output_dim = k)
# predict by the inner product and then do sum
N_net = user * item
N_net = mx.symbol.sum_axis(data = N_net, axis = 1)
N_net = mx.symbol.Flatten(data = N_net)
# Defining the loss layer
N_net = mx.symbol.LinearRegressionOutput(data = N_net, label = score)
# Visualize the network
mx.viz.plot_network(N_net)
In diesem Kapitel wird die ndarray-Bibliothek erläutert, die in Apache MXNet verfügbar ist.
Mxnet.ndarray
Die NDArray-Bibliothek von Apache MXNet definiert den Kern-DS (Datenstrukturen) für alle mathematischen Berechnungen. Zwei grundlegende Aufgaben von NDArray sind:
Es unterstützt die schnelle Ausführung auf einer Vielzahl von Hardwarekonfigurationen.
Es parallelisiert automatisch mehrere Vorgänge über die verfügbare Hardware.
Das folgende Beispiel zeigt, wie ein NDArray mithilfe eines 1-D- und 2-D-Arrays aus einer regulären Python-Liste erstellt werden kann.
import mxnet as mx
from mxnet import nd
x = nd.array([1,2,3,4,5,6,7,8,9,10])
print(x)
Output
Die Ausgabe ist unten angegeben:
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
<NDArray 10 @cpu(0)>
Example
y = nd.array([[1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10], [1,2,3,4,5,6,7,8,9,10]])
print(y)
Output
Dies erzeugt die folgende Ausgabe -
[[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]]
<NDArray 3x10 @cpu(0)>
Lassen Sie uns nun die Klassen, Funktionen und Parameter der ndarray-API von MXNet ausführlich diskutieren.
Klassen
Die folgende Tabelle enthält die Klassen der ndarray-API von MXNet -
Klasse | Definition |
---|---|
CachedOp (sym [, flags]) | Es wird für das zwischengespeicherte Bedienerhandle verwendet. |
NDArray (handle [, beschreibbar]) | Es wird als Array-Objekt verwendet, das ein mehrdimensionales, homogenes Array von Elementen fester Größe darstellt. |
Funktionen und ihre Parameter
Im Folgenden sind einige wichtige Funktionen und deren Parameter aufgeführt, die von der API mxnet.ndarray abgedeckt werden:
Funktion und ihre Parameter | Definition |
---|---|
Activation([data, act_type, out, name]) | Es wendet eine Aktivierungsfunktion elementweise auf den Eingang an. Es unterstützt die Aktivierungsfunktionen relu, sigmoid, tanh, softrelu und softsign. |
BatchNorm([Daten, Gamma, Beta, Moving_Mean,…]) | Es wird zur Chargennormalisierung verwendet. Diese Funktion normalisiert einen Datenstapel nach Mittelwert und Varianz. Es wird eine Skala Gamma und Offset Beta angewendet. |
BilinearSampler([Daten, Raster, cudnn_off,…]) | Diese Funktion wendet eine bilineare Abtastung auf die Eingabe-Feature-Map an. Eigentlich ist es der Schlüssel von "Spatial Transformer Networks". Wenn Sie mit der Remap-Funktion in OpenCV vertraut sind, ist die Verwendung dieser Funktion der sehr ähnlich. Der einzige Unterschied ist, dass es den Rückwärtspass hat. |
BlockGrad ([Daten, Out, Name]) | Wie der Name schon sagt, stoppt diese Funktion die Gradientenberechnung. Grundsätzlich wird verhindert, dass der akkumulierte Gradient der Eingaben durch diesen Operator in Rückwärtsrichtung fließt. |
cast ([Daten, Typ, Out, Name]) | Diese Funktion wandelt alle Elemente der Eingabe in einen neuen Typ um. |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir die Funktion BilinierSampler (), um die Daten zweimal herauszuzoomen und die Daten horizontal um -1 Pixel zu verschieben.
import mxnet as mx
from mxnet import nd
data = nd.array([[[[2, 5, 3, 6],
[1, 8, 7, 9],
[0, 4, 1, 8],
[2, 0, 3, 4]]]])
affine_matrix = nd.array([[2, 0, 0],
[0, 2, 0]])
affine_matrix = nd.reshape(affine_matrix, shape=(1, 6))
grid = nd.GridGenerator(data=affine_matrix, transform_type='affine', target_shape=(4, 4))
output = nd.BilinearSampler(data, grid)
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[[[[0. 0. 0. 0. ]
[0. 4.0000005 6.25 0. ]
[0. 1.5 4. 0. ]
[0. 0. 0. 0. ]]]]
<NDArray 1x1x4x4 @cpu(0)>
Die obige Ausgabe zeigt das zweimalige Verkleinern von Daten.
Ein Beispiel für die Verschiebung der Daten um -1 Pixel ist wie folgt:
import mxnet as mx
from mxnet import nd
data = nd.array([[[[2, 5, 3, 6],
[1, 8, 7, 9],
[0, 4, 1, 8],
[2, 0, 3, 4]]]])
warp_matrix = nd.array([[[[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]],
[[0, 0, 0, 0],
[0, 0, 0, 0],
[0, 0, 0, 0],
[0, 0, 0, 0]]]])
grid = nd.GridGenerator(data=warp_matrix, transform_type='warp')
output = nd.BilinearSampler(data, grid)
Output
Die Ausgabe ist unten angegeben -
[[[[5. 3. 6. 0.]
[8. 7. 9. 0.]
[4. 1. 8. 0.]
[0. 3. 4. 0.]]]]
<NDArray 1x1x4x4 @cpu(0)>
In ähnlicher Weise zeigt das folgende Beispiel die Verwendung der Funktion cast () -
nd.cast(nd.array([300, 10.1, 15.4, -1, -2]), dtype='uint8')
Output
Bei der Ausführung erhalten Sie folgende Ausgabe:
[ 44 10 15 255 254]
<NDArray 5 @cpu(0)>
ndarray.contrib
Die Contrib NDArray-API ist im Paket ndarray.contrib definiert. Es bietet normalerweise viele nützliche experimentelle APIs für neue Funktionen. Diese API dient als Ort für die Community, an dem sie die neuen Funktionen ausprobieren kann. Der Feature-Mitwirkende erhält ebenfalls das Feedback.
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.contrib API - -
Funktion und ihre Parameter | Definition |
---|---|
rand_zipfian(true_classes, num_sampled,…) | Diese Funktion zieht Zufallsstichproben aus einer ungefähren Zipfian-Verteilung. Die Basisverteilung dieser Funktion ist die Zipfian-Verteilung. Diese Funktion tastet zufällig num_sampled Kandidaten ab und die Elemente von sampled_candidates werden aus der oben angegebenen Basisverteilung gezogen. |
foreach(body, data, init_states) | Wie der Name schon sagt, führt diese Funktion eine for-Schleife mit benutzerdefinierter Berechnung über NDArrays in Dimension 0 aus. Diese Funktion simuliert eine for-Schleife und body hat die Berechnung für eine Iteration der for-Schleife. |
while_loop (cond, func, loop_vars [,…]) | Wie der Name schon sagt, führt diese Funktion eine while-Schleife mit benutzerdefinierter Berechnung und Schleifenbedingung aus. Diese Funktion simuliert eine while-Schleife, die literarisch benutzerdefinierte Berechnungen durchführt, wenn die Bedingung erfüllt ist. |
cond(pred, then_func, else_func) | Wie der Name schon sagt, führt diese Funktion ein Wenn-Dann-Sonst unter Verwendung einer benutzerdefinierten Bedingung und Berechnung aus. Diese Funktion simuliert einen if-ähnlichen Zweig, der eine der beiden benutzerdefinierten Berechnungen gemäß der angegebenen Bedingung ausführt. |
isinf(Daten) | Diese Funktion führt eine elementweise Überprüfung durch, um festzustellen, ob das NDArray ein unendliches Element enthält oder nicht. |
getnnz([Daten, Achse, Ausgang, Name]) | Diese Funktion gibt uns die Anzahl der gespeicherten Werte für einen spärlichen Tensor an. Es enthält auch explizite Nullen. Es unterstützt nur die CSR-Matrix auf der CPU. |
Requantize ([Daten, min_range, max_range,…]) | Diese Funktion benötigt die angegebenen Daten, die in int32 und den entsprechenden Schwellenwerten quantisiert sind, in int8 unter Verwendung von minimalen und maximalen Schwellenwerten, die entweder zur Laufzeit oder aus der Kalibrierung berechnet werden. |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir die Funktion rand_zipfian, um Zufallsstichproben aus einer ungefähren Zipfian-Verteilung zu ziehen.
import mxnet as mx
from mxnet import nd
trueclass = mx.nd.array([2])
samples, exp_count_true, exp_count_sample = mx.nd.contrib.rand_zipfian(trueclass, 3, 4)
samples
Output
Sie sehen die folgende Ausgabe -
[0 0 1]
<NDArray 3 @cpu(0)>
Example
exp_count_true
Output
Die Ausgabe ist unten angegeben:
[0.53624076]
<NDArray 1 @cpu(0)>
Example
exp_count_sample
Output
Dies erzeugt die folgende Ausgabe:
[1.29202967 1.29202967 0.75578891]
<NDArray 3 @cpu(0)>
Im folgenden Beispiel verwenden wir die Funktion while_loop zum Ausführen einer while-Schleife für benutzerdefinierte Berechnungen und Schleifenbedingungen:
cond = lambda i, s: i <= 7
func = lambda i, s: ([i + s], [i + 1, s + i])
loop_var = (mx.nd.array([0], dtype="int64"), mx.nd.array([1], dtype="int64"))
outputs, states = mx.nd.contrib.while_loop(cond, func, loop_vars, max_iterations=10)
outputs
Output
Die Ausgabe wird unten gezeigt -
[
[[ 1]
[ 2]
[ 4]
[ 7]
[ 11]
[ 16]
[ 22]
[ 29]
[3152434450384]
[ 257]]
<NDArray 10x1 @cpu(0)>]
Example
States
Output
Dies erzeugt die folgende Ausgabe -
[
[8]
<NDArray 1 @cpu(0)>,
[29]
<NDArray 1 @cpu(0)>]
ndarray.image
Die Image NDArray-API ist im Paket ndarray.image definiert. Wie der Name schon sagt, wird es normalerweise für Bilder und deren Funktionen verwendet.
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.image API- -
Funktion und ihre Parameter | Definition |
---|---|
adjust_lighting([Daten, Alpha, Out, Name]) | Wie der Name schon sagt, passt diese Funktion die Beleuchtungsstärke des Eingangs an. Es folgt dem AlexNet-Stil. |
crop([Daten, x, y, Breite, Höhe, Out, Name]) | Mit Hilfe dieser Funktion können wir ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zuschneiden. |
normalize([Daten, Mittelwert, Standard, Out, Name]) | Es wird ein Tensor der Form (C x H x B) oder (N x C x H x B) mit normalisiert mean und standard deviation(SD). |
random_crop ([Daten, x-Bereich, y-Bereich, Breite,…]) | Ähnlich wie beim Zuschneiden () wird zufällig ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zugeschnitten. Das Ergebnis wird aktualisiert, wenn src kleiner als die Größe ist. |
random_lighting([data, alpha_std, out, name]) | Wie der Name schon sagt, fügt diese Funktion das PCA-Rauschen zufällig hinzu. Es folgt auch dem AlexNet-Stil. |
random_resized_crop([data, xrange, yrange,…]) | Es schneidet auch ein Bild zufällig NDArray der Form (H x B x C) oder (N x H x B x C) auf die angegebene Größe. Das Ergebnis wird aktualisiert, wenn src kleiner als die Größe ist. Es wird auch die Flächen- und Seitenration zufällig sortieren. |
resize([Daten, Größe, keep_ratio, interp,…]) | Wie der Name schon sagt, ändert diese Funktion die Größe eines Bild-NDArrays der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe. |
to_tensor([Daten, Out, Name]) | Es konvertiert ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray der Form (C x H x B) oder ( N x C x H x B) mit den Werten im Bereich [0, 1]. |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir die Funktion to_tensor, um das Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray umzuwandeln der Form (C x H x B) oder (N x C x H x B) mit den Werten im Bereich [0, 1].
import numpy as np
img = mx.nd.random.uniform(0, 255, (4, 2, 3)).astype(dtype=np.uint8)
mx.nd.image.to_tensor(img)
Output
Sie sehen die folgende Ausgabe -
[[[0.972549 0.5058824 ]
[0.6039216 0.01960784]
[0.28235295 0.35686275]
[0.11764706 0.8784314 ]]
[[0.8745098 0.9764706 ]
[0.4509804 0.03529412]
[0.9764706 0.29411766]
[0.6862745 0.4117647 ]]
[[0.46666667 0.05490196]
[0.7372549 0.4392157 ]
[0.11764706 0.47843137]
[0.31764707 0.91764706]]]
<NDArray 3x4x2 @cpu(0)>
Example
img = mx.nd.random.uniform(0, 255, (2, 4, 2, 3)).astype(dtype=np.uint8)
mx.nd.image.to_tensor(img)
Output
Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:
[[[[0.0627451 0.5647059 ]
[0.2627451 0.9137255 ]
[0.57254905 0.27450982]
[0.6666667 0.64705884]]
[[0.21568628 0.5647059 ]
[0.5058824 0.09019608]
[0.08235294 0.31764707]
[0.8392157 0.7137255 ]]
[[0.6901961 0.8627451 ]
[0.52156866 0.91764706]
[0.9254902 0.00784314]
[0.12941177 0.8392157 ]]]
[[[0.28627452 0.39607844]
[0.01960784 0.36862746]
[0.6745098 0.7019608 ]
[0.9607843 0.7529412 ]]
[[0.2627451 0.58431375]
[0.16470589 0.00392157]
[0.5686275 0.73333335]
[0.43137255 0.57254905]]
[[0.18039216 0.54901963]
[0.827451 0.14509805]
[0.26666668 0.28627452]
[0.24705882 0.39607844]]]]
<NDArgt;ray 2x3x4x2 @cpu(0)>
Im folgenden Beispiel verwenden wir die Funktion normalize einen Tensor der Form (C x H x B) oder (N x C x H x B) mit zu normalisieren mean und standard deviation(SD).
img = mx.nd.random.uniform(0, 1, (3, 4, 2))
mx.nd.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))
Output
Dies erzeugt die folgende Ausgabe -
[[[ 0.29391178 0.3218054 ]
[ 0.23084386 0.19615503]
[ 0.24175143 0.21988946]
[ 0.16710812 0.1777354 ]]
[[-0.02195817 -0.3847335 ]
[-0.17800489 -0.30256534]
[-0.28807247 -0.19059572]
[-0.19680339 -0.26256624]]
[[-1.9808068 -1.5298678 ]
[-1.6984252 -1.2839255 ]
[-1.3398265 -1.712009 ]
[-1.7099224 -1.6165378 ]]]
<NDArray 3x4x2 @cpu(0)>
Example
img = mx.nd.random.uniform(0, 1, (2, 3, 4, 2))
mx.nd.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[[[[ 2.0600514e-01 2.4972327e-01]
[ 1.4292289e-01 2.9281738e-01]
[ 4.5158025e-02 3.4287784e-02]
[ 9.9427439e-02 3.0791296e-02]]
[[-2.1501756e-01 -3.2297665e-01]
[-2.0456362e-01 -2.2409186e-01]
[-2.1283737e-01 -4.8318747e-01]
[-1.7339960e-01 -1.5519112e-02]]
[[-1.3478968e+00 -1.6790028e+00]
[-1.5685816e+00 -1.7787373e+00]
[-1.1034534e+00 -1.8587360e+00]
[-1.6324382e+00 -1.9027401e+00]]]
[[[ 1.4528830e-01 3.2801408e-01]
[ 2.9730779e-01 8.6780310e-02]
[ 2.6873133e-01 1.7900752e-01]
[ 2.3462953e-01 1.4930873e-01]]
[[-4.4988656e-01 -4.5021546e-01]
[-4.0258706e-02 -3.2384416e-01]
[-1.4287934e-01 -2.6537544e-01]
[-5.7649612e-04 -7.9429924e-02]]
[[-1.8505517e+00 -1.0953522e+00]
[-1.1318740e+00 -1.9624406e+00]
[-1.8375070e+00 -1.4916846e+00]
[-1.3844404e+00 -1.8331525e+00]]]]
<NDArray 2x3x4x2 @cpu(0)>
ndarray.random
Die zufällige NDArray-API ist im Paket ndarray.random definiert. Wie der Name schon sagt, handelt es sich um die NDArray-API des Zufallsverteilungsgenerators von MXNet.
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.random API - -
Funktion und ihre Parameter | Definition |
---|---|
Uniform ([niedrig, hoch, Form, dtype, ctx, out]) | Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung generiert. |
normal ([loc, scale, shape, dtype, ctx, out]) | Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert. |
randn (* form, ** kwargs) | Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert. |
exponentiell ([Skala, Form, dtype, ctx, out]) | Es werden Stichproben aus einer Exponentialverteilung generiert. |
Gamma ([Alpha, Beta, Form, D-Typ, Ctx, Out]) | Aus einer Gammaverteilung werden Zufallsstichproben generiert. |
multinomial (Daten [, Form, get_prob, out, dtype]) | Es generiert eine gleichzeitige Abtastung aus mehreren Multinomialverteilungen. |
negative_binomial ([k, p, Form, dtype, ctx, out]) | Es werden Zufallsstichproben aus einer negativen Binomialverteilung generiert. |
generalized_negative_binomial ([mu, alpha,…]) | Es generiert Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung. |
mischen (Daten, ** kwargs) | Die Elemente werden zufällig gemischt. |
Randint (niedrig, hoch [, Form, Typ, Ctx, out]) | Es werden Zufallsstichproben aus einer diskreten Gleichverteilung generiert. |
exponentiell_ähnlich ([data, lam, out, name]) | Es werden Zufallsstichproben aus einer Exponentialverteilung gemäß der Form des Eingabearrays generiert. |
gamma_like ([Daten, Alpha, Beta, Out, Name]) | Es werden Zufallsstichproben aus einer Gammaverteilung gemäß der Form des Eingabearrays generiert. |
generalized_negative_binomial_like ([Daten,…]) | Es werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gemäß der Form des Eingabearrays generiert. |
negative_binomial_like ([Daten, k, p, out, Name]) | Es werden Zufallsstichproben aus einer negativen Binomialverteilung entsprechend der Form des Eingabearrays generiert. |
normal_like ([Daten, Ort, Skalierung, Out, Name]) | Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) entsprechend der Form des Eingabearrays generiert. |
poisson_like ([Daten, Lam, Out, Name]) | Es werden Zufallsstichproben aus einer Poisson-Verteilung entsprechend der Form des Eingabearrays generiert. |
uniform_like ([Daten, niedrig, hoch, out, Name]) | Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung entsprechend der Form des Eingabearrays generiert. |
Implementierungsbeispiele
Im folgenden Beispiel werden Zufallsstichproben aus einer gleichmäßigen Verteilung gezogen. Hierfür wird die Funktion verwendetuniform().
mx.nd.random.uniform(0, 1)
Output
Die Ausgabe wird unten erwähnt -
[0.12381998]
<NDArray 1 @cpu(0)>
Example
mx.nd.random.uniform(-1, 1, shape=(2,))
Output
Die Ausgabe ist unten angegeben -
[0.558102 0.69601643]
<NDArray 2 @cpu(0)>
Example
low = mx.nd.array([1,2,3])
high = mx.nd.array([2,3,4])
mx.nd.random.uniform(low, high, shape=2)
Output
Sie sehen die folgende Ausgabe -
[[1.8649333 1.8073189]
[2.4113967 2.5691009]
[3.1399727 3.4071832]]
<NDArray 3x2 @cpu(0)>
Im folgenden Beispiel werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gezogen. Dafür werden wir die Funktion verwendengeneralized_negative_binomial().
mx.nd.random.generalized_negative_binomial(10, 0.5)
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[1.]
<NDArray 1 @cpu(0)>
Example
mx.nd.random.generalized_negative_binomial(10, 0.5, shape=(2,))
Output
Die Ausgabe wird hiermit gegeben -
[16. 23.]
<NDArray 2 @cpu(0)>
Example
mu = mx.nd.array([1,2,3])
alpha = mx.nd.array([0.2,0.4,0.6])
mx.nd.random.generalized_negative_binomial(mu, alpha, shape=2)
Output
Unten ist die Ausgabe des Codes angegeben -
[[0. 0.]
[4. 1.]
[9. 3.]]
<NDArray 3x2 @cpu(0)>
ndarray.utils
Das Dienstprogramm NDArray API ist im Paket ndarray.utils definiert. Wie der Name schon sagt, bietet es die Dienstprogrammfunktionen für NDArray und BaseSparseNDArray.
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.ndarray.utils API - -
Funktion und ihre Parameter | Definition |
---|---|
Nullen (Form [, ctx, dtype, stype]) | Diese Funktion gibt ein neues Array mit einer bestimmten Form und einem bestimmten Typ zurück, das mit Nullen gefüllt ist. |
leer (Form [, ctx, dtype, stype]) | Es wird ein neues Array mit der angegebenen Form und dem angegebenen Typ zurückgegeben, ohne dass Einträge initialisiert werden müssen. |
Array (source_array [, ctx, dtype]) | Wie der Name schon sagt, erstellt diese Funktion ein Array aus jedem Objekt, das die Array-Schnittstelle verfügbar macht. |
Laden (fname) | Es wird ein Array aus einer Datei geladen. |
load_frombuffer (buf) | Wie der Name schon sagt, lädt diese Funktion ein Array-Wörterbuch oder eine Liste aus einem Puffer |
speichern (fname, Daten) | Diese Funktion speichert eine Liste von Arrays oder ein Diktat von str-> array in einer Datei. |
Implementierungsbeispiele
Im folgenden Beispiel geben wir ein neues Array mit einer bestimmten Form und einem bestimmten Typ zurück, das mit Nullen gefüllt ist. Dafür werden wir die Funktion verwendenzeros().
mx.nd.zeros((1,2), mx.cpu(), stype='csr')
Output
Dies erzeugt die folgende Ausgabe -
<CSRNDArray 1x2 @cpu(0)>
Example
mx.nd.zeros((1,2), mx.cpu(), 'float16', stype='row_sparse').asnumpy()
Output
Sie erhalten folgende Ausgabe:
array([[0., 0.]], dtype=float16)
Im folgenden Beispiel speichern wir eine Liste von Arrays und ein Wörterbuch von Zeichenfolgen. Dafür werden wir die Funktion verwendensave().
Example
x = mx.nd.zeros((2,3))
y = mx.nd.ones((1,4))
mx.nd.save('list', [x,y])
mx.nd.save('dict', {'x':x, 'y':y})
mx.nd.load('list')
Output
Bei der Ausführung erhalten Sie folgende Ausgabe:
[
[[0. 0. 0.]
[0. 0. 0.]]
<NDArray 2x3 @cpu(0)>,
[[1. 1. 1. 1.]]
<NDArray 1x4 @cpu(0)>]
Example
mx.nd.load('my_dict')
Output
Die Ausgabe wird unten gezeigt -
{'x':
[[0. 0. 0.]
[0. 0. 0.]]
<NDArray 2x3 @cpu(0)>, 'y':
[[1. 1. 1. 1.]]
<NDArray 1x4 @cpu(0)>}
Wie wir bereits in früheren Kapiteln besprochen haben, bietet MXNet Gluon eine klare, präzise und einfache API für DL-Projekte. Es ermöglicht Apache MXNet, DL-Modelle zu prototypisieren, zu bauen und zu trainieren, ohne die Trainingsgeschwindigkeit zu beeinträchtigen.
Kern Module
Lassen Sie uns die Kernmodule von Apache MXNet Python API (Application Programming Interface) lernen.
gluon.nn
Gluon bietet eine große Anzahl integrierter NN-Schichten im Modul gluon.nn. Aus diesem Grund wird es als Kernmodul bezeichnet.
Methoden und ihre Parameter
Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.nn Kernmodul -
Methoden und ihre Parameter | Definition |
---|---|
Aktivierung (Aktivierung, ** kwargs) | Wie der Name schon sagt, wendet diese Methode eine Aktivierungsfunktion auf die Eingabe an. |
AvgPool1D ([pool_size, Schritte, Polsterung,…]) | Dies ist eine durchschnittliche Pooling-Operation für zeitliche Daten. |
AvgPool2D ([pool_size, strides, padding,…]) | Dies ist eine durchschnittliche Pooloperation für räumliche Daten. |
AvgPool3D ([pool_size, Schritte, Polsterung,…]) | Dies ist die durchschnittliche Pooloperation für 3D-Daten. Die Daten können räumlich oder räumlich-zeitlich sein. |
BatchNorm ([Achse, Impuls, Epsilon, Mitte,…]) | Es repräsentiert die Chargennormalisierungsschicht. |
BatchNormReLU ([Achse, Impuls, Epsilon,…]) | Es stellt auch die Batch-Normalisierungsschicht dar, jedoch mit Relu-Aktivierungsfunktion. |
Block ([Präfix, Parameter]) | Es gibt die Basisklasse für alle neuronalen Netzwerkschichten und -modelle an. |
Conv1D (Kanäle, kernel_size [, Schritte,…]) | Dieses Verfahren wird für die 1-D-Faltungsschicht verwendet. Zum Beispiel zeitliche Faltung. |
Conv1DTranspose (Kanäle, kernel_size [,…]) | Dieses Verfahren wird für die transponierte 1D-Faltungsschicht verwendet. |
Conv2D (Kanäle, kernel_size [, Schritte,…]) | Diese Methode wird für die 2D-Faltungsschicht verwendet. Zum Beispiel räumliche Faltung über Bildern). |
Conv2DTranspose (Kanäle, kernel_size [,…]) | Diese Methode wird für die transponierte 2D-Faltungsschicht verwendet. |
Conv3D (Kanäle, kernel_size [, Schritte,…]) | Diese Methode wird für die 3D-Faltungsschicht verwendet. Zum Beispiel räumliche Faltung über Volumina. |
Conv3DTranspose (Kanäle, kernel_size [,…]) | Diese Methode wird für die transponierte 3D-Faltungsschicht verwendet. |
Dicht (Einheiten [, Aktivierung, use_bias,…]) | Diese Methode steht für Ihre reguläre dicht verbundene NN-Schicht. |
Ausfall (Rate [, Achsen]) | Wie der Name schon sagt, wendet die Methode Dropout auf die Eingabe an. |
ELU (& agr;) | Diese Methode wird für die Exponential Linear Unit (ELU) verwendet. |
Einbetten (input_dim, output_dim [, dtype,…]) | Nicht negative ganze Zahlen werden in dichte Vektoren fester Größe umgewandelt. |
Abflachen (** kwargs) | Diese Methode glättet die Eingabe auf 2-D. |
GELU (** kwargs) | Diese Methode wird für die Gaußsche Exponential Linear Unit (GELU) verwendet. |
GlobalAvgPool1D ([Layout]) | Mit Hilfe dieser Methode können wir globale durchschnittliche Pooling-Operationen für zeitliche Daten durchführen. |
GlobalAvgPool2D ([Layout]) | Mit Hilfe dieser Methode können wir globale durchschnittliche Pooling-Operationen für räumliche Daten durchführen. |
GlobalAvgPool3D ([Layout]) | Mit Hilfe dieser Methode können wir globale durchschnittliche Pooling-Operationen für 3D-Daten durchführen. |
GlobalMaxPool1D ([Layout]) | Mit Hilfe dieser Methode können wir globale Max-Pooling-Operationen für 1-D-Daten durchführen. |
GlobalMaxPool2D ([Layout]) | Mit Hilfe dieser Methode können wir globale Max-Pooling-Operationen für 2D-Daten durchführen. |
GlobalMaxPool3D ([Layout]) | Mit Hilfe dieser Methode können wir globale Max-Pooling-Operationen für 3D-Daten durchführen. |
GroupNorm ([num_groups, epsilon, center,…]) | Diese Methode wendet die Gruppennormalisierung auf das nD-Eingabearray an. |
HybridBlock ([Präfix, Parameter]) | Diese Methode unterstützt die Weiterleitung mit beiden Symbol und NDArray. |
HybridLambda(Funktion [, Präfix]) | Mit Hilfe dieser Methode können wir einen Operator oder einen Ausdruck als HybridBlock-Objekt umschließen. |
HybridSequential ([Präfix, Parameter]) | Es stapelt HybridBlocks nacheinander. |
InstanceNorm ([Achse, Epsilon, Mitte, Skala,…]) | Diese Methode wendet die Instanznormalisierung auf das nD-Eingabearray an. |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir Block (), das die Basisklasse für alle neuronalen Netzwerkschichten und -modelle angibt.
from mxnet.gluon import Block, nn
class Model(Block):
def __init__(self, **kwargs):
super(Model, self).__init__(**kwargs)
# use name_scope to give child Blocks appropriate names.
with self.name_scope():
self.dense0 = nn.Dense(20)
self.dense1 = nn.Dense(20)
def forward(self, x):
x = mx.nd.relu(self.dense0(x))
return mx.nd.relu(self.dense1(x))
model = Model()
model.initialize(ctx=mx.cpu(0))
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))
Output
Sie sehen die folgende Ausgabe -
[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)*gt;
Im folgenden Beispiel verwenden wir HybridBlock (), das die Weiterleitung sowohl mit Symbol als auch mit NDArray unterstützt.
import mxnet as mx
from mxnet.gluon import HybridBlock, nn
class Model(HybridBlock):
def __init__(self, **kwargs):
super(Model, self).__init__(**kwargs)
# use name_scope to give child Blocks appropriate names.
with self.name_scope():
self.dense0 = nn.Dense(20)
self.dense1 = nn.Dense(20)
def forward(self, x):
x = nd.relu(self.dense0(x))
return nd.relu(self.dense1(x))
model = Model()
model.initialize(ctx=mx.cpu(0))
model.hybridize()
model(mx.nd.zeros((5, 5), ctx=mx.cpu(0)))
Output
Die Ausgabe wird unten erwähnt -
[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]
<NDArray 5x20 @cpu(0)>
gluon.rnn
Gluon bietet eine große Anzahl von Einbauten recurrent neural network(RNN) Ebenen im Modul gluon.rnn. Aus diesem Grund wird es als Kernmodul bezeichnet.
Methoden und ihre Parameter
Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.nn Kern Modul:
Methoden und ihre Parameter | Definition |
---|---|
Bidirektionale Zelle (l_cell, r_cell [,…]) | Es wird für RNN-Zellen (Bidirectional Recurrent Neural Network) verwendet. |
DropoutCell (Rate [, Achsen, Präfix, Parameter]) | Diese Methode wendet Dropout auf die angegebene Eingabe an. |
GRU (hidden_size [, num_layers, layout,…]) | Es wendet eine RNU (Multi-Layer Gated Recurrent Unit) auf eine bestimmte Eingabesequenz an. |
GRUCell (hidden_size [,…]) | Es wird für die GRU-Netzwerkzelle (Gated Rectified Unit) verwendet. |
HybridRecurrentCell ([Präfix, Parameter]) | Diese Methode unterstützt das Hybridisieren. |
HybridSequentialRNNCell ([Präfix, Parameter]) | Mit Hilfe dieser Methode können wir mehrere HybridRNN-Zellen nacheinander stapeln. |
LSTM (hidden_size [, num_layers, layout,…]) 0 | Es wendet ein mehrschichtiges Langzeit-Kurzzeitgedächtnis (LSTM) RNN auf eine gegebene Eingabesequenz an. |
LSTMCell (hidden_size [,…]) | Es wird für LSTM-Netzwerkzellen (Long-Short Term Memory) verwendet. |
ModifierCell (base_cell) | Dies ist die Basisklasse für Modifikatorzellen. |
RNN (hidden_size [, num_layers, Aktivierung,…]) | Es wird ein mehrschichtiges Elman RNN mit angewendet tanh oder ReLU Nichtlinearität zu einer gegebenen Eingabesequenz. |
RNNCell (hidden_size [, Aktivierung,…]) | Es wird für wiederkehrende neuronale Netzwerkzellen von Elman RNN verwendet. |
RecurrentCell ([Präfix, Parameter]) | Es repräsentiert die abstrakte Basisklasse für RNN-Zellen. |
SequentialRNNCell ([Präfix, Parameter]) | Mit Hilfe dieser Methode können wir mehrere RNN-Zellen nacheinander stapeln. |
ZoneoutCell (base_cell [, zoneout_outputs,…]) | Diese Methode wendet Zoneout auf die Basiszelle an. |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir GRU (), das eine mehrschichtige RNU (Gated Recurrent Unit) auf eine bestimmte Eingabesequenz anwendet.
layer = mx.gluon.rnn.GRU(100, 3)
layer.initialize()
input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq, h0)
out_seq
Output
Dies erzeugt die folgende Ausgabe -
[[[ 1.50152072e-01 5.19012511e-01 1.02390535e-01 ... 4.35803324e-01
1.30406499e-01 3.30152437e-02]
[ 2.91542172e-01 1.02243155e-01 1.73325196e-01 ... 5.65296151e-02
1.76546033e-02 1.66693389e-01]
[ 2.22257316e-01 3.76294643e-01 2.11277917e-01 ... 2.28903517e-01
3.43954474e-01 1.52770668e-01]]
[[ 1.40634328e-01 2.93247789e-01 5.50393537e-02 ... 2.30207980e-01
6.61415309e-02 2.70989928e-02]
[ 1.11081995e-01 7.20834285e-02 1.08342394e-01 ... 2.28330195e-02
6.79589901e-03 1.25501186e-01]
[ 1.15944080e-01 2.41565228e-01 1.18612610e-01 ... 1.14908054e-01
1.61080107e-01 1.15969211e-01]]
………………………….
Example
hn
Output
Dies erzeugt die folgende Ausgabe -
[[[-6.08105101e-02 3.86217088e-02 6.64453954e-03 8.18805695e-02
3.85607071e-02 -1.36945639e-02 7.45836645e-03 -5.46515081e-03
9.49622393e-02 6.39371723e-02 -6.37890724e-03 3.82240303e-02
9.11015049e-02 -2.01375950e-02 -7.29381144e-02 6.93765879e-02
2.71829776e-02 -6.64435029e-02 -8.45306814e-02 -1.03075653e-01
6.72040805e-02 -7.06537142e-02 -3.93818803e-02 5.16211614e-03
-4.79770005e-02 1.10734522e-01 1.56721435e-02 -6.93409378e-03
1.16915874e-01 -7.95962065e-02 -3.06530762e-02 8.42394680e-02
7.60370195e-02 2.17055440e-01 9.85361822e-03 1.16660878e-01
4.08297703e-02 1.24978097e-02 8.25245082e-02 2.28673983e-02
-7.88266212e-02 -8.04114193e-02 9.28791538e-02 -5.70827350e-03
-4.46166918e-02 -6.41122833e-02 1.80885363e-02 -2.37745279e-03
4.37298454e-02 1.28888980e-01 -3.07202265e-02 2.50503756e-02
4.00907174e-02 3.37077095e-03 -1.78839862e-02 8.90695080e-02
6.30150884e-02 1.11416787e-01 2.12221760e-02 -1.13236710e-01
5.39616570e-02 7.80710578e-02 -2.28817668e-02 1.92073174e-02
………………………….
Im folgenden Beispiel verwenden wir LSTM (), das eine LSTM-RNN (Long-Short Term Memory) auf eine bestimmte Eingabesequenz anwendet.
layer = mx.gluon.rnn.LSTM(100, 3)
layer.initialize()
input_seq = mx.nd.random.uniform(shape=(5, 3, 10))
out_seq = layer(input_seq)
h0 = mx.nd.random.uniform(shape=(3, 3, 100))
c0 = mx.nd.random.uniform(shape=(3, 3, 100))
out_seq, hn = layer(input_seq,[h0,c0])
out_seq
Output
Die Ausgabe wird unten erwähnt -
[[[ 9.00025964e-02 3.96071747e-02 1.83841765e-01 ... 3.95872220e-02
1.25569820e-01 2.15555862e-01]
[ 1.55962542e-01 -3.10300849e-02 1.76772922e-01 ... 1.92474753e-01
2.30574399e-01 2.81707942e-02]
[ 7.83204585e-02 6.53361529e-03 1.27262697e-01 ... 9.97719541e-02
1.28254429e-01 7.55299702e-02]]
[[ 4.41036932e-02 1.35250352e-02 9.87644792e-02 ... 5.89378644e-03
5.23949116e-02 1.00922674e-01]
[ 8.59075040e-02 -1.67027581e-02 9.69351009e-02 ... 1.17763653e-01
9.71239135e-02 2.25218050e-02]
[ 4.34580036e-02 7.62207608e-04 6.37005866e-02 ... 6.14888743e-02
5.96345589e-02 4.72368896e-02]]
……………
Example
hn
Output
Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:
[
[[[ 2.21408084e-02 1.42750628e-02 9.53067932e-03 -1.22849066e-02
1.78788435e-02 5.99269159e-02 5.65306023e-02 6.42553642e-02
6.56616641e-03 9.80876666e-03 -1.15729487e-02 5.98640442e-02
-7.21173314e-03 -2.78371759e-02 -1.90690923e-02 2.21447181e-02
8.38765781e-03 -1.38521893e-02 -9.06938594e-03 1.21346042e-02
6.06449470e-02 -3.77471633e-02 5.65885007e-02 6.63008019e-02
-7.34188128e-03 6.46054149e-02 3.19911093e-02 4.11194898e-02
4.43960279e-02 4.92892228e-02 1.74766723e-02 3.40303481e-02
-5.23341820e-03 2.68163737e-02 -9.43402853e-03 -4.11836170e-02
1.55221792e-02 -5.05655073e-02 4.24557598e-03 -3.40388380e-02
……………………
Trainingsmodule
Die Schulungsmodule in Gluon sind wie folgt:
gluon.loss
Im mxnet.gluon.lossModul bietet Gluon vordefinierte Verlustfunktion. Grundsätzlich hat es die Verluste für das Training des neuronalen Netzes. Aus diesem Grund wird es als Trainingsmodul bezeichnet.
Methoden und ihre Parameter
Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.loss Trainingsmodul:
Methoden und ihre Parameter | Definition |
---|---|
Verlust (Gewicht, Batch-Achse, ** kwargs) | Dies fungiert als Basisklasse für Verluste. |
L2Loss ([weight, batch_axis]) | Es berechnet den mittleren quadratischen Fehler (MSE) zwischen label und prediction(pred). |
L1Loss ([weight, batch_axis]) | Es berechnet den mittleren absoluten Fehler (MAE) zwischen label und pred. |
SigmoidBinaryCrossEntropyLoss ([…]) | Diese Methode wird für den Kreuzentropieverlust für die binäre Klassifizierung verwendet. |
SigmoidBCELoss | Diese Methode wird für den Kreuzentropieverlust für die binäre Klassifizierung verwendet. |
SoftmaxCrossEntropyLoss ([Achse,…]) | Es berechnet den Softmax-Kreuzentropieverlust (CEL). |
SoftmaxCELoss | Es berechnet auch den Softmax-Kreuzentropieverlust. |
KLDivLoss ([from_logits, Achse, Gewicht,…]) | Es wird für den Kullback-Leibler-Divergenzverlust verwendet. |
CTCLoss ([layout, label_layout, weight]) | Es wird für TCL (Connectionist Temporal Classification Loss) verwendet. |
HuberLoss ([rho, weight, batch_axis]) | Es berechnet den geglätteten L1-Verlust. Der geglättete L1-Verlust ist gleich dem L1-Verlust, wenn der absolute Fehler Rho überschreitet, ist aber ansonsten gleich dem L2-Verlust. |
HingeLoss ([Rand, Gewicht, Batch-Achse]) | Diese Methode berechnet die in SVMs häufig verwendete Scharnierverlustfunktion: |
SquaredHingeLoss ([Rand, Gewicht, Batch-Achse]) | Diese Methode berechnet die in SVMs verwendete Soft-Margin-Loss-Funktion: |
LogisticLoss ([weight, batch_axis, label_format]) | Diese Methode berechnet den Logistikverlust. |
TripletLoss ([Rand, Gewicht, Batch-Achse]) | Diese Methode berechnet den Triplettverlust bei drei Eingangstensoren und einer positiven Marge. |
PoissonNLLLoss ([weight, from_logits,…]) | Die Funktion berechnet den Verlust der negativen Protokollwahrscheinlichkeit. |
CosineEmbeddingLoss ([weight, batch_axis, margin]) | Die Funktion berechnet den Kosinusabstand zwischen den Vektoren. |
SDMLLoss ([Glättungsparameter, Gewicht,…]) | Diese Methode berechnet den SDML-Verlust (Batchwise Smoothed Deep Metric Learning) bei zwei Eingangstensoren und einem SDM-Verlust bei Glättungsgewicht. Es lernt die Ähnlichkeit zwischen gepaarten Proben, indem ungepaarte Proben im Minibatch als mögliche negative Beispiele verwendet werden. |
Beispiel
Wie wir das wissen mxnet.gluon.loss.lossberechnet die MSE (Mean Squared Error) zwischen Label und Vorhersage (pred). Dies geschieht mit Hilfe der folgenden Formel:
gluon.parameter
mxnet.gluon.parameter ist ein Container, der die Parameter enthält, dh die Gewichte der Blöcke.
Methoden und ihre Parameter
Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.parameter Schulungsmodul -
Methoden und ihre Parameter | Definition |
---|---|
Besetzung (dtype) | Diese Methode wandelt Daten und den Verlauf dieses Parameters in einen neuen Datentyp um. |
Daten ([ctx]) | Diese Methode gibt eine Kopie dieses Parameters in einem Kontext zurück. |
grad ([ctx]) | Diese Methode gibt einen Gradientenpuffer für diesen Parameter in einem Kontext zurück. |
initialisieren ([init, ctx, default_init,…]) | Diese Methode initialisiert Parameter- und Gradientenarrays. |
list_ctx () | Diese Methode gibt eine Liste der Kontexte zurück, in denen dieser Parameter initialisiert wird. |
list_data () | Diese Methode gibt Kopien dieses Parameters in allen Kontexten zurück. Dies erfolgt in derselben Reihenfolge wie die Erstellung. |
list_grad () | Diese Methode gibt Gradientenpuffer in allen Kontexten zurück. Dies erfolgt in der gleichen Reihenfolge wievalues(). |
list_row_sparse_data (row_id) | Diese Methode gibt in allen Kontexten Kopien des Parameters 'row_sparse' zurück. Dies erfolgt in derselben Reihenfolge wie die Erstellung. |
reset_ctx (ctx) | Diese Methode weist Parameter anderen Kontexten neu zu. |
row_sparse_data (row_id) | Diese Methode gibt eine Kopie des Parameters 'row_sparse' im selben Kontext wie row_id zurück. |
set_data (Daten) | Diese Methode legt den Wert dieses Parameters in allen Kontexten fest. |
var () | Diese Methode gibt ein Symbol zurück, das diesen Parameter darstellt. |
zero_grad () | Diese Methode setzt den Gradientenpuffer in allen Kontexten auf 0. |
Implementierungsbeispiel
Im folgenden Beispiel werden die Parameter und die Gradientenarrays mithilfe der Methode initialize () wie folgt initialisiert:
weight = mx.gluon.Parameter('weight', shape=(2, 2))
weight.initialize(ctx=mx.cpu(0))
weight.data()
Output
Die Ausgabe wird unten erwähnt -
[[-0.0256899 0.06511251]
[-0.00243821 -0.00123186]]
<NDArray 2x2 @cpu(0)>
Example
weight.grad()
Output
Die Ausgabe ist unten angegeben -
[[0. 0.]
[0. 0.]]
<NDArray 2x2 @cpu(0)>
Example
weight.initialize(ctx=[mx.gpu(0), mx.gpu(1)])
weight.data(mx.gpu(0))
Output
Sie sehen die folgende Ausgabe -
[[-0.00873779 -0.02834515]
[ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(0)>
Example
weight.data(mx.gpu(1))
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[[-0.00873779 -0.02834515]
[ 0.05484822 -0.06206018]]
<NDArray 2x2 @gpu(1)>
gluon.trainer
mxnet.gluon.trainer wendet einen Optimierer auf eine Reihe von Parametern an. Es sollte zusammen mit Autograd verwendet werden.
Methoden und ihre Parameter
Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die von behandelt werden mxnet.gluon.trainer Schulungsmodul -
Methoden und ihre Parameter | Definition |
---|---|
allreduce_grads () | Diese Methode reduziert die Gradienten aus verschiedenen Kontexten für jeden Parameter (Gewicht). |
load_states (fname) | Wie der Name schon sagt, lädt diese Methode Trainerzustände. |
save_states (fname) | Wie der Name schon sagt, werden mit dieser Methode Trainerzustände gespeichert. |
set_learning_rate (lr) | Diese Methode legt eine neue Lernrate des Optimierers fest. |
Schritt (batch_size [, ignore_stale_grad]) | Diese Methode führt einen Schritt der Parameteraktualisierung durch. Es sollte danach aufgerufen werdenautograd.backward() und außerhalb von record() Umfang. |
update (batch_size [, ignore_stale_grad]) | Diese Methode führt auch einen Schritt der Parameteraktualisierung durch. Es sollte danach aufgerufen werdenautograd.backward() und außerhalb von record() Umfang und nach Trainer.update (). |
Datenmodule
Die Datenmodule von Gluon werden nachfolgend erläutert -
gluon.data
Gluon bietet eine große Anzahl integrierter Dataset-Dienstprogramme im Modul gluon.data. Aus diesem Grund wird es als Datenmodul bezeichnet.
Klassen und ihre Parameter
Im Folgenden finden Sie einige wichtige Methoden und deren Parameter, die vom Kernmodul mxnet.gluon.data abgedeckt werden. Diese Methoden beziehen sich normalerweise auf Datasets, Sampling und DataLoader.
DatensatzMethoden und ihre Parameter | Definition |
---|---|
ArrayDataset (* args) | Diese Methode stellt einen Datensatz dar, der zwei oder mehr als zwei Datensatz-ähnliche Objekte kombiniert. Zum Beispiel Datensätze, Listen, Arrays usw. |
BatchSampler (Sampler, batch_size [, last_batch]) | Diese Methode umschließt eine andere Sampler. Nach dem Verpacken werden die Mini-Probenstapel zurückgegeben. |
DataLoader (Datensatz [, batch_size, shuffle,…]) | Ähnlich wie BatchSampler, aber diese Methode lädt Daten aus einem Dataset. Nach dem Laden werden die Mini-Datenstapel zurückgegeben. |
Dies repräsentiert die abstrakte Datensatzklasse. | |
FilterSampler (fn, Datensatz) | Diese Methode repräsentiert die Beispielelemente aus einem Datensatz, für den fn (Funktion) zurückgibt True. |
RandomSampler (Länge) | Diese Methode repräsentiert Stichprobenelemente aus [0, Länge) zufällig ohne Ersatz. |
RecordFileDataset (Dateiname) | Es stellt einen Datensatz dar, der eine RecordIO-Datei umschließt. Die Erweiterung der Datei lautet.rec. |
Sampler | Dies ist die Basisklasse für Sampler. |
SequentialSampler (Länge [, Start]) | Es repräsentiert die Beispielelemente aus der Menge [Start, Start + Länge] nacheinander. |
Es repräsentiert die Beispielelemente aus der Menge [Start, Start + Länge] nacheinander. | Dies ist der einfache Dataset-Wrapper, insbesondere für Listen und Arrays. |
Implementierungsbeispiele
Im folgenden Beispiel werden wir verwenden gluon.data.BatchSampler()API, die einen anderen Sampler umschließt. Es werden die Mini-Probenstapel zurückgegeben.
import mxnet as mx
from mxnet.gluon import data
sampler = mx.gluon.data.SequentialSampler(15)
batch_sampler = mx.gluon.data.BatchSampler(sampler, 4, 'keep')
list(batch_sampler)
Output
Die Ausgabe wird unten erwähnt -
[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11], [12, 13, 14]]
gluon.data.vision.datasets
Gluon bietet eine große Anzahl vordefinierter Funktionen für Vision-Datensätze in gluon.data.vision.datasets Modul.
Klassen und ihre Parameter
MXNet bietet uns nützliche und wichtige Datensätze, deren Klassen und Parameter unten angegeben sind -
Klassen und ihre Parameter | Definition |
---|---|
MNIST ([Wurzel, Zug, Transformation]) | Dies ist ein nützlicher Datensatz, der uns die handschriftlichen Ziffern liefert. Die URL für den MNIST-Datensatz lautet http://yann.lecun.com/exdb/mnist |
FashionMNIST ([Wurzel, Zug, Transformation]) | Dieser Datensatz besteht aus Zalandos Artikelbildern, die aus Modeprodukten bestehen. Es ist ein Drop-In-Ersatz für den ursprünglichen MNIST-Datensatz. Sie können diesen Datensatz unter https://github.com/zalandoresearch/fashion-mnist abrufen |
CIFAR10 ([root, train, transform]] | Dies ist ein Bildklassifizierungsdatensatz von https://www.cs.toronto.edu/~kriz/cifar.html. In diesem Datensatz ist jede Probe ein Bild mit Form (32, 32, 3). |
CIFAR100 ([root, fine_label, train, transform]) | Dies ist der CIFAR100-Bildklassifizierungsdatensatz von https://www.cs.toronto.edu/~kriz/cifar.html. Es hat auch jede Probe ist ein Bild mit Form (32, 32, 3). |
ImageRecordDataset (Dateiname [, Flag, Transformation]) | Dieser Datensatz umhüllt eine RecordIO-Datei, die Bilder enthält. In diesem Beispiel ist jedes Beispiel ein Bild mit der entsprechenden Beschriftung. |
ImageFolderDataset (root [, flag, transform]) | Dies ist ein Datensatz zum Laden von Bilddateien, die in einer Ordnerstruktur gespeichert sind. |
ImageListDataset ([root, imglist, flag]) | Dies ist ein Datensatz zum Laden von Bilddateien, die durch eine Liste von Einträgen angegeben werden. |
Beispiel
Im folgenden Beispiel zeigen wir die Verwendung von ImageListDataset (), das zum Laden von Bilddateien verwendet wird, die durch eine Liste von Einträgen angegeben werden.
# written to text file *.lst
0 0 root/cat/0001.jpg
1 0 root/cat/xxxa.jpg
2 0 root/cat/yyyb.jpg
3 1 root/dog/123.jpg
4 1 root/dog/023.jpg
5 1 root/dog/wwww.jpg
# A pure list, each item is a list [imagelabel: float or list of float, imgpath]
[[0, root/cat/0001.jpg]
[0, root/cat/xxxa.jpg]
[0, root/cat/yyyb.jpg]
[1, root/dog/123.jpg]
[1, root/dog/023.jpg]
[1, root/dog/wwww.jpg]]
Utility-Module
Die Utility-Module in Gluon sind wie folgt:
gluon.utils
Gluon bietet eine große Anzahl von integrierten Optimierungsprogrammen für Parallelisierungsdienstprogramme im Modul gluon.utils. Es bietet eine Vielzahl von Dienstprogrammen für die Schulung. Aus diesem Grund wird es als Utility-Modul bezeichnet.
Funktionen und ihre Parameter
Im Folgenden sind die Funktionen und deren Parameter aufgeführt, die in diesem Dienstprogrammmodul mit dem Namen enthalten sind gluon.utils −
Funktionen und ihre Parameter | Definition |
---|---|
split_data (data, num_slice [, batch_axis,…]) | Diese Funktion wird normalerweise für die Datenparallelität verwendet und jedes Slice wird an ein Gerät, dh eine GPU, gesendet. Es teilt ein NDArray innum_slice Scheiben entlang batch_axis. |
split_and_load (Daten, ctx_list [, batch_axis,…]) | Diese Funktion teilt ein NDArray in auf len(ctx_list) Scheiben entlang batch_axis. Der einzige Unterschied zur obigen Funktion split_data () besteht darin, dass jedes Slice in einen Kontext in geladen wird ctx_list. |
clip_global_norm (Arrays, max_norm [,…]) | Die Aufgabe dieser Funktion ist es, NDArrays so neu zu skalieren, dass die Summe ihrer 2-Norm kleiner als ist max_norm. |
check_sha1 (Dateiname, sha1_hash) | Diese Funktion prüft, ob der sha1-Hash des Dateiinhalts mit dem erwarteten Hash übereinstimmt oder nicht. |
Download (URL [, Pfad, Überschreiben, sha1_hash,…]) | Wie der Name schon sagt, lädt diese Funktion eine bestimmte URL herunter. |
replace_file (src, dst) | Diese Funktion implementiert Atomic os.replace. Es wird mit Linux und OSX durchgeführt. |
Dieses Kapitel befasst sich mit der Autograd- und Initialisierungs-API in MXNet.
mxnet.autograd
Dies ist die Autograd-API von MXNet für NDArray. Es hat die folgende Klasse -
Klasse: Funktion ()
Es wird zur kundenspezifischen Differenzierung im Autograd verwendet. Es kann geschrieben werden alsmxnet.autograd.Function. Wenn der Benutzer aus irgendeinem Grund die Gradienten nicht verwenden möchte, die durch die Standardkettenregel berechnet werden, kann er die Funktionsklasse von mxnet.autograd verwenden, um die Differenzierung für die Berechnung anzupassen. Es gibt zwei Methoden, nämlich Forward () und Backward ().
Lassen Sie uns die Arbeitsweise dieser Klasse anhand der folgenden Punkte verstehen:
Zuerst müssen wir unsere Berechnung in der Vorwärtsmethode definieren.
Dann müssen wir die angepasste Differenzierung in der Rückwärtsmethode bereitstellen.
Während der Gradientenberechnung verwendet mxnet.autograd anstelle der benutzerdefinierten Rückwärtsfunktion die vom Benutzer definierte Rückwärtsfunktion. Wir können für einige Operationen sowohl vorwärts als auch rückwärts in numpy array und back umwandeln.
Example
Bevor Sie die Klasse mxnet.autograd.function verwenden, definieren wir eine stabile Sigmoidfunktion mit Rückwärts- und Vorwärtsmethoden wie folgt:
class sigmoid(mx.autograd.Function):
def forward(self, x):
y = 1 / (1 + mx.nd.exp(-x))
self.save_for_backward(y)
return y
def backward(self, dy):
y, = self.saved_tensors
return dy * y * (1-y)
Jetzt kann die Funktionsklasse wie folgt verwendet werden:
func = sigmoid()
x = mx.nd.random.uniform(shape=(10,))
x.attach_grad()
with mx.autograd.record():
m = func(x)
m.backward()
dx_grad = x.grad.asnumpy()
dx_grad
Output
Wenn Sie den Code ausführen, wird die folgende Ausgabe angezeigt:
array([0.21458015, 0.21291625, 0.23330082, 0.2361367 , 0.23086983,
0.24060014, 0.20326573, 0.21093895, 0.24968489, 0.24301809],
dtype=float32)
Methoden und ihre Parameter
Im Folgenden sind die Methoden und ihre Parameter der Klasse mxnet.autogard.function aufgeführt:
Methoden und ihre Parameter | Definition |
---|---|
vorwärts (Köpfe [, head_grads, Retain_graph,…]) | Diese Methode wird für die Vorwärtsberechnung verwendet. |
rückwärts (Köpfe [, head_grads, Retain_graph,…]) | Diese Methode wird für die Rückwärtsberechnung verwendet. Es berechnet die Gradienten von Köpfen in Bezug auf zuvor markierte Variablen. Diese Methode verwendet so viele Eingaben wie die Vorwärtsausgabe. Es werden auch so viele NDArrays wie Forward-Eingaben zurückgegeben. |
get_symbol (x) | Diese Methode wird verwendet, um den aufgezeichneten Berechnungsverlauf als abzurufen Symbol. |
grad (Köpfe, Variablen [, head_grads,…]) | Diese Methode berechnet die Gradienten von Köpfen in Bezug auf Variablen. Nach der Berechnung werden Gradienten als neue NDArrays zurückgegeben, anstatt sie in variable.grad zu speichern. |
is_recording () | Mit Hilfe dieser Methode können wir den Status der Aufnahme und nicht der Aufnahme abrufen. |
is_training () | Mit Hilfe dieser Methode können wir den Status von Training und Vorhersage erhalten. |
mark_variables (Variablen, Gradienten [, grad_reqs]) | Diese Methode markiert NDArrays als Variablen, um den Gradienten für die Autogradierung zu berechnen. Diese Methode ist identisch mit der Funktion .attach_grad () in einer Variablen, aber der einzige Unterschied besteht darin, dass wir mit diesem Aufruf den Gradienten auf einen beliebigen Wert setzen können. |
Pause ([train_mode]) | Diese Methode gibt einen Bereichskontext zurück, der in der Anweisung 'with' für Codes verwendet werden soll, für die keine Gradienten berechnet werden müssen. |
Predict_Mode () | Diese Methode gibt einen Bereichskontext zurück, der in der Anweisung 'with' verwendet werden soll, in der das Vorwärtsdurchlaufverhalten auf den Inferenzmodus eingestellt ist, ohne die Aufzeichnungsstatus zu ändern. |
record ([train_mode]) | Es wird ein zurückgegeben autograd Aufzeichnungsbereichskontext, der in der Anweisung 'with' verwendet werden soll, und Erfassung von Code, für den Gradienten berechnet werden müssen. |
set_recording (is_recording) | Ähnlich wie bei is_recoring () können wir mit Hilfe dieser Methode den Status beim Aufzeichnen und nicht beim Aufzeichnen abrufen. |
set_training (is_training) | Ähnlich wie bei is_traininig () können wir mit Hilfe dieser Methode den Status auf Training oder Vorhersage setzen. |
train_mode () | Diese Methode gibt einen Bereichskontext zurück, der in der Anweisung 'with' verwendet werden soll, in der das Vorwärtsdurchlaufverhalten auf den Trainingsmodus eingestellt ist, ohne die Aufzeichnungsstatus zu ändern. |
Implementierungsbeispiel
Im folgenden Beispiel verwenden wir die Methode mxnet.autograd.grad (), um den Gradienten des Kopfes in Bezug auf Variablen zu berechnen.
x = mx.nd.ones((2,))
x.attach_grad()
with mx.autograd.record():
z = mx.nd.elemwise_add(mx.nd.exp(x), x)
dx_grad = mx.autograd.grad(z, [x], create_graph=True)
dx_grad
Output
Die Ausgabe wird unten erwähnt -
[
[3.7182817 3.7182817]
<NDArray 2 @cpu(0)>]
Wir können die Methode mxnet.autograd.predict_mode () verwenden, um einen Bereich zurückzugeben, der in der Anweisung 'with' verwendet werden soll.
with mx.autograd.record():
y = model(x)
with mx.autograd.predict_mode():
y = sampling(y)
backward([y])
mxnet.intializer
Dies ist die MXNet-API für den Wiegeinitialisierer. Es hat die folgenden Klassen -
Klassen und ihre Parameter
Es folgen die Methoden und ihre Parameter von mxnet.autogard.function Klasse:
Klassen und ihre Parameter | Definition |
---|---|
Bilinear() | Mit Hilfe dieser Klasse können wir das Gewicht für Up-Sampling-Schichten initialisieren. |
Konstanter Wert) | Diese Klasse initialisiert die Gewichte auf einen bestimmten Wert. Der Wert kann sowohl ein Skalar als auch ein NDArray sein, der der Form des einzustellenden Parameters entspricht. |
FusedRNN (init, num_hidden, num_layers, mode) | Wie der Name schon sagt, initialisiert diese Klasse Parameter für die verschmolzenen RNN-Schichten (Recurrent Neural Network). |
InitDesc | Es fungiert als Deskriptor für das Initialisierungsmuster. |
Initializer (** kwargs) | Dies ist die Basisklasse eines Initialisierers. |
LSTMBias ([compare_bias]) | Diese Klasse initialisiert alle Verzerrungen einer LSTMCell auf 0,0, mit Ausnahme des Vergessensgatters, dessen Verzerrung auf einen benutzerdefinierten Wert festgelegt ist. |
Laden (param [, default_init, verbose]) | Diese Klasse initialisiert die Variablen durch Laden von Daten aus einer Datei oder einem Wörterbuch. |
MSRAPrelu ([Faktor_Typ, Steigung]) | Wie der Name schon sagt, initialisiert diese Klasse das Gewicht gemäß einem MSRA-Papier. |
Gemischt (Muster, Initialisierer) | Die Parameter werden mit mehreren Initialisierern initialisiert. |
Normal ([Sigma]) | Die Klasse Normal () initialisiert Gewichte mit Zufallswerten, die aus einer Normalverteilung mit einem Mittelwert von Null und einer Standardabweichung (SD) von abgetastet wurden sigma. |
Einer() | Es initialisiert die Gewichtung des Parameters auf eins. |
Orthogonal ([scale, rand_type]) | Wie der Name schon sagt, initialisiert diese Klasse das Gewicht als orthogonale Matrix. |
Uniform ([Skala]) | Es initialisiert Gewichte mit zufälligen Werten, die gleichmäßig aus einem bestimmten Bereich abgetastet werden. |
Xavier ([rnd_type, factor_type, size]) | Es wird tatsächlich ein Initialisierer zurückgegeben, der die Xavier-Initialisierung für Gewichte durchführt. |
Null() | Es initialisiert die Gewichtung des Parameters auf Null. |
Implementierungsbeispiel
Im folgenden Beispiel verwenden wir die Klasse mxnet.init.Normal (), erstellen einen Initialisierer und rufen seine Parameter ab.
init = mx.init.Normal(0.8)
init.dumps()
Output
Die Ausgabe ist unten angegeben -
'["normal", {"sigma": 0.8}]'
Example
init = mx.init.Xavier(factor_type="in", magnitude=2.45)
init.dumps()
Output
Die Ausgabe wird unten gezeigt -
'["xavier", {"rnd_type": "uniform", "factor_type": "in", "magnitude": 2.45}]'
Im folgenden Beispiel verwenden wir die Klasse mxnet.initializer.Mixed (), um Parameter mit mehreren Initialisierern zu initialisieren.
init = mx.initializer.Mixed(['bias', '.*'], [mx.init.Zero(),
mx.init.Uniform(0.1)])
module.init_params(init)
for dictionary in module.get_params():
for key in dictionary:
print(key)
print(dictionary[key].asnumpy())
Output
Die Ausgabe wird unten gezeigt -
fullyconnected1_weight
[[ 0.0097627 0.01856892 0.04303787]]
fullyconnected1_bias
[ 0.]
In diesem Kapitel lernen wir eine Schnittstelle in MXNet kennen, die als Symbol bezeichnet wird.
Mxnet.ndarray
Die Symbol-API von Apache MXNet ist eine Schnittstelle für die symbolische Programmierung. Die Symbol-API bietet die Verwendung der folgenden Optionen:
Computergraphen
Reduzierte Speichernutzung
Funktionsoptimierung vor dem Gebrauch
Das folgende Beispiel zeigt, wie Sie mithilfe der Symbol-API von MXNet einen einfachen Ausdruck erstellen können.
Ein NDArray unter Verwendung eines 1-D- und 2-D-Arrays aus einer regulären Python-Liste -
import mxnet as mx
# Two placeholders namely x and y will be created with mx.sym.variable
x = mx.sym.Variable('x')
y = mx.sym.Variable('y')
# The symbol here is constructed using the plus ‘+’ operator.
z = x + y
Output
Sie sehen die folgende Ausgabe -
<Symbol _plus0>
Example
(x, y, z)
Output
Die Ausgabe ist unten angegeben -
(<Symbol x>, <Symbol y>, <Symbol _plus0>)
Lassen Sie uns nun die Klassen, Funktionen und Parameter der ndarray-API von MXNet ausführlich diskutieren.
Klassen
Die folgende Tabelle enthält die Klassen der Symbol-API von MXNet -
Klasse | Definition |
---|---|
Symbol (Griff) | Diese Klasse, nämlich das Symbol, ist der symbolische Graph des Apache MXNet. |
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter, die von der mxnet.Symbol-API abgedeckt werden.
Funktion und ihre Parameter | Definition |
---|---|
Aktivierung ([data, act_type, out, name]) | Es wendet eine Aktivierungsfunktion elementweise auf den Eingang an. Es unterstütztrelu, sigmoid, tanh, softrelu, softsign Aktivierungsfunktionen. |
BatchNorm ([Daten, Gamma, Beta, Moving_Mean,…]) | Es wird zur Chargennormalisierung verwendet. Diese Funktion normalisiert einen Datenstapel nach Mittelwert und Varianz. Es wird eine Skala angewendetgamma und Offset beta. |
BilinearSampler ([Daten, Raster, cudnn_off,…]) | Diese Funktion wendet eine bilineare Abtastung auf die Eingabe-Feature-Map an. Eigentlich ist es der Schlüssel von "Spatial Transformer Networks". Wenn Sie mit der Remap-Funktion in OpenCV vertraut sind, ist die Verwendung dieser Funktion der sehr ähnlich. Der einzige Unterschied ist, dass es den Rückwärtspass hat. |
BlockGrad ([Daten, Out, Name]) | Wie der Name schon sagt, stoppt diese Funktion die Gradientenberechnung. Grundsätzlich wird verhindert, dass der akkumulierte Gradient der Eingaben durch diesen Operator in Rückwärtsrichtung fließt. |
cast ([Daten, Typ, Out, Name]) | Diese Funktion wandelt alle Elemente der Eingabe in einen neuen Typ um. |
Diese Funktion wandelt alle Elemente der Eingabe in einen neuen Typ um. | Diese Funktion gibt, wie der Name schon sagt, ein neues Symbol mit einer bestimmten Form und einem bestimmten Typ zurück, das mit Nullen gefüllt ist. |
Einsen (Form [, Typ]) | Diese Funktion gibt, wie angegeben, ein neues Symbol der angegebenen Form und des angegebenen Typs zurück, das mit Einsen gefüllt ist. |
voll (Form, Wert [, Typ]) | Diese Funktion gibt, wie der Name schon sagt, ein neues Array mit der angegebenen Form und dem angegebenen Typ zurück, das mit dem angegebenen Wert gefüllt ist val. |
arrangieren (Start [, Stopp, Schritt, Wiederholung,…]) | Innerhalb eines bestimmten Intervalls werden gleichmäßig verteilte Werte zurückgegeben. Die Werte werden innerhalb eines halboffenen Intervalls (Start, Stopp) generiert, was bedeutet, dass das Intervall enthältstart schließt aber aus stop. |
linspace (start, stop, num [, endpunkt, name,…]) | Innerhalb eines bestimmten Intervalls werden gleichmäßig verteilte Zahlen zurückgegeben. Ähnlich wie bei der Funktion arrang () werden die Werte innerhalb eines halboffenen Intervalls (Start, Stopp) generiert, was bedeutet, dass das Intervall enthältstart schließt aber aus stop. |
Histogramm (a [, Bins, Bereich]) | Wie der Name schon sagt, berechnet diese Funktion das Histogramm der Eingabedaten. |
Macht (Basis, exp) | Wie der Name schon sagt, gibt diese Funktion das elementweise Ergebnis von zurück base Element zu Mächten erhoben von expElement. Beide Eingänge, dh base und exp, können entweder Symbol oder Skalar sein. Beachten Sie hier, dass das Senden nicht erlaubt ist. Sie können verwendenbroadcast_pow Wenn Sie die Broadcast-Funktion verwenden möchten. |
SoftmaxActivation ([Daten, Modus, Name, attr, out]) | Diese Funktion wendet die Softmax-Aktivierung auf den Eingang an. Es ist für interne Schichten vorgesehen. Es ist tatsächlich veraltet, wir können verwendensoftmax() stattdessen. |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir die Funktion power() Dies gibt das elementweise Ergebnis des Basiselements zurück, das vom exp-Element auf die Potenzen angehoben wurde:
import mxnet as mx
mx.sym.power(3, 5)
Output
Sie sehen die folgende Ausgabe -
243
Example
x = mx.sym.Variable('x')
y = mx.sym.Variable('y')
z = mx.sym.power(x, 3)
z.eval(x=mx.nd.array([1,2]))[0].asnumpy()
Output
Dies erzeugt die folgende Ausgabe -
array([1., 8.], dtype=float32)
Example
z = mx.sym.power(4, y)
z.eval(y=mx.nd.array([2,3]))[0].asnumpy()
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
array([16., 64.], dtype=float32)
Example
z = mx.sym.power(x, y)
z.eval(x=mx.nd.array([4,5]), y=mx.nd.array([2,3]))[0].asnumpy()
Output
Die Ausgabe wird unten erwähnt -
array([ 16., 125.], dtype=float32)
Im folgenden Beispiel verwenden wir die Funktion SoftmaxActivation() (or softmax()) Dies wird auf die Eingabe angewendet und ist für interne Ebenen vorgesehen.
input_data = mx.nd.array([[2., 0.9, -0.5, 4., 8.], [4., -.7, 9., 2., 0.9]])
soft_max_act = mx.nd.softmax(input_data)
print (soft_max_act.asnumpy())
Output
Sie sehen die folgende Ausgabe -
[[2.4258138e-03 8.0748333e-04 1.9912292e-04 1.7924475e-02 9.7864312e-01]
[6.6843745e-03 6.0796250e-05 9.9204916e-01 9.0463174e-04 3.0112563e-04]]
symbol.contrib
Die Contrib NDArray-API ist im Paket symbol.contrib definiert. Es bietet normalerweise viele nützliche experimentelle APIs für neue Funktionen. Diese API dient als Ort für die Community, an dem sie die neuen Funktionen ausprobieren kann. Der Feature-Mitwirkende erhält ebenfalls das Feedback.
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.symbol.contrib API - -
Funktion und ihre Parameter | Definition |
---|---|
rand_zipfian (true_classes, num_sampled,…) | Diese Funktion zieht Zufallsstichproben aus einer ungefähren Zipfian-Verteilung. Die Basisverteilung dieser Funktion ist die Zipfian-Verteilung. Diese Funktion tastet zufällig num_sampled Kandidaten ab und die Elemente von sampled_candidates werden aus der oben angegebenen Basisverteilung gezogen. |
foreach (body, data, init_states) | Wie der Name schon sagt, führt diese Funktion eine Schleife mit benutzerdefinierter Berechnung über NDArrays in Dimension 0 aus. Diese Funktion simuliert eine for-Schleife und body hat die Berechnung für eine Iteration der for-Schleife. |
while_loop (cond, func, loop_vars [,…]) | Wie der Name schon sagt, führt diese Funktion eine while-Schleife mit benutzerdefinierter Berechnung und Schleifenbedingung aus. Diese Funktion simuliert eine while-Schleife, die literarisch benutzerdefinierte Berechnungen durchführt, wenn die Bedingung erfüllt ist. |
cond (pred, then_func, else_func) | Wie der Name schon sagt, führt diese Funktion ein Wenn-Dann-Sonst unter Verwendung einer benutzerdefinierten Bedingung und Berechnung aus. Diese Funktion simuliert einen if-ähnlichen Zweig, der eine der beiden benutzerdefinierten Berechnungen gemäß der angegebenen Bedingung ausführt. |
getnnz ([Daten, Achse, Out, Name]) | Diese Funktion gibt uns die Anzahl der gespeicherten Werte für einen spärlichen Tensor an. Es enthält auch explizite Nullen. Es unterstützt nur die CSR-Matrix auf der CPU. |
Requantize ([Daten, min_range, max_range,…]) | Diese Funktion benötigt die angegebenen Daten, die in int32 und den entsprechenden Schwellenwerten quantisiert sind, in int8 unter Verwendung von minimalen und maximalen Schwellenwerten, die entweder zur Laufzeit oder aus der Kalibrierung berechnet werden. |
index_copy ([old_tensor, index_vector,…]) | Diese Funktion kopiert die Elemente von a new_tensor into the old_tensor by selecting the indices in the order given in index. The output of this operator will be a new tensor that contains the rest elements of old tensor and the copied elements of new tensor. |
interleaved_matmul_encdec_qk ([Abfragen,…]) | Dieser Operator berechnet die Matrixmultiplikation zwischen den Projektionen von Abfragen und Schlüsseln bei Verwendung mit mehreren Köpfen als Encoder-Decoder. Die Bedingung ist, dass die Eingaben ein Tensor von Projektionen von Abfragen sein sollten, die dem Layout folgen: (seq_length, batch_size, num_heads *, head_dim). |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir die Funktion rand_zipfian, um Zufallsstichproben aus einer ungefähren Zipfian-Verteilung zu ziehen.
import mxnet as mx
true_cls = mx.sym.Variable('true_cls')
samples, exp_count_true, exp_count_sample = mx.sym.contrib.rand_zipfian(true_cls, 5, 6)
samples.eval(true_cls=mx.nd.array([3]))[0].asnumpy()
Output
Sie sehen die folgende Ausgabe -
array([4, 0, 2, 1, 5], dtype=int64)
Example
exp_count_true.eval(true_cls=mx.nd.array([3]))[0].asnumpy()
Output
Die Ausgabe wird unten erwähnt -
array([0.57336551])
Example
exp_count_sample.eval(true_cls=mx.nd.array([3]))[0].asnumpy()
Output
Sie sehen die folgende Ausgabe -
array([1.78103594, 0.46847373, 1.04183923, 0.57336551, 1.04183923])
Im folgenden Beispiel verwenden wir die Funktion while_loop zum Ausführen einer while-Schleife für benutzerdefinierte Berechnungen und Schleifenbedingungen -
cond = lambda i, s: i <= 7
func = lambda i, s: ([i + s], [i + 1, s + i])
loop_vars = (mx.sym.var('i'), mx.sym.var('s'))
outputs, states = mx.sym.contrib.while_loop(cond, func, loop_vars, max_iterations=10)
print(outputs)
Output
Die Ausgabe ist unten angegeben:
[<Symbol _while_loop0>]
Example
Print(States)
Output
Dies erzeugt die folgende Ausgabe -
[<Symbol _while_loop0>, <Symbol _while_loop0>]
Im folgenden Beispiel verwenden wir die Funktion index_copy das kopiert die Elemente von new_tensor in den old_tensor.
import mxnet as mx
a = mx.nd.zeros((6,3))
b = mx.nd.array([[1,2,3],[4,5,6],[7,8,9]])
index = mx.nd.array([0,4,2])
mx.nd.contrib.index_copy(a, index, b)
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[[1. 2. 3.]
[0. 0. 0.]
[7. 8. 9.]
[0. 0. 0.]
[4. 5. 6.]
[0. 0. 0.]]
<NDArray 6x3 @cpu(0)>
symbol.image
Die Image Symbol API ist im Paket symbol.image definiert. Wie der Name schon sagt, wird es normalerweise für Bilder und deren Funktionen verwendet.
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.symbol.image API - -
Funktion und ihre Parameter | Definition |
---|---|
adjust_lighting ([Daten, Alpha, Out, Name]) | Wie der Name schon sagt, passt diese Funktion die Beleuchtungsstärke des Eingangs an. Es folgt dem AlexNet-Stil. |
Ernte ([Daten, x, y, Breite, Höhe, out, Name]) | Mit Hilfe dieser Funktion können wir ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zuschneiden. |
normalisieren ([Daten, Mittelwert, Standard, Out, Name]) | Es normalisiert einen Tensor der Form (C x H x B) oder (N x C x H x B) mit mean und standard deviation(SD). |
random_crop ([Daten, x-Bereich, y-Bereich, Breite,…]) | Ähnlich wie beim Zuschneiden () wird zufällig ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe zugeschnitten. Das Ergebnis wird aktualisiert, wennsrc ist kleiner als die size. |
random_lighting([data, alpha_std, out, name]) | Wie der Name schon sagt, fügt diese Funktion das PCA-Rauschen zufällig hinzu. Es folgt auch dem AlexNet-Stil. |
random_resized_crop ([data, xrange, yrange,…]) | Es schneidet auch ein Bild zufällig NDArray der Form (H x B x C) oder (N x H x B x C) auf die angegebene Größe. Das Ergebnis wird aktualisiert, wenn src kleiner als die Größe ist. Es wird auch die Flächen- und Seitenration randomisiert. |
Größe ändern ([Daten, Größe, keep_ratio, interp,…]) | Wie der Name schon sagt, ändert diese Funktion die Größe eines Bild-NDArrays der Form (H x B x C) oder (N x H x B x C) auf die vom Benutzer angegebene Größe. |
to_tensor ([Daten, Out, Name]) | Es konvertiert ein Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray der Form (C x H x B) oder ( N x C x H x B) mit den Werten im Bereich [0, 1]. |
Implementierungsbeispiele
Im folgenden Beispiel verwenden wir die Funktion to_tensor, um das Bild-NDArray der Form (H x B x C) oder (N x H x B x C) mit den Werten im Bereich [0, 255] in ein Tensor-NDArray umzuwandeln der Form (C x H x B) oder (N x C x H x B) mit den Werten im Bereich [0, 1].
import numpy as np
img = mx.sym.random.uniform(0, 255, (4, 2, 3)).astype(dtype=np.uint8)
mx.sym.image.to_tensor(img)
Output
Die Ausgabe ist unten angegeben -
<Symbol to_tensor4>
Example
img = mx.sym.random.uniform(0, 255, (2, 4, 2, 3)).astype(dtype=np.uint8)
mx.sym.image.to_tensor(img)
Output
Die Ausgabe wird unten erwähnt:
<Symbol to_tensor5>
Im folgenden Beispiel verwenden wir die Funktion normalize (), um einen Tensor der Form (C x H x B) oder (N x C x H x B) mit zu normalisieren mean und standard deviation(SD).
img = mx.sym.random.uniform(0, 1, (3, 4, 2))
mx.sym.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))
Output
Unten ist die Ausgabe des Codes angegeben -
<Symbol normalize0>
Example
img = mx.sym.random.uniform(0, 1, (2, 3, 4, 2))
mx.sym.image.normalize(img, mean=(0, 1, 2), std=(3, 2, 1))
Output
Die Ausgabe wird unten gezeigt -
<Symbol normalize1>
symbol.random
Die Zufallssymbol-API ist im Paket symbol.random definiert. Wie der Name schon sagt, handelt es sich um die Symbol-API des Zufallsverteilungsgenerators von MXNet.
Funktionen und ihre Parameter
Im Folgenden finden Sie einige wichtige Funktionen und deren Parameter mxnet.symbol.random API - -
Funktion und ihre Parameter | Definition |
---|---|
Uniform ([niedrig, hoch, Form, dtype, ctx, out]) | Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung generiert. |
normal ([loc, scale, shape, dtype, ctx, out]) | Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert. |
randn (* form, ** kwargs) | Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) generiert. |
poisson ([lam, form, dtyp, ctx, out]) | Es werden Zufallsstichproben aus einer Poisson-Verteilung generiert. |
exponentiell ([Skala, Form, dtype, ctx, out]) | Es werden Stichproben aus einer Exponentialverteilung generiert. |
Gamma ([Alpha, Beta, Form, D-Typ, Ctx, Out]) | Aus einer Gammaverteilung werden Zufallsstichproben generiert. |
multinomial (Daten [, Form, get_prob, out, dtype]) | Es generiert eine gleichzeitige Abtastung aus mehreren Multinomialverteilungen. |
negative_binomial ([k, p, Form, dtype, ctx, out]) | Es werden Zufallsstichproben aus einer negativen Binomialverteilung generiert. |
generalized_negative_binomial ([mu, alpha,…]) | Es generiert Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung. |
mischen (Daten, ** kwargs) | Die Elemente werden zufällig gemischt. |
Randint (niedrig, hoch [, Form, Typ, Ctx, out]) | Es werden Zufallsstichproben aus einer diskreten Gleichverteilung generiert. |
exponentiell_ähnlich ([data, lam, out, name]) | Es werden Zufallsstichproben aus einer Exponentialverteilung gemäß der Form des Eingabearrays generiert. |
gamma_like ([Daten, Alpha, Beta, Out, Name]) | Es werden Zufallsstichproben aus einer Gammaverteilung gemäß der Form des Eingabearrays generiert. |
generalized_negative_binomial_like ([Daten,…]) | Es werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gemäß der Form des Eingabearrays generiert. |
negative_binomial_like ([Daten, k, p, out, Name]) | Es werden Zufallsstichproben aus einer negativen Binomialverteilung gemäß der Form des Eingabearrays generiert. |
normal_like ([Daten, Ort, Skalierung, Out, Name]) | Es werden Zufallsstichproben aus einer Normalverteilung (Gaußschen Verteilung) gemäß der Form des Eingabearrays generiert. |
poisson_like ([Daten, Lam, Out, Name]) | Es werden Zufallsstichproben aus einer Poisson-Verteilung gemäß der Form des Eingabearrays generiert. |
uniform_like ([Daten, niedrig, hoch, out, Name]) | Es werden Zufallsstichproben aus einer gleichmäßigen Verteilung gemäß der Form des Eingabearrays generiert. |
Implementierungsbeispiele
Im folgenden Beispiel werden die Elemente mit der Funktion shuffle () zufällig gemischt. Das Array wird entlang der ersten Achse gemischt.
data = mx.nd.array([[0, 1, 2], [3, 4, 5], [6, 7, 8],[9,10,11]])
x = mx.sym.Variable('x')
y = mx.sym.random.shuffle(x)
y.eval(x=data)
Output
Sie sehen die folgende Ausgabe:
[
[[ 9. 10. 11.]
[ 0. 1. 2.]
[ 6. 7. 8.]
[ 3. 4. 5.]]
<NDArray 4x3 @cpu(0)>]
Example
y.eval(x=data)
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[
[[ 6. 7. 8.]
[ 0. 1. 2.]
[ 3. 4. 5.]
[ 9. 10. 11.]]
<NDArray 4x3 @cpu(0)>]
Im folgenden Beispiel werden Zufallsstichproben aus einer verallgemeinerten negativen Binomialverteilung gezogen. Hierfür wird die Funktion verwendetgeneralized_negative_binomial().
mx.sym.random.generalized_negative_binomial(10, 0.1)
Output
Die Ausgabe ist unten angegeben -
<Symbol _random_generalized_negative_binomial0>
symbol.sparse
Die Sparse Symbol API ist im Paket mxnet.symbol.sparse definiert. Wie der Name schon sagt, bietet es spärliche Diagramme für neuronale Netze und eine automatische Differenzierung auf der CPU.
Funktionen und ihre Parameter
Im Folgenden sind einige der wichtigen Funktionen (einschließlich Routinen zur Symbolerstellung, Routinen zur Symbolmanipulation, mathematische Funktionen, trigonometrische Funktion, hyberbolische Funktionen, Reduzierungsfunktionen, Rundung, Potenzen, neuronales Netzwerk) und deren Parameter aufgeführt mxnet.symbol.sparse API - -
Funktion und ihre Parameter | Definition |
---|---|
ElementWiseSum (* args, ** kwargs) | Diese Funktion fügt alle Eingabeargumente elementweise hinzu. Zum Beispiel _ (1,2,… = 1 + 2 + ⋯ +). Hier können wir sehen, dass add_n möglicherweise effizienter ist als das n-malige Aufrufen von add. |
Einbetten ([Daten, Gewicht, input_dim,…]) | Die Ganzzahlindizes werden Vektordarstellungen, dh Einbettungen, zugeordnet. Es ordnet Wörter tatsächlich realwertigen Vektoren im hochdimensionalen Raum zu, die als Worteinbettungen bezeichnet werden. |
LinearRegressionOutput ([Daten, Label,…]) | Es berechnet und optimiert den quadratischen Verlust während der Rückwärtsausbreitung und liefert nur Ausgabedaten während der Vorwärtsausbreitung. |
LogisticRegressionOutput ([Daten, Label,…]) | Wendet eine logistische Funktion, die auch als Sigmoid-Funktion bezeichnet wird, auf die Eingabe an. Die Funktion wird als 1/1 + exp (−x) berechnet. |
MAERegressionOutput ([Daten, Label,…]) | Dieser Operator berechnet den mittleren absoluten Fehler der Eingabe. MAE ist tatsächlich eine Risikometrik, die dem erwarteten Wert des absoluten Fehlers entspricht. |
abs ([Daten, Name, attr, out]) | Wie der Name schon sagt, gibt diese Funktion den elementweisen Absolutwert der Eingabe zurück. |
adagrad_update ([Gewicht, Grad, Geschichte, lr,…]) | Es ist eine Update-Funktion für AdaGrad optimizer. |
adam_update ([Gewicht, Grad, Mittelwert, Var, lr,…]) | Es ist eine Update-Funktion für Adam optimizer. |
add_n (* args, ** kwargs) | Wie der Name schon sagt, werden alle Eingabeargumente elementweise hinzugefügt. |
arccos ([Daten, Name, attr, out]) | Diese Funktion gibt den elementweisen inversen Kosinus des Eingabearrays zurück. |
Punkt ([lhs, rhs, transpose_a, transpose_b,…]) | Wie der Name schon sagt, ergibt sich das Punktprodukt zweier Arrays. Dies hängt von der Dimension des Eingabearrays ab: 1-D: inneres Produkt der Vektoren 2-D: Matrixmultiplikation ND: Ein Summenprodukt über der letzten Achse der ersten Eingabe und der ersten Achse der zweiten Eingabe. |
elemwise_add ([lhs, rhs, name, attr, out]) | Wie der Name schon sagt add Argumente elementweise. |
elemwise_div ([lhs, rhs, name, attr, out]) | Wie der Name schon sagt divide Argumente elementweise. |
elemwise_mul ([lhs, rhs, name, attr, out]) | Wie der Name schon sagt Multiply Argumente elementweise. |
elemwise_sub ([lhs, rhs, name, attr, out]) | Wie der Name schon sagt, werden Argumente elementweise subtrahiert. |
exp ([Daten, Name, attr, out]) | Diese Funktion gibt den elementweisen Exponentialwert der angegebenen Eingabe zurück. |
sgd_update ([weight, grad, lr, wd,…]) | Es fungiert als Aktualisierungsfunktion für den Stochastic Gradient Descent Optimizer. |
Sigmoid ([Daten, Name, attr, out]) | Wie der Name schon sagt, wird es berechnet sigmoid von x elementweise. |
Zeichen ([Daten, Name, attr, out]) | Es wird das elementweise Vorzeichen der angegebenen Eingabe zurückgegeben. |
sin ([Daten, Name, attr, out]) | Wie der Name schon sagt, berechnet diese Funktion den elementweisen Sinus des angegebenen Eingabearrays. |
Implementierungsbeispiel
Im folgenden Beispiel werden wir die Elemente zufällig mit mischen ElementWiseSum()Funktion. Ganzzahlige Indizes werden Vektordarstellungen, dh Worteinbettungen, zugeordnet.
input_dim = 4
output_dim = 5
Example
/* Here every row in weight matrix y represents a word. So, y = (w0,w1,w2,w3)
y = [[ 0., 1., 2., 3., 4.],
[ 5., 6., 7., 8., 9.],
[ 10., 11., 12., 13., 14.],
[ 15., 16., 17., 18., 19.]]
/* Here input array x represents n-grams(2-gram). So, x = [(w1,w3), (w0,w2)]
x = [[ 1., 3.],
[ 0., 2.]]
/* Now, Mapped input x to its vector representation y.
Embedding(x, y, 4, 5) = [[[ 5., 6., 7., 8., 9.],
[ 15., 16., 17., 18., 19.]],
[[ 0., 1., 2., 3., 4.],
[ 10., 11., 12., 13., 14.]]]
Die Modul-API von Apache MXNet ähnelt einem FeedForward-Modell und ist einfacher zu erstellen als das Torch-Modul. Es besteht aus folgenden Klassen -
BaseModule ([Logger])
Es repräsentiert die Basisklasse eines Moduls. Ein Modul kann als Rechenkomponente oder Rechenmaschine betrachtet werden. Die Aufgabe eines Moduls besteht darin, Vorwärts- und Rückwärtsdurchläufe auszuführen. Außerdem werden Parameter in einem Modell aktualisiert.
Methoden
Die folgende Tabelle zeigt die Methoden, aus denen besteht BaseModule class- -
Diese Methode ruft Zustände von allen Geräten abMethoden | Definition |
---|---|
rückwärts ([out_grads]) | Wie der Name schon sagt, implementiert diese Methode die backward Berechnung. |
bind (data_shapes [, label_shapes,…]) | Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann. |
fit (train_data [, eval_data, eval_metric,…]) | Diese Methode trainiert die Modulparameter. |
vorwärts (data_batch [, is_train]) | Wie der Name schon sagt, implementiert diese Methode die Vorwärtsberechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen. |
forward_backward (data_batch) | Es ist eine praktische Funktion, wie der Name schon sagt, die sowohl vorwärts als auch rückwärts aufruft. |
get_input_grads ([merge_multi_context]) | Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden. |
get_outputs ([merge_multi_context]) | Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung. |
get_params () | Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden. |
get_states ([merge_multi_context]) | |
init_optimizer ([kvstore, optimizer,…]) | Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen. |
init_params ([initializer, arg_params,…]) | Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände. |
install_monitor (mon) | Diese Methode installiert den Monitor auf allen Executoren. |
iter_predict (eval_data [, num_batch, reset,…]) | Diese Methode iteriert über Vorhersagen. |
load_params (fname) | Wie der Name schon sagt, werden Modellparameter aus der Datei geladen. |
vorhersagen (eval_data [, num_batch,…]) | Es wird die Vorhersage ausführen und auch die Ausgaben sammeln. |
vorbereiten (data_batch [, sparse_row_id_fn]) | Der Bediener bereitet das Modul für die Verarbeitung eines bestimmten Datenstapels vor. |
save_params (fname) | Wie der Name schon sagt, speichert diese Funktion die Modellparameter in einer Datei. |
score (eval_data, eval_metric [, num_batch,…]) | Es läuft die Vorhersage weiter eval_data und bewertet auch die Leistung gemäß den gegebenen eval_metric. |
set_params (arg_params, aux_params [,…]) | Diese Methode weist die Parameter- und Hilfszustandswerte zu. |
set_states ([Zustände, Wert]) | Diese Methode legt, wie der Name schon sagt, den Wert für Zustände fest. |
aktualisieren() | Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert. |
update_metric (eval_metric, label [, pre_sliced]) | Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie. |
rückwärts ([out_grads]) | Wie der Name schon sagt, implementiert diese Methode die backward Berechnung. |
bind (data_shapes [, label_shapes,…]) | Es richtet die Buckets ein und bindet den Executor für den Standard-Bucket-Schlüssel. Diese Methode repräsentiert die Bindung für aBucketingModule. |
vorwärts (data_batch [, is_train]) | Wie der Name schon sagt, implementiert diese Methode die Vorwärtsberechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen. |
get_input_grads ([merge_multi_context]) | Diese Methode erhält die Gradienten zu den Eingaben, die in der vorherigen Rückwärtsberechnung berechnet wurden. |
get_outputs ([merge_multi_context]) | Wie der Name schon sagt, erhält diese Methode Ausgaben aus der vorherigen Vorwärtsberechnung. |
get_params () | Es werden die aktuellen Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden. |
get_states ([merge_multi_context]) | Diese Methode ruft Zustände von allen Geräten ab. |
init_optimizer ([kvstore, optimizer,…]) | Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen. |
init_params ([initializer, arg_params,…]) | Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände. |
install_monitor (mon) | Diese Methode installiert den Monitor auf allen Executoren. |
Laden (Präfix, Epoche [, sym_gen,…]) | Diese Methode erstellt ein Modell aus dem zuvor gespeicherten Prüfpunkt. |
load_dict ([sym_dict, sym_gen,…]) | Diese Methode erstellt ein Modell aus einer Wörterbuchzuordnung (dict) bucket_keyzu Symbolen. Es teilt aucharg_params und aux_params. |
vorbereiten (data_batch [, sparse_row_id_fn]) | Der Bediener bereitet das Modul für die Verarbeitung eines bestimmten Datenstapels vor. |
save_checkpoint (Präfix, Epoche [, remove_amp_cast]) | Diese Methode speichert, wie der Name schon sagt, den aktuellen Fortschritt für alle Buckets in BucketingModule am Prüfpunkt. Es wird empfohlen, mx.callback.module_checkpoint als epoch_end_callback zu verwenden, um während des Trainings zu speichern. |
set_params (arg_params, aux_params [,…]) | Wie der Name schon sagt, weist diese Funktion Parameter und Hilfszustandswerte zu. |
set_states ([Zustände, Wert]) | Diese Methode legt, wie der Name schon sagt, den Wert für Zustände fest. |
switch_bucket (Bucket_key, Datenformen [,…]) | Es wird in einen anderen Eimer gewechselt. |
aktualisieren() | Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert. |
update_metric (eval_metric, label [, pre_sliced]) | Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie. |
Attribute
Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen BaseModule Klasse -
Attribute | Definition |
---|---|
Datennamen | Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden. |
Datenformen | Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben. |
label_shapes | Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben. |
Ausgabenamen | Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls. |
output_shapes | Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben. |
Symbol | Wie angegeben, erhält dieses Attribut das diesem Modul zugeordnete Symbol. |
data_shapes: Sie können auf den Link verweisen, der unter verfügbar ist https://mxnet.apache.orgfür Details. output_shapes: Mehr
output_shapes: Weitere Informationen finden Sie unter https://mxnet.apache.org/api/python
BucketingModule (sym_gen […])
Es repräsentiert die Bucketingmodule Klasse eines Moduls, mit dessen Hilfe Eingaben unterschiedlicher Länge effizient verarbeitet werden können.
Methoden
Die folgende Tabelle zeigt die Methoden, aus denen besteht BucketingModule class - -
Attribute
Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen BaseModule class - -
Attribute | Definition |
---|---|
Datennamen | Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden. |
Datenformen | Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben. |
label_shapes | Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben. |
Ausgabenamen | Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls. |
output_shapes | Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben. |
Symbol | Wie angegeben, erhält dieses Attribut das diesem Modul zugeordnete Symbol. |
data_shapes - Sie können auf den Link unter verweisen https://mxnet.apache.org/api/python/docs für mehr Informationen.
output_shapes− Sie können auf den Link unter verweisen https://mxnet.apache.org/api/python/docs für mehr Informationen.
Modul (Symbol [, Datennamen, Labelnamen,…])
Es stellt ein Basismodul dar, das a umschließt symbol.
Methoden
Die folgende Tabelle zeigt die Methoden, aus denen besteht Module class - -
Methoden | Definition |
---|---|
rückwärts ([out_grads]) | Wie der Name schon sagt, implementiert diese Methode die backward Berechnung. |
bind (data_shapes [, label_shapes,…]) | Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann. |
leihoptimierer (shared_module) | Wie der Name schon sagt, leiht diese Methode den Optimierer von einem gemeinsam genutzten Modul aus. |
vorwärts (data_batch [, is_train]) | Wie der Name schon sagt, implementiert diese Methode die ForwardBerechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen. |
get_input_grads ([merge_multi_context]) | Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden. |
get_outputs ([merge_multi_context]) | Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung. |
get_params () | Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden. |
get_states ([merge_multi_context]) | Diese Methode ruft Zustände von allen Geräten ab |
init_optimizer ([kvstore, optimizer,…]) | Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen. |
init_params ([initializer, arg_params,…]) | Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände. |
install_monitor (mon) | Diese Methode installiert den Monitor auf allen Executoren. |
Laden (Präfix, Epoche [, sym_gen,…]) | Diese Methode erstellt ein Modell aus dem zuvor gespeicherten Prüfpunkt. |
load_optimizer_states (fname) | Diese Methode lädt einen Optimierer, dh den Updater-Status, aus einer Datei. |
vorbereiten (data_batch [, sparse_row_id_fn]) | Der Bediener bereitet das Modul für die Verarbeitung eines bestimmten Datenstapels vor. |
umformen (data_shapes [, label_shapes]) | Diese Methode formt das Modul, wie der Name schon sagt, für neue Eingabeformen um. |
save_checkpoint (Präfix, Epoche [,…]) | Es speichert den aktuellen Fortschritt zum Checkpoint. |
save_optimizer_states (fname) | Diese Methode speichert den Optimierer oder den Updater-Status in einer Datei. |
set_params (arg_params, aux_params [,…]) | Wie der Name schon sagt, weist diese Funktion Parameter und Hilfszustandswerte zu. |
set_states ([Zustände, Wert]) | Diese Methode legt, wie der Name schon sagt, den Wert für Zustände fest. |
aktualisieren() | Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert. |
update_metric (eval_metric, label [, pre_sliced]) | Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie. |
Attribute
Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen Module class - -
Attribute | Definition |
---|---|
Datennamen | Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden. |
Datenformen | Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben. |
label_shapes | Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben. |
Ausgabenamen | Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls. |
output_shapes | Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben. |
label_names | Es besteht aus der Liste der Namen für Beschriftungen, die von diesem Modul benötigt werden. |
data_shapes: Besuchen Sie den Link https://mxnet.apache.org/api/python/docs/api/module für weitere Details.
output_shapes: Der hier angegebene Link https://mxnet.apache.org/api/python/docs/api/module/index.html bietet weitere wichtige Informationen.
PythonLossModule ([Name, Datennamen,…])
Die Basis dieser Klasse ist mxnet.module.python_module.PythonModule. Die PythonLossModule-Klasse ist eine praktische Modulklasse, die alle oder viele Modul-APIs als leere Funktionen implementiert.
Methoden
Die folgende Tabelle zeigt die Methoden, aus denen besteht PythonLossModule Klasse:
Methoden | Definition |
---|---|
rückwärts ([out_grads]) | Wie der Name schon sagt, implementiert diese Methode die backward Berechnung. |
vorwärts (data_batch [, is_train]) | Wie der Name schon sagt, implementiert diese Methode die ForwardBerechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen. |
get_input_grads ([merge_multi_context]) | Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden. |
get_outputs ([merge_multi_context]) | Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung. |
install_monitor (mon) | Diese Methode installiert den Monitor auf allen Executoren. |
PythonModule ([Datennamen, Labelnamen…])
Die Basis dieser Klasse ist mxnet.module.base_module.BaseModule. Die PythonModule-Klasse ist auch eine praktische Modulklasse, die alle oder viele Modul-APIs als leere Funktionen implementiert.
Methoden
Die folgende Tabelle zeigt die Methoden, aus denen besteht PythonModule Klasse -
Methoden | Definition |
---|---|
bind (data_shapes [, label_shapes,…]) | Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann. |
get_params () | Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden. |
init_optimizer ([kvstore, optimizer,…]) | Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen. |
init_params ([initializer, arg_params,…]) | Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände. |
aktualisieren() | Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert. |
update_metric (eval_metric, label [, pre_sliced]) | Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie. |
Attribute
Die folgende Tabelle zeigt die Attribute, die in den Methoden von bestehen PythonModule Klasse -
Attribute | Definition |
---|---|
Datennamen | Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden. |
Datenformen | Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben. |
label_shapes | Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben. |
Ausgabenamen | Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls. |
output_shapes | Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben. |
data_shapes - Folgen Sie dem Link https://mxnet.apache.org für Details.
output_shapes - Weitere Informationen finden Sie unter dem Link unter https://mxnet.apache.org
SequentialModule ([Logger])
Die Basis dieser Klasse ist mxnet.module.base_module.BaseModule. Die SequentialModule-Klasse ist auch ein Containermodul, das mehr als zwei (mehrere) Module miteinander verketten kann.
Methoden
Die folgende Tabelle zeigt die Methoden, aus denen besteht SequentialModule Klasse
Methoden | Definition |
---|---|
add (Modul, ** kwargs) | Dies ist die wichtigste Funktion dieser Klasse. Es fügt der Kette ein Modul hinzu. |
rückwärts ([out_grads]) | Wie der Name schon sagt, implementiert diese Methode die Rückwärtsberechnung. |
bind (data_shapes [, label_shapes,…]) | Es bindet die Symbole, um Ausführende zu konstruieren, und es ist notwendig, bevor man mit dem Modul rechnen kann. |
vorwärts (data_batch [, is_train]) | Wie der Name schon sagt, implementiert diese Methode die Vorwärtsberechnung. Diese Methode unterstützt Datenstapel mit verschiedenen Formen wie unterschiedlichen Stapelgrößen oder unterschiedlichen Bildgrößen. |
get_input_grads ([merge_multi_context]) | Diese Methode ruft die Gradienten zu den Eingaben ab, die in der vorherigen Rückwärtsberechnung berechnet wurden. |
get_outputs ([merge_multi_context]) | Wie der Name schon sagt, erhält diese Methode Ausgaben der vorherigen Vorwärtsberechnung. |
get_params () | Es werden die Parameter abgerufen, insbesondere diejenigen, die möglicherweise Kopien der tatsächlichen Parameter sind, die für die Berechnung auf dem Gerät verwendet werden. |
init_optimizer ([kvstore, optimizer,…]) | Diese Methode installiert und initialisiert die Optimierer. Es wird auch initialisiertkvstore zum Verteilen von Schulungen. |
init_params ([initializer, arg_params,…]) | Wie der Name schon sagt, initialisiert diese Methode die Parameter und Hilfszustände. |
install_monitor (mon) | Diese Methode installiert den Monitor auf allen Executoren. |
aktualisieren() | Diese Methode aktualisiert die angegebenen Parameter entsprechend dem installierten Optimierer. Außerdem werden die im vorherigen Vorwärts-Rückwärts-Stapel berechneten Farbverläufe aktualisiert. |
update_metric (eval_metric, label [, pre_sliced]) | Diese Methode wertet, wie der Name schon sagt, die Bewertungsmetrik für die Ausgaben der letzten Vorwärtsberechnung aus und akkumuliert sie. |
Attribute
Die folgende Tabelle zeigt die Attribute, die in den Methoden der BaseModule-Klasse enthalten sind -
Attribute | Definition |
---|---|
Datennamen | Es besteht aus der Liste der Namen für Daten, die von diesem Modul benötigt werden. |
Datenformen | Es besteht aus der Liste von (Name, Form) Paaren, die die Dateneingaben für dieses Modul angeben. |
label_shapes | Es zeigt die Liste der (Name, Form) Paare, die die Beschriftungseingaben für dieses Modul angeben. |
Ausgabenamen | Es besteht aus der Liste der Namen für die Ausgänge dieses Moduls. |
output_shapes | Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben. |
output_shapes | Es besteht aus der Liste von (Name, Form) Paaren, die die Ausgänge dieses Moduls angeben. |
data_shapes - Der hier angegebene Link https://mxnet.apache.org wird Ihnen helfen, das Attribut im Detail zu verstehen.
output_shapes - Folgen Sie dem Link unter https://mxnet.apache.org/api für Details.
Implementierungsbeispiele
Im folgenden Beispiel erstellen wir eine mxnet Modul.
import mxnet as mx
input_data = mx.symbol.Variable('input_data')
f_connected1 = mx.symbol.FullyConnected(data, name='f_connected1', num_hidden=128)
activation_1 = mx.symbol.Activation(f_connected1, name='relu1', act_type="relu")
f_connected2 = mx.symbol.FullyConnected(activation_1, name = 'f_connected2', num_hidden = 64)
activation_2 = mx.symbol.Activation(f_connected2, name='relu2',
act_type="relu")
f_connected3 = mx.symbol.FullyConnected(activation_2, name='fc3', num_hidden=10)
out = mx.symbol.SoftmaxOutput(f_connected3, name = 'softmax')
mod = mx.mod.Module(out)
print(out)
Output
Die Ausgabe wird unten erwähnt -
<Symbol softmax>
Example
print(mod)
Output
Die Ausgabe wird unten gezeigt -
<mxnet.module.module.Module object at 0x00000123A9892F28>
In diesem Beispiel unten implementieren wir die Vorwärtsberechnung
import mxnet as mx
from collections import namedtuple
Batch = namedtuple('Batch', ['data'])
data = mx.sym.Variable('data')
out = data * 2
mod = mx.mod.Module(symbol=out, label_names=None)
mod.bind(data_shapes=[('data', (1, 10))])
mod.init_params()
data1 = [mx.nd.ones((1, 10))]
mod.forward(Batch(data1))
print (mod.get_outputs()[0].asnumpy())
Output
Wenn Sie den obigen Code ausführen, sollte die folgende Ausgabe angezeigt werden:
[[2. 2. 2. 2. 2. 2. 2. 2. 2. 2.]]
Example
data2 = [mx.nd.ones((3, 5))]
mod.forward(Batch(data2))
print (mod.get_outputs()[0].asnumpy())
Output
Unten ist die Ausgabe des Codes angegeben -
[[2. 2. 2. 2. 2.]
[2. 2. 2. 2. 2.]
[2. 2. 2. 2. 2.]]