Apache Pig Tutorial
Apache Pig ist eine Abstraktion über MapReduce. Es ist ein Tool / eine Plattform, mit der größere Datensätze analysiert werden, die sie als Datenflüsse darstellen. Schwein wird in der Regel mit verwendetHadoop;; Wir können alle Datenmanipulationsvorgänge in Hadoop mit Pig ausführen.
Dieses Tutorial richtet sich an alle Fachleute, die an Hadoop arbeiten und MapReduce-Vorgänge ausführen möchten, ohne komplexe Codes in Java eingeben zu müssen.
Um dieses Tutorial optimal nutzen zu können, sollten Sie die Grundlagen von Hadoop- und HDFS-Befehlen gut verstehen. Es wird sicherlich helfen, wenn Sie gut in SQL sind.