सकोप - संस्थापन

जैसा कि सोकूप हादोप की एक उप-परियोजना है, यह केवल लिनक्स ऑपरेटिंग सिस्टम पर काम कर सकता है। अपने सिस्टम पर Sqoop स्थापित करने के लिए नीचे दिए गए चरणों का पालन करें।

चरण 1: जाव स्थापना की पुष्टि

Sqoop को स्थापित करने से पहले आपको अपने सिस्टम पर जावा इंस्टॉल करना होगा। निम्नलिखित कमांड का उपयोग करके जावा इंस्टॉलेशन को सत्यापित करते हैं -

$ java –version

यदि जावा आपके सिस्टम पर पहले से इंस्टॉल है, तो आपको निम्न प्रतिक्रिया देखने को मिलती है -

java version "1.7.0_71"
Java(TM) SE Runtime Environment (build 1.7.0_71-b13)
Java HotSpot(TM) Client VM (build 25.0-b02, mixed mode)

यदि जावा आपके सिस्टम पर स्थापित नहीं है, तो नीचे दिए गए चरणों का पालन करें।

जावा स्थापित कर रहा है

अपने सिस्टम पर जावा को स्थापित करने के लिए नीचे दिए गए सरल चरणों का पालन करें।

चरण 1

निम्नलिखित लिंक पर जाकर जावा (JDK <नवीनतम संस्करण> - X64.tar.gz) डाउनलोड करें ।

फिर आपके सिस्टम पर jdk-7u71-linux-x64.tar.gz डाउनलोड हो जाएगा।

चरण 2

आम तौर पर, आप डाउनलोड किए गए जावा फ़ाइल को डाउनलोड फ़ोल्डर में पा सकते हैं। इसे सत्यापित करें और निम्न आदेशों का उपयोग करके jdk-7u71-linux-x64.gz फ़ाइल निकालें।

$ cd Downloads/
$ ls
jdk-7u71-linux-x64.gz
$ tar zxf jdk-7u71-linux-x64.gz
$ ls
jdk1.7.0_71 jdk-7u71-linux-x64.gz

चरण 3

जावा को सभी उपयोगकर्ताओं के लिए उपलब्ध कराने के लिए, आपको इसे "usr / स्थानीय /" स्थान पर ले जाना होगा। रूट खोलें, और निम्न कमांड टाइप करें।

$ su
password:

# mv jdk1.7.0_71 /usr/local/java
# exitStep IV:

चरण 4

PATH और JAVA_HOME चर सेट करने के लिए, ~ / .bashrc फ़ाइल में निम्न कमांड जोड़ें।

export JAVA_HOME=/usr/local/java
export PATH=$PATH:$JAVA_HOME/bin

अब वर्तमान में चल रहे सिस्टम में सभी परिवर्तनों को लागू करें।

$ source ~/.bashrc

चरण 5

जावा विकल्प को कॉन्फ़िगर करने के लिए निम्नलिखित कमांड्स का उपयोग करें -

# alternatives --install /usr/bin/java java usr/local/java/bin/java 2
# alternatives --install /usr/bin/javac javac usr/local/java/bin/javac 2
# alternatives --install /usr/bin/jar jar usr/local/java/bin/jar 2

# alternatives --set java usr/local/java/bin/java
# alternatives --set javac usr/local/java/bin/javac
# alternatives --set jar usr/local/java/bin/jar

अब कमांड का उपयोग करके स्थापना को सत्यापित करें java -version ऊपर बताए अनुसार टर्मिनल से।

चरण 2: सत्यापन Hadoop स्थापना

Sqoop स्थापित करने से पहले Hadoop को आपके सिस्टम पर स्थापित किया जाना चाहिए। आइए निम्नलिखित कमांड का उपयोग करके Hadoop इंस्टॉलेशन को सत्यापित करें -

$ hadoop version

यदि आपके सिस्टम पर Hadoop पहले से ही स्थापित है, तो आपको निम्न प्रतिक्रिया मिलेगी -

Hadoop 2.4.1
--
Subversion https://svn.apache.org/repos/asf/hadoop/common -r 1529768
Compiled by hortonmu on 2013-10-07T06:28Z
Compiled with protoc 2.5.0
From source with checksum 79e53ce7994d1628b240f09af91e1af4

यदि आपके सिस्टम पर Hadoop स्थापित नहीं है, तो निम्न चरणों के साथ आगे बढ़ें -

Hadoop डाउनलोड करना

निम्नलिखित कमांड का उपयोग करके अपाचे सॉफ्टवेयर फाउंडेशन से Hadoop 2.4.1 डाउनलोड करें और निकालें।

$ su
password:

# cd /usr/local
# wget http://apache.claz.org/hadoop/common/hadoop-2.4.1/
hadoop-2.4.1.tar.gz
# tar xzf hadoop-2.4.1.tar.gz
# mv hadoop-2.4.1/* to hadoop/
# exit

छद्म वितरित मोड में Hadoop स्थापित करना

छद्म-वितरित मोड में Hadoop 2.4.1 को स्थापित करने के लिए नीचे दिए गए चरणों का पालन करें।

चरण 1: Hadoop की स्थापना

आप निम्न कमांड को ~ / .bashrc फ़ाइल में जोड़कर Hadoop परिवेश चर सेट कर सकते हैं।

export HADOOP_HOME=/usr/local/hadoop
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

अब, वर्तमान चल रहे सिस्टम में सभी परिवर्तनों को लागू करें।

$ source ~/.bashrc

चरण 2: Hadoop कॉन्फ़िगरेशन

आप "HADOOP_HOME / etc / hadoop" स्थान में सभी Hadoop कॉन्फ़िगरेशन फ़ाइलों को पा सकते हैं। आपको अपने Hadoop बुनियादी ढांचे के अनुसार उन कॉन्फ़िगरेशन फ़ाइलों में उपयुक्त परिवर्तन करने की आवश्यकता है।

$ cd $HADOOP_HOME/etc/hadoop

जावा का उपयोग करके Hadoop कार्यक्रमों को विकसित करने के लिए, आपको जावा वातावरण चर को रीसेट करना होगा hadoop-env.sh अपने सिस्टम में जावा के स्थान के साथ JAVA_HOME मान को बदलकर फ़ाइल करें।

export JAVA_HOME=/usr/local/java

नीचे दी गई फ़ाइलों की सूची है जिसे आपको Hadoop को कॉन्फ़िगर करने के लिए संपादित करने की आवश्यकता है।

core-site.xml

कोर- site.xml फ़ाइल में Hadoop उदाहरण के लिए उपयोग की जाने वाली पोर्ट संख्या, फ़ाइल सिस्टम के लिए आवंटित मेमोरी, डेटा को संग्रहीत करने के लिए मेमोरी की सीमा और रीड / राइट बफ़र्स के आकार जैसी जानकारी होती है।

कोर- site.xml खोलें और <कॉन्फ़िगरेशन> और </ कॉन्फ़िगरेशन> टैग के बीच निम्न गुण जोड़ें।

<configuration>
   <property>
      <name>fs.default.name</name>
      <value>hdfs://localhost:9000 </value>
   </property>
</configuration>

hdfs-site.xml

Hdfs-site.xml फ़ाइल में आपके स्थानीय फ़ाइल सिस्टम के प्रतिकृति डेटा, नामेनोड पथ और डेटाैनोड पथ के मूल्य जैसी जानकारी होती है। इसका अर्थ है वह स्थान जहाँ आप Hadoop अवसंरचना को संग्रहीत करना चाहते हैं।

आइए हम निम्नलिखित आंकड़ों को मानते हैं।

dfs.replication (data replication value) = 1

(In the following path /hadoop/ is the user name.
hadoopinfra/hdfs/namenode is the directory created by hdfs file system.)
namenode path = //home/hadoop/hadoopinfra/hdfs/namenode

(hadoopinfra/hdfs/datanode is the directory created by hdfs file system.)
datanode path = //home/hadoop/hadoopinfra/hdfs/datanode

इस फ़ाइल को खोलें और इस फ़ाइल में <कॉन्फ़िगरेशन>, </ कॉन्फ़िगरेशन> टैग के बीच निम्न गुण जोड़ें।

<configuration>
   <property>
      <name>dfs.replication</name>
      <value>1</value>
   </property>
   
   <property>
      <name>dfs.name.dir</name>
      <value>file:///home/hadoop/hadoopinfra/hdfs/namenode </value>
   </property>
   
   <property>
      <name>dfs.data.dir</name>
      <value>file:///home/hadoop/hadoopinfra/hdfs/datanode </value>
   </property>
</configuration>

Note - उपरोक्त फ़ाइल में, सभी संपत्ति मूल्य उपयोगकर्ता-परिभाषित हैं और आप अपने Hadoop बुनियादी ढांचे के अनुसार परिवर्तन कर सकते हैं।

yarn-site.xml

इस फ़ाइल का उपयोग यार्न को Hadoop में कॉन्फ़िगर करने के लिए किया जाता है। यार्न-site.xml फ़ाइल खोलें और इस फ़ाइल में <कॉन्फ़िगरेशन>, </ कॉन्फ़िगरेशन> टैग के बीच निम्न गुण जोड़ें।

<configuration>
   <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
   </property>
</configuration>

mapred-site.xml

इस फ़ाइल का उपयोग यह निर्दिष्ट करने के लिए किया जाता है कि हम किस MapReduce ढांचे का उपयोग कर रहे हैं। डिफ़ॉल्ट रूप से, Hadoop में यार्न-site.xml का टेम्प्लेट होता है। सबसे पहले, आपको निम्न आदेश का उपयोग करके फाइल को mapred-site.xml.template से mapred-site.xml फाइल में कॉपी करना होगा।

$ cp mapred-site.xml.template mapred-site.xml

Mapred-site.xml फ़ाइल खोलें और इस फ़ाइल में <कॉन्फ़िगरेशन>, </ कॉन्फ़िगरेशन> टैग के बीच निम्न गुण जोड़ें।

<configuration>
   <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
   </property>
</configuration>

Hadoop स्थापना का सत्यापन

Hadoop स्थापना को सत्यापित करने के लिए निम्न चरणों का उपयोग किया जाता है।

चरण 1: नाम नोड सेटअप

निम्नानुसार "hdfs namenode -format" कमांड का उपयोग करके नेमेनोड सेट करें।

$ cd ~
$ hdfs namenode -format

अपेक्षित परिणाम इस प्रकार है।

10/24/14 21:30:55 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = localhost/192.168.1.11
STARTUP_MSG: args = [-format]
STARTUP_MSG: version = 2.4.1
...
...
10/24/14 21:30:56 INFO common.Storage: Storage directory
/home/hadoop/hadoopinfra/hdfs/namenode has been successfully formatted.
10/24/14 21:30:56 INFO namenode.NNStorageRetentionManager: Going to
retain 1 images with txid >= 0
10/24/14 21:30:56 INFO util.ExitUtil: Exiting with status 0
10/24/14 21:30:56 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/192.168.1.11
************************************************************/

चरण 2: सत्यापन Hadoop dfs

Dfs शुरू करने के लिए निम्न कमांड का उपयोग किया जाता है। इस आदेश को निष्पादित करने से आपका Hadoop फ़ाइल सिस्टम प्रारंभ हो जाएगा।

$ start-dfs.sh

अपेक्षित उत्पादन निम्नानुसार है -

10/24/14 21:37:56
Starting namenodes on [localhost]
localhost: starting namenode, logging to /home/hadoop/hadoop-
2.4.1/logs/hadoop-hadoop-namenode-localhost.out
localhost: starting datanode, logging to /home/hadoop/hadoop-
2.4.1/logs/hadoop-hadoop-datanode-localhost.out
Starting secondary namenodes [0.0.0.0]

चरण 3: यार्न स्क्रिप्ट का सत्यापन

यार्न स्क्रिप्ट शुरू करने के लिए निम्न कमांड का उपयोग किया जाता है। इस आदेश को निष्पादित करने से आपके यार्न डेमन शुरू हो जाएंगे।

$ start-yarn.sh

अपेक्षित उत्पादन निम्नानुसार है -

starting yarn daemons
starting resourcemanager, logging to /home/hadoop/hadoop-
2.4.1/logs/yarn-hadoop-resourcemanager-localhost.out
localhost: starting node manager, logging to /home/hadoop/hadoop-
2.4.1/logs/yarn-hadoop-nodemanager-localhost.out

चरण 4: ब्राउज़र पर Hadoop तक पहुँचना

Hadoop तक पहुंचने के लिए डिफ़ॉल्ट पोर्ट संख्या 50070 है। अपने ब्राउज़र पर Hadoop सेवाएं प्राप्त करने के लिए निम्न URL का उपयोग करें।

http://localhost:50070/

निम्न छवि एक Hadoop ब्राउज़र को दर्शाती है।

चरण 5: क्लस्टर के लिए सभी एप्लिकेशन सत्यापित करें

क्लस्टर के सभी अनुप्रयोगों तक पहुँचने के लिए डिफ़ॉल्ट पोर्ट संख्या 8088 है। इस सेवा पर जाने के लिए निम्न यूआरएल का उपयोग करें।

http://localhost:8088/

निम्न छवि Hadoop क्लस्टर ब्राउज़र को दर्शाती है।

चरण 3: Sqoop डाउनलोड करना

हम निम्न लिंक से Sqoop का नवीनतम संस्करण डाउनलोड कर सकते हैं। इस ट्यूटोरियल के लिए, हम संस्करण 1.4.5 का उपयोग कर रहे हैं, अर्थात्।sqoop-1.4.5.bin__hadoop-2.0.4-alpha.tar.gz

चरण 4: Sqoop स्थापित करना

Sqoop टार बॉल को निकालने और इसे "/ usr / lib / squp" डायरेक्टरी में ले जाने के लिए निम्न कमांड्स का उपयोग किया जाता है।

$tar -xvf sqoop-1.4.4.bin__hadoop-2.0.4-alpha.tar.gz
$ su
password:

# mv sqoop-1.4.4.bin__hadoop-2.0.4-alpha /usr/lib/sqoop
#exit

चरण 5: bashrc कॉन्फ़िगर करना

आपको निम्नलिखित / ~ लाइनों को जोड़कर Sqoop वातावरण स्थापित करना होगा.bashrc फ़ाइल -

#Sqoop
export SQOOP_HOME=/usr/lib/sqoop export PATH=$PATH:$SQOOP_HOME/bin

निम्नलिखित कमांड का उपयोग ~ / निष्पादित करने के लिए किया जाता है.bashrc फ़ाइल।

$ source ~/.bashrc

चरण 6: Sqoop को कॉन्फ़िगर करना

सैदूप को हडोप के साथ कॉन्फ़िगर करने के लिए, आपको एडिट करना होगा sqoop-env.sh फ़ाइल, जिसमें रखा गया है $SQOOP_HOME/confनिर्देशिका। सबसे पहले, Sqoop config directory में रीडायरेक्ट करें और निम्न कमांड का उपयोग करके टेम्पलेट फ़ाइल को कॉपी करें -

$ cd $SQOOP_HOME/conf
$ mv sqoop-env-template.sh sqoop-env.sh

खुला हुआ sqoop-env.sh और निम्नलिखित पंक्तियों को संपादित करें -

export HADOOP_COMMON_HOME=/usr/local/hadoop 
export HADOOP_MAPRED_HOME=/usr/local/hadoop

चरण 7: mysql-कनेक्टर-जावा को डाउनलोड और कॉन्फ़िगर करें

हम डाउनलोड कर सकते हैं mysql-connector-java-5.1.30.tar.gzनिम्नलिखित लिंक से फ़ाइल ।

Mysql-कनेक्टर-जावा टैरबॉल निकालने और स्थानांतरित करने के लिए निम्न कमांड का उपयोग किया जाता है mysql-connector-java-5.1.30-bin.jar / usr / lib / squp / lib निर्देशिका के लिए।

$ tar -zxf mysql-connector-java-5.1.30.tar.gz
$ su
password:

# cd mysql-connector-java-5.1.30
# mv mysql-connector-java-5.1.30-bin.jar /usr/lib/sqoop/lib

चरण 8: Sqoop सत्यापित करना

Sqoop संस्करण को सत्यापित करने के लिए निम्न कमांड का उपयोग किया जाता है।

$ cd $SQOOP_HOME/bin
$ sqoop-version

अपेक्षित उत्पादन -

14/12/17 14:52:32 INFO sqoop.Sqoop: Running Sqoop version: 1.4.5
Sqoop 1.4.5 git commit id 5b34accaca7de251fc91161733f906af2eddbe83
Compiled by abe on Fri Aug 1 11:19:26 PDT 2014

Sqoop स्थापना पूर्ण है।