Apache Solr - Di Hadoop
Solr dapat digunakan bersama Hadoop. Karena Hadoop menangani data dalam jumlah besar, Solr membantu kami menemukan informasi yang diperlukan dari sumber yang begitu besar. Di bagian ini, beri tahu kami bagaimana Anda dapat menginstal Hadoop di sistem Anda.
Mendownload Hadoop
Diberikan di bawah ini adalah langkah-langkah yang harus diikuti untuk mengunduh Hadoop ke sistem Anda.
Step 1- Buka beranda Hadoop. Anda dapat menggunakan tautan - www.hadoop.apache.org/ . Klik link tersebutReleases, seperti yang disorot di tangkapan layar berikut.
Ini akan mengarahkan Anda ke Apache Hadoop Releases halaman yang berisi link untuk mirror file sumber dan biner dari berbagai versi Hadoop sebagai berikut -
Step 2 - Pilih versi terbaru Hadoop (dalam tutorial kami, ini adalah 2.6.4) dan klik binary link. Ini akan membawa Anda ke halaman di mana mirror untuk biner Hadoop tersedia. Klik salah satu mirror ini untuk mendownload Hadoop.
Unduh Hadoop dari Command Prompt
Buka terminal Linux dan login sebagai pengguna super.
$ su
password:
Buka direktori tempat Anda perlu menginstal Hadoop, dan simpan file di sana menggunakan tautan yang disalin sebelumnya, seperti yang ditunjukkan pada blok kode berikut.
# cd /usr/local
# wget http://redrockdigimark.com/apachemirror/hadoop/common/hadoop-
2.6.4/hadoop-2.6.4.tar.gz
Setelah mengunduh Hadoop, ekstrak menggunakan perintah berikut.
# tar zxvf hadoop-2.6.4.tar.gz
# mkdir hadoop
# mv hadoop-2.6.4/* to hadoop/
# exit
Memasang Hadoop
Ikuti langkah-langkah yang diberikan di bawah ini untuk menginstal Hadoop dalam mode pseudo-didistribusikan.
Langkah 1: Menyiapkan Hadoop
Anda dapat menyetel variabel lingkungan Hadoop dengan menambahkan perintah berikut ke ~/.bashrc mengajukan.
export HADOOP_HOME = /usr/local/hadoop export
HADOOP_MAPRED_HOME = $HADOOP_HOME export
HADOOP_COMMON_HOME = $HADOOP_HOME export
HADOOP_HDFS_HOME = $HADOOP_HOME export
YARN_HOME = $HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR = $HADOOP_HOME/lib/native
export PATH = $PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_INSTALL = $HADOOP_HOME
Selanjutnya, terapkan semua perubahan ke dalam sistem yang sedang berjalan.
$ source ~/.bashrc
Langkah 2: Konfigurasi Hadoop
Anda dapat menemukan semua file konfigurasi Hadoop di lokasi "$ HADOOP_HOME / etc / hadoop". Diperlukan untuk membuat perubahan pada file konfigurasi tersebut sesuai dengan infrastruktur Hadoop Anda.
$ cd $HADOOP_HOME/etc/hadoop
Untuk mengembangkan program Hadoop di Java, Anda harus mengatur ulang variabel lingkungan Java di hadoop-env.sh mengajukan dengan mengganti JAVA_HOME nilai dengan lokasi Java di sistem Anda.
export JAVA_HOME = /usr/local/jdk1.7.0_71
Berikut ini adalah daftar file yang harus Anda edit untuk mengkonfigurasi Hadoop -
- core-site.xml
- hdfs-site.xml
- yarn-site.xml
- mapred-site.xml
core-site.xml
Itu core-site.xml file berisi informasi seperti nomor port yang digunakan untuk instance Hadoop, memori yang dialokasikan untuk sistem file, batas memori untuk menyimpan data, dan ukuran buffer Baca / Tulis.
Buka core-site.xml dan tambahkan properti berikut di dalam tag <configuration>, </configuration>.
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
hdfs-site.xml
Itu hdfs-site.xml file berisi informasi seperti nilai data replikasi, namenode jalan, dan datanodejalur sistem file lokal Anda. Artinya tempat di mana Anda ingin menyimpan infrastruktur Hadoop.
Mari kita asumsikan data berikut.
dfs.replication (data replication value) = 1
(In the below given path /hadoop/ is the user name.
hadoopinfra/hdfs/namenode is the directory created by hdfs file system.)
namenode path = //home/hadoop/hadoopinfra/hdfs/namenode
(hadoopinfra/hdfs/datanode is the directory created by hdfs file system.)
datanode path = //home/hadoop/hadoopinfra/hdfs/datanode
Buka file ini dan tambahkan properti berikut di dalam tag <configuration>, </configuration>.
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>file:///home/hadoop/hadoopinfra/hdfs/namenode</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>file:///home/hadoop/hadoopinfra/hdfs/datanode</value>
</property>
</configuration>
Note - Dalam file di atas, semua nilai properti ditentukan pengguna dan Anda dapat membuat perubahan sesuai dengan infrastruktur Hadoop Anda.
yarn-site.xml
File ini digunakan untuk mengkonfigurasi benang menjadi Hadoop. Buka file yarn-site.xml dan tambahkan properti berikut di antara tag <configuration>, </configuration> di file ini.
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
mapred-site.xml
File ini digunakan untuk menentukan kerangka MapReduce mana yang kita gunakan. Secara default, Hadoop berisi template benang-situs.xml. Pertama-tama, Anda harus menyalin file darimapred-site,xml.template untuk mapred-site.xml file menggunakan perintah berikut.
$ cp mapred-site.xml.template mapred-site.xml
Buka mapred-site.xml file dan tambahkan properti berikut di dalam tag <configuration>, </configuration>.
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
Memverifikasi Instalasi Hadoop
Langkah-langkah berikut digunakan untuk memverifikasi penginstalan Hadoop.
Langkah 1: Penyiapan Node Nama
Siapkan namenode menggunakan perintah "hdfs namenode –format" sebagai berikut.
$ cd ~
$ hdfs namenode -format
Hasil yang diharapkan adalah sebagai berikut.
10/24/14 21:30:55 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = localhost/192.168.1.11
STARTUP_MSG: args = [-format] STARTUP_MSG: version = 2.6.4
...
...
10/24/14 21:30:56 INFO common.Storage: Storage directory
/home/hadoop/hadoopinfra/hdfs/namenode has been successfully formatted.
10/24/14 21:30:56 INFO namenode.NNStorageRetentionManager: Going to retain 1
images with txid >= 0
10/24/14 21:30:56 INFO util.ExitUtil: Exiting with status 0
10/24/14 21:30:56 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/192.168.1.11
************************************************************/
Langkah 2: Memverifikasi Hadoop dfs
Perintah berikut digunakan untuk memulai Hadoop dfs. Menjalankan perintah ini akan memulai sistem file Hadoop Anda.
$ start-dfs.sh
Output yang diharapkan adalah sebagai berikut -
10/24/14 21:37:56
Starting namenodes on [localhost]
localhost: starting namenode, logging to /home/hadoop/hadoop-2.6.4/logs/hadoop-
hadoop-namenode-localhost.out
localhost: starting datanode, logging to /home/hadoop/hadoop-2.6.4/logs/hadoop-
hadoop-datanode-localhost.out
Starting secondary namenodes [0.0.0.0]
Langkah 3: Memverifikasi Skrip Benang
Perintah berikut digunakan untuk memulai skrip Benang. Menjalankan perintah ini akan memulai iblis Benang Anda.
$ start-yarn.sh
Output yang diharapkan sebagai berikut -
starting yarn daemons
starting resourcemanager, logging to /home/hadoop/hadoop-2.6.4/logs/yarn-
hadoop-resourcemanager-localhost.out
localhost: starting nodemanager, logging to /home/hadoop/hadoop-
2.6.4/logs/yarn-hadoop-nodemanager-localhost.out
Langkah 4: Mengakses Hadoop di Browser
Nomor port default untuk mengakses Hadoop adalah 50070. Gunakan URL berikut untuk mendapatkan layanan Hadoop di browser.
http://localhost:50070/
Menginstal Solr di Hadoop
Ikuti langkah-langkah yang diberikan di bawah ini untuk mengunduh dan menginstal Solr.
Langkah 1
Buka beranda Apache Solr dengan mengklik tautan berikut - https://lucene.apache.org/solr/
Langkah 2
Klik download button(disorot pada tangkapan layar di atas). Saat mengklik, Anda akan diarahkan ke halaman di mana Anda memiliki berbagai mirror Apache Solr. Pilih cermin dan klik di atasnya, yang akan mengarahkan Anda ke halaman tempat Anda dapat mengunduh file sumber dan biner Apache Solr, seperti yang ditunjukkan pada tangkapan layar berikut.
LANGKAH 3
Saat mengklik, folder bernama Solr-6.2.0.tqzakan diunduh di folder unduhan sistem Anda. Ekstrak konten folder yang diunduh.
LANGKAH 4
Buat folder bernama Solr di direktori home Hadoop dan pindahkan konten folder yang diekstrak ke sana, seperti yang ditunjukkan di bawah ini.
$ mkdir Solr
$ cd Downloads
$ mv Solr-6.2.0 /home/Hadoop/
Verifikasi
Jelajahi bin folder dari direktori Home Solr dan verifikasi penginstalan menggunakan version opsi, seperti yang ditunjukkan pada blok kode berikut.
$ cd bin/
$ ./Solr version
6.2.0
Setting rumah dan jalan setapak
Buka .bashrc file menggunakan perintah berikut -
[Hadoop@localhost ~]$ source ~/.bashrc
Sekarang atur direktori home dan path untuk Apache Solr sebagai berikut -
export SOLR_HOME = /home/Hadoop/Solr
export PATH = $PATH:/$SOLR_HOME/bin/
Buka terminal dan jalankan perintah berikut -
[Hadoop@localhost Solr]$ source ~/.bashrc
Sekarang, Anda dapat menjalankan perintah Solr dari direktori manapun.