Apache Solr - Menambahkan Dokumen (XML)
Pada bab sebelumnya telah dijelaskan cara menambahkan data ke dalam Solr yang berformat file JSON dan .CSV. Pada bab ini, kami akan mendemonstrasikan cara menambahkan data dalam indeks Apache Solr menggunakan format dokumen XML.
Contoh data
Misalkan kita perlu menambahkan data berikut ke indeks Solr menggunakan format file XML.
Identitas Siswa | Nama depan | Nama keluarga | Telepon | Kota |
---|---|---|---|---|
001 | Rajiv | Reddy | 9848022337 | Hyderabad |
002 | Siddharth | Bhattacharya | 9848022338 | Kolkata |
003 | Rajesh | Khanna | 9848022339 | Delhi |
004 | Preethi | Agarwal | 9848022330 | Pune |
005 | Trupthi | Mohanty | 9848022336 | Bhubaneshwar |
006 | Archana | Mishra | 9848022335 | Chennai |
Menambahkan Dokumen Menggunakan XML
Untuk menambahkan data di atas ke dalam indeks Solr, kita perlu menyiapkan dokumen XML, seperti gambar di bawah ini. Simpan dokumen ini dalam file dengan namasample.xml.
<add>
<doc>
<field name = "id">001</field>
<field name = "first name">Rajiv</field>
<field name = "last name">Reddy</field>
<field name = "phone">9848022337</field>
<field name = "city">Hyderabad</field>
</doc>
<doc>
<field name = "id">002</field>
<field name = "first name">Siddarth</field>
<field name = "last name">Battacharya</field>
<field name = "phone">9848022338</field>
<field name = "city">Kolkata</field>
</doc>
<doc>
<field name = "id">003</field>
<field name = "first name">Rajesh</field>
<field name = "last name">Khanna</field>
<field name = "phone">9848022339</field>
<field name = "city">Delhi</field>
</doc>
<doc>
<field name = "id">004</field>
<field name = "first name">Preethi</field>
<field name = "last name">Agarwal</field>
<field name = "phone">9848022330</field>
<field name = "city">Pune</field>
</doc>
<doc>
<field name = "id">005</field>
<field name = "first name">Trupthi</field>
<field name = "last name">Mohanthy</field>
<field name = "phone">9848022336</field>
<field name = "city">Bhuwaeshwar</field>
</doc>
<doc>
<field name = "id">006</field>
<field name = "first name">Archana</field>
<field name = "last name">Mishra</field>
<field name = "phone">9848022335</field>
<field name = "city">Chennai</field>
</doc>
</add>
Seperti yang bisa Anda amati, file XML yang ditulis untuk menambahkan data ke indeks berisi tiga tag penting yaitu, <add> </add>, <doc> </doc>, dan <field> </ field>.
add- Ini adalah tag root untuk menambahkan dokumen ke indeks. Ini berisi satu atau lebih dokumen yang akan ditambahkan.
doc- Dokumen yang kita tambahkan harus dibungkus dalam tag <doc> </doc>. Dokumen ini berisi data-data berupa field.
field - Tag bidang menyimpan nama dan nilai bidang dokumen.
Setelah menyiapkan dokumen, Anda dapat menambahkan dokumen ini ke indeks menggunakan salah satu cara yang dibahas di bab sebelumnya.
Misalkan file XML ada di bin direktori Solr dan itu akan diindeks dalam nama inti my_core, lalu Anda dapat menambahkannya ke indeks Solr menggunakan file post alat sebagai berikut -
[Hadoop@localhost bin]$ ./post -c my_core sample.xml
Saat menjalankan perintah di atas, Anda akan mendapatkan output berikut.
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-
core6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files
org.apache.Solr.util.SimplePostTool sample.xml
SimplePostTool version 5.0.0
Posting files to [base] url http://localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,
xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
POSTing file sample.xml (application/xml) to [base]
1 files indexed.
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.201
Verifikasi
Kunjungi beranda antarmuka web Apache Solr dan pilih intinya my_core. Cobalah untuk mengambil semua dokumen dengan meneruskan kueri ":" di area teksqdan jalankan kueri. Saat menjalankan, Anda dapat mengamati bahwa data yang diinginkan ditambahkan ke indeks Solr.