Apache Solr - Menambahkan Dokumen (XML)

Pada bab sebelumnya telah dijelaskan cara menambahkan data ke dalam Solr yang berformat file JSON dan .CSV. Pada bab ini, kami akan mendemonstrasikan cara menambahkan data dalam indeks Apache Solr menggunakan format dokumen XML.

Contoh data

Misalkan kita perlu menambahkan data berikut ke indeks Solr menggunakan format file XML.

Identitas Siswa Nama depan Nama keluarga Telepon Kota
001 Rajiv Reddy 9848022337 Hyderabad
002 Siddharth Bhattacharya 9848022338 Kolkata
003 Rajesh Khanna 9848022339 Delhi
004 Preethi Agarwal 9848022330 Pune
005 Trupthi Mohanty 9848022336 Bhubaneshwar
006 Archana Mishra 9848022335 Chennai

Menambahkan Dokumen Menggunakan XML

Untuk menambahkan data di atas ke dalam indeks Solr, kita perlu menyiapkan dokumen XML, seperti gambar di bawah ini. Simpan dokumen ini dalam file dengan namasample.xml.

<add> 
   <doc> 
      <field name = "id">001</field> 
      <field name = "first name">Rajiv</field> 
      <field name = "last name">Reddy</field> 
      <field name = "phone">9848022337</field> 
      <field name = "city">Hyderabad</field> 
   </doc>  
   <doc> 
      <field name = "id">002</field> 
      <field name = "first name">Siddarth</field> 
      <field name = "last name">Battacharya</field> 
      <field name = "phone">9848022338</field> 
      <field name = "city">Kolkata</field> 
   </doc>  
   <doc> 
      <field name = "id">003</field> 
      <field name = "first name">Rajesh</field> 
      <field name = "last name">Khanna</field> 
      <field name = "phone">9848022339</field> 
      <field name = "city">Delhi</field> 
   </doc>  
   <doc> 
      <field name = "id">004</field> 
      <field name = "first name">Preethi</field> 
      <field name = "last name">Agarwal</field> 
      <field name = "phone">9848022330</field> 
      <field name = "city">Pune</field> 
   </doc>  
   <doc> 
      <field name = "id">005</field> 
      <field name = "first name">Trupthi</field> 
      <field name = "last name">Mohanthy</field> 
      <field name = "phone">9848022336</field> 
      <field name = "city">Bhuwaeshwar</field> 
   </doc> 
   <doc> 
      <field name = "id">006</field> 
      <field name = "first name">Archana</field> 
      <field name = "last name">Mishra</field> 
      <field name = "phone">9848022335</field> 
      <field name = "city">Chennai</field> 
   </doc> 
</add>

Seperti yang bisa Anda amati, file XML yang ditulis untuk menambahkan data ke indeks berisi tiga tag penting yaitu, <add> </add>, <doc> </doc>, dan <field> </ field>.

  • add- Ini adalah tag root untuk menambahkan dokumen ke indeks. Ini berisi satu atau lebih dokumen yang akan ditambahkan.

  • doc- Dokumen yang kita tambahkan harus dibungkus dalam tag <doc> </doc>. Dokumen ini berisi data-data berupa field.

  • field - Tag bidang menyimpan nama dan nilai bidang dokumen.

Setelah menyiapkan dokumen, Anda dapat menambahkan dokumen ini ke indeks menggunakan salah satu cara yang dibahas di bab sebelumnya.

Misalkan file XML ada di bin direktori Solr dan itu akan diindeks dalam nama inti my_core, lalu Anda dapat menambahkannya ke indeks Solr menggunakan file post alat sebagai berikut -

[Hadoop@localhost bin]$ ./post -c my_core sample.xml

Saat menjalankan perintah di atas, Anda akan mendapatkan output berikut.

/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-
core6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files 
org.apache.Solr.util.SimplePostTool sample.xml 
SimplePostTool version 5.0.0 
Posting files to [base] url http://localhost:8983/Solr/my_core/update... 
Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,
xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log 
POSTing file sample.xml (application/xml) to [base] 
1 files indexed. 
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update... 
Time spent: 0:00:00.201

Verifikasi

Kunjungi beranda antarmuka web Apache Solr dan pilih intinya my_core. Cobalah untuk mengambil semua dokumen dengan meneruskan kueri ":" di area teksqdan jalankan kueri. Saat menjalankan, Anda dapat mengamati bahwa data yang diinginkan ditambahkan ke indeks Solr.