Apache Solr - การเพิ่มเอกสาร (XML)

ในบทที่แล้วเราได้อธิบายวิธีการเพิ่มข้อมูลลงใน Solr ซึ่งอยู่ในรูปแบบไฟล์ JSON และ. CSV ในบทนี้เราจะสาธิตวิธีการเพิ่มข้อมูลในดัชนี Apache Solr โดยใช้รูปแบบเอกสาร XML

ข้อมูลตัวอย่าง

สมมติว่าเราจำเป็นต้องเพิ่มข้อมูลต่อไปนี้ในดัชนี Solr โดยใช้รูปแบบไฟล์ XML

รหัสนักศึกษา ชื่อจริง นามสกุล โทรศัพท์ เมือง
001 ราจีฟ เรดดี้ 9848022337 ไฮเดอราบาด
002 สิทธารถ์ ภัตตาคารยา 9848022338 กัลกัตตา
003 Rajesh คันนา 9848022339 เดลี
004 พรีธี Agarwal 9848022330 ปูน
005 ทรัพฐี Mohanty 9848022336 บูบันเนสชวาร์
006 อรชนา มิชร่า 9848022335 เจนไน

การเพิ่มเอกสารโดยใช้ XML

ในการเพิ่มข้อมูลข้างต้นลงในดัชนี Solr เราจำเป็นต้องเตรียมเอกสาร XML ดังที่แสดงด้านล่าง บันทึกเอกสารนี้ในไฟล์ที่มีชื่อsample.xml.

<add> 
   <doc> 
      <field name = "id">001</field> 
      <field name = "first name">Rajiv</field> 
      <field name = "last name">Reddy</field> 
      <field name = "phone">9848022337</field> 
      <field name = "city">Hyderabad</field> 
   </doc>  
   <doc> 
      <field name = "id">002</field> 
      <field name = "first name">Siddarth</field> 
      <field name = "last name">Battacharya</field> 
      <field name = "phone">9848022338</field> 
      <field name = "city">Kolkata</field> 
   </doc>  
   <doc> 
      <field name = "id">003</field> 
      <field name = "first name">Rajesh</field> 
      <field name = "last name">Khanna</field> 
      <field name = "phone">9848022339</field> 
      <field name = "city">Delhi</field> 
   </doc>  
   <doc> 
      <field name = "id">004</field> 
      <field name = "first name">Preethi</field> 
      <field name = "last name">Agarwal</field> 
      <field name = "phone">9848022330</field> 
      <field name = "city">Pune</field> 
   </doc>  
   <doc> 
      <field name = "id">005</field> 
      <field name = "first name">Trupthi</field> 
      <field name = "last name">Mohanthy</field> 
      <field name = "phone">9848022336</field> 
      <field name = "city">Bhuwaeshwar</field> 
   </doc> 
   <doc> 
      <field name = "id">006</field> 
      <field name = "first name">Archana</field> 
      <field name = "last name">Mishra</field> 
      <field name = "phone">9848022335</field> 
      <field name = "city">Chennai</field> 
   </doc> 
</add>

ดังที่คุณสังเกตได้ไฟล์ XML ที่เขียนขึ้นเพื่อเพิ่มข้อมูลลงในดัชนีมีแท็กที่สำคัญสามแท็ก ได้แก่ <add> </add>, <doc> </doc> และ <field> </ field>

  • add- นี่คือแท็กรากสำหรับเพิ่มเอกสารลงในดัชนี ประกอบด้วยเอกสารอย่างน้อยหนึ่งรายการที่จะเพิ่ม

  • doc- เอกสารที่เราเพิ่มควรอยู่ในแท็ก <doc> </doc> เอกสารนี้ประกอบด้วยข้อมูลในรูปแบบของเขตข้อมูล

  • field - แท็กฟิลด์เก็บชื่อและค่าของฟิลด์ของเอกสาร

หลังจากเตรียมเอกสารแล้วคุณสามารถเพิ่มเอกสารนี้ลงในดัชนีโดยใช้วิธีการใด ๆ ที่กล่าวถึงในบทก่อนหน้า

สมมติว่าไฟล์ XML มีอยู่ในไฟล์ bin ไดเร็กทอรีของ Solr และจะถูกสร้างดัชนีในคอร์ที่ชื่อ my_coreจากนั้นคุณสามารถเพิ่มลงในดัชนี Solr โดยใช้ไฟล์ post เครื่องมือดังต่อไปนี้ -

[Hadoop@localhost bin]$ ./post -c my_core sample.xml

ในการดำเนินการคำสั่งดังกล่าวคุณจะได้รับผลลัพธ์ต่อไปนี้

/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-
core6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files 
org.apache.Solr.util.SimplePostTool sample.xml 
SimplePostTool version 5.0.0 
Posting files to [base] url http://localhost:8983/Solr/my_core/update... 
Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,
xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log 
POSTing file sample.xml (application/xml) to [base] 
1 files indexed. 
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update... 
Time spent: 0:00:00.201

การยืนยัน

ไปที่หน้าแรกของเว็บอินเตอร์เฟส Apache Solr แล้วเลือกแกน my_core. พยายามดึงเอกสารทั้งหมดโดยส่งข้อความค้นหา“:” ในพื้นที่ข้อความqและดำเนินการค้นหา ในการดำเนินการคุณสามารถสังเกตได้ว่าข้อมูลที่ต้องการถูกเพิ่มลงในดัชนี Solr