Apache Solr - การเพิ่มเอกสาร (XML)
ในบทที่แล้วเราได้อธิบายวิธีการเพิ่มข้อมูลลงใน Solr ซึ่งอยู่ในรูปแบบไฟล์ JSON และ. CSV ในบทนี้เราจะสาธิตวิธีการเพิ่มข้อมูลในดัชนี Apache Solr โดยใช้รูปแบบเอกสาร XML
ข้อมูลตัวอย่าง
สมมติว่าเราจำเป็นต้องเพิ่มข้อมูลต่อไปนี้ในดัชนี Solr โดยใช้รูปแบบไฟล์ XML
รหัสนักศึกษา | ชื่อจริง | นามสกุล | โทรศัพท์ | เมือง |
---|---|---|---|---|
001 | ราจีฟ | เรดดี้ | 9848022337 | ไฮเดอราบาด |
002 | สิทธารถ์ | ภัตตาคารยา | 9848022338 | กัลกัตตา |
003 | Rajesh | คันนา | 9848022339 | เดลี |
004 | พรีธี | Agarwal | 9848022330 | ปูน |
005 | ทรัพฐี | Mohanty | 9848022336 | บูบันเนสชวาร์ |
006 | อรชนา | มิชร่า | 9848022335 | เจนไน |
การเพิ่มเอกสารโดยใช้ XML
ในการเพิ่มข้อมูลข้างต้นลงในดัชนี Solr เราจำเป็นต้องเตรียมเอกสาร XML ดังที่แสดงด้านล่าง บันทึกเอกสารนี้ในไฟล์ที่มีชื่อsample.xml.
<add>
<doc>
<field name = "id">001</field>
<field name = "first name">Rajiv</field>
<field name = "last name">Reddy</field>
<field name = "phone">9848022337</field>
<field name = "city">Hyderabad</field>
</doc>
<doc>
<field name = "id">002</field>
<field name = "first name">Siddarth</field>
<field name = "last name">Battacharya</field>
<field name = "phone">9848022338</field>
<field name = "city">Kolkata</field>
</doc>
<doc>
<field name = "id">003</field>
<field name = "first name">Rajesh</field>
<field name = "last name">Khanna</field>
<field name = "phone">9848022339</field>
<field name = "city">Delhi</field>
</doc>
<doc>
<field name = "id">004</field>
<field name = "first name">Preethi</field>
<field name = "last name">Agarwal</field>
<field name = "phone">9848022330</field>
<field name = "city">Pune</field>
</doc>
<doc>
<field name = "id">005</field>
<field name = "first name">Trupthi</field>
<field name = "last name">Mohanthy</field>
<field name = "phone">9848022336</field>
<field name = "city">Bhuwaeshwar</field>
</doc>
<doc>
<field name = "id">006</field>
<field name = "first name">Archana</field>
<field name = "last name">Mishra</field>
<field name = "phone">9848022335</field>
<field name = "city">Chennai</field>
</doc>
</add>
ดังที่คุณสังเกตได้ไฟล์ XML ที่เขียนขึ้นเพื่อเพิ่มข้อมูลลงในดัชนีมีแท็กที่สำคัญสามแท็ก ได้แก่ <add> </add>, <doc> </doc> และ <field> </ field>
add- นี่คือแท็กรากสำหรับเพิ่มเอกสารลงในดัชนี ประกอบด้วยเอกสารอย่างน้อยหนึ่งรายการที่จะเพิ่ม
doc- เอกสารที่เราเพิ่มควรอยู่ในแท็ก <doc> </doc> เอกสารนี้ประกอบด้วยข้อมูลในรูปแบบของเขตข้อมูล
field - แท็กฟิลด์เก็บชื่อและค่าของฟิลด์ของเอกสาร
หลังจากเตรียมเอกสารแล้วคุณสามารถเพิ่มเอกสารนี้ลงในดัชนีโดยใช้วิธีการใด ๆ ที่กล่าวถึงในบทก่อนหน้า
สมมติว่าไฟล์ XML มีอยู่ในไฟล์ bin ไดเร็กทอรีของ Solr และจะถูกสร้างดัชนีในคอร์ที่ชื่อ my_coreจากนั้นคุณสามารถเพิ่มลงในดัชนี Solr โดยใช้ไฟล์ post เครื่องมือดังต่อไปนี้ -
[Hadoop@localhost bin]$ ./post -c my_core sample.xml
ในการดำเนินการคำสั่งดังกล่าวคุณจะได้รับผลลัพธ์ต่อไปนี้
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-
core6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files
org.apache.Solr.util.SimplePostTool sample.xml
SimplePostTool version 5.0.0
Posting files to [base] url http://localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,
xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
POSTing file sample.xml (application/xml) to [base]
1 files indexed.
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.201
การยืนยัน
ไปที่หน้าแรกของเว็บอินเตอร์เฟส Apache Solr แล้วเลือกแกน my_core. พยายามดึงเอกสารทั้งหมดโดยส่งข้อความค้นหา“:” ในพื้นที่ข้อความqและดำเนินการค้นหา ในการดำเนินการคุณสามารถสังเกตได้ว่าข้อมูลที่ต้องการถูกเพิ่มลงในดัชนี Solr