Apache POI Word - ภาพรวม
หลายครั้งจำเป็นต้องมีแอปพลิเคชันซอฟต์แวร์เพื่อสร้างเอกสารอ้างอิงในรูปแบบไฟล์ Microsoft Word บางครั้งแอปพลิเคชันคาดว่าจะได้รับไฟล์ Word เป็นข้อมูลอินพุต
โปรแกรมเมอร์ Java ที่ต้องการสร้างไฟล์ MS-Office เป็นเอาต์พุตต้องใช้ API ที่กำหนดไว้ล่วงหน้าและอ่านอย่างเดียวจึงจะทำได้
Apache POI คืออะไร?
Apache POI เป็น API ยอดนิยมที่ช่วยให้โปรแกรมเมอร์สร้างแก้ไขและแสดงไฟล์ MS-Office โดยใช้โปรแกรม Java เป็นไลบรารีโอเพ่นซอร์สที่พัฒนาและเผยแพร่โดย Apache Software Foundation เพื่อออกแบบหรือแก้ไขไฟล์ MS-Office โดยใช้โปรแกรม Java ประกอบด้วยคลาสและวิธีการถอดรหัสข้อมูลอินพุตของผู้ใช้หรือไฟล์ลงในเอกสาร MS-Office
ส่วนประกอบของ Apache POI
Apache POI มีคลาสและวิธีการทำงานกับเอกสาร OLE2 Compound ทั้งหมดของ MS-Office รายการส่วนประกอบของ API นี้แสดงไว้ด้านล่าง -
POIFS (Poor Obfuscation Implementation File System)- ส่วนประกอบนี้เป็นปัจจัยพื้นฐานขององค์ประกอบ POI อื่น ๆ ทั้งหมด ใช้เพื่ออ่านไฟล์ต่าง ๆ อย่างชัดเจน
HSSF (Horrible SpreadSheet Format) - ใช้อ่านและเขียนไฟล์ MS-Excel ในรูปแบบ. xls
XSSF (XML SpreadSheet Format) - ใช้สำหรับรูปแบบไฟล์. xlsx ของ MS-Excel
HPSF (Horrible Property Set Format) - ใช้เพื่อแยกชุดคุณสมบัติของไฟล์ MS-Office
HWPF (Horrible Word Processor Format) - ใช้เพื่ออ่านและเขียนไฟล์นามสกุล. doc ของ MS-Word
XWPF (XML Word Processor Format) - ใช้อ่านและเขียน .docx ไฟล์นามสกุลของ MS-Word
HSLF (Horrible Slide Layout Format) - ใช้เพื่ออ่านสร้างและแก้ไขงานนำเสนอ PowerPoint
HDGF (Horrible DiaGram Format) - มีคลาสและวิธีการสำหรับไฟล์ไบนารี MS-Visio
HPBF (Horrible PuBlisher Format) - ใช้ในการอ่านและเขียนไฟล์ MS-Publisher
บทช่วยสอนนี้จะแนะนำคุณตลอดกระบวนการทำงานกับไฟล์ MS-Word โดยใช้ Java ดังนั้นการสนทนาจึง จำกัด อยู่ที่ส่วนประกอบ HWPF และ XWPF
Note- เวอร์ชันเก่าของ POI Support BINARY FILE FORMATS เช่น DOC, XLS, PPT, ETC เวอร์ชัน 3.5 เป็นต้นไป POI รองรับรูปแบบไฟล์ OOXML ของ MS-Office เช่น DOCX, XLSX, PPTX, ฯลฯ