Apache POI Word - Обзор

Часто для создания справочных документов в формате Microsoft Word требуется программное обеспечение. Иногда ожидается, что приложение даже получит файлы Word в качестве входных данных.

Любой Java-программист, который хочет создавать файлы MS-Office в качестве вывода, должен использовать для этого предопределенный API, доступный только для чтения.

Что такое Apache POI?

Apache POI - это популярный API, который позволяет программистам создавать, изменять и отображать файлы MS-Office с помощью программ Java. Это библиотека с открытым исходным кодом, разработанная и распространяемая Apache Software Foundation для разработки или изменения файлов MS-Office с помощью программы Java. Он содержит классы и методы для декодирования вводимых пользователем данных или файла в документы MS-Office.

Компоненты Apache POI

Apache POI содержит классы и методы для работы со всеми документами OLE2 Compound MS-Office. Список компонентов этого API приведен ниже -

  • POIFS (Poor Obfuscation Implementation File System)- Этот компонент является основным фактором всех других элементов POI. Он используется для явного чтения разных файлов.

  • HSSF (Horrible SpreadSheet Format) - Используется для чтения и записи файлов MS-Excel в формате .xls.

  • XSSF (XML SpreadSheet Format) - Используется для файлов формата .xlsx MS-Excel.

  • HPSF (Horrible Property Set Format) - Он используется для извлечения наборов свойств файлов MS-Office.

  • HWPF (Horrible Word Processor Format) - Он используется для чтения и записи файлов расширения .doc MS-Word.

  • XWPF (XML Word Processor Format) - Используется для чтения и записи .docx файлы расширения MS-Word.

  • HSLF (Horrible Slide Layout Format) - Он используется для чтения, создания и редактирования презентаций PowerPoint.

  • HDGF (Horrible DiaGram Format) - Он содержит классы и методы для двоичных файлов MS-Visio.

  • HPBF (Horrible PuBlisher Format) - Используется для чтения и записи файлов MS-Publisher.

Это руководство проведет вас через процесс работы с файлами MS-Word с использованием Java. Поэтому обсуждение ограничивается компонентами HWPF и XWPF.

Note- СТАРЫЕ ВЕРСИИ POI ПОДДЕРЖИВАЮТ ДВОИЧНЫЕ ФОРМАТЫ ФАЙЛОВ, ТАКИЕ КАК DOC, XLS, PPT, ETC. ВЕРСИЯ 3.5 ​​ДАЛЬНЕЙШЕЕ, POI ПОДДЕРЖИВАЕТ ФОРМАТЫ ФАЙЛОВ OOXML MS-OFFICE, ТАКИЕ КАК DOCX, XLSX, PPTX и т. Д.