Apache POI Word - Обзор
Часто для создания справочных документов в формате Microsoft Word требуется программное обеспечение. Иногда ожидается, что приложение даже получит файлы Word в качестве входных данных.
Любой Java-программист, который хочет создавать файлы MS-Office в качестве вывода, должен использовать для этого предопределенный API, доступный только для чтения.
Что такое Apache POI?
Apache POI - это популярный API, который позволяет программистам создавать, изменять и отображать файлы MS-Office с помощью программ Java. Это библиотека с открытым исходным кодом, разработанная и распространяемая Apache Software Foundation для разработки или изменения файлов MS-Office с помощью программы Java. Он содержит классы и методы для декодирования вводимых пользователем данных или файла в документы MS-Office.
Компоненты Apache POI
Apache POI содержит классы и методы для работы со всеми документами OLE2 Compound MS-Office. Список компонентов этого API приведен ниже -
POIFS (Poor Obfuscation Implementation File System)- Этот компонент является основным фактором всех других элементов POI. Он используется для явного чтения разных файлов.
HSSF (Horrible SpreadSheet Format) - Используется для чтения и записи файлов MS-Excel в формате .xls.
XSSF (XML SpreadSheet Format) - Используется для файлов формата .xlsx MS-Excel.
HPSF (Horrible Property Set Format) - Он используется для извлечения наборов свойств файлов MS-Office.
HWPF (Horrible Word Processor Format) - Он используется для чтения и записи файлов расширения .doc MS-Word.
XWPF (XML Word Processor Format) - Используется для чтения и записи .docx файлы расширения MS-Word.
HSLF (Horrible Slide Layout Format) - Он используется для чтения, создания и редактирования презентаций PowerPoint.
HDGF (Horrible DiaGram Format) - Он содержит классы и методы для двоичных файлов MS-Visio.
HPBF (Horrible PuBlisher Format) - Используется для чтения и записи файлов MS-Publisher.
Это руководство проведет вас через процесс работы с файлами MS-Word с использованием Java. Поэтому обсуждение ограничивается компонентами HWPF и XWPF.
Note- СТАРЫЕ ВЕРСИИ POI ПОДДЕРЖИВАЮТ ДВОИЧНЫЕ ФОРМАТЫ ФАЙЛОВ, ТАКИЕ КАК DOC, XLS, PPT, ETC. ВЕРСИЯ 3.5 ДАЛЬНЕЙШЕЕ, POI ПОДДЕРЖИВАЕТ ФОРМАТЫ ФАЙЛОВ OOXML MS-OFFICE, ТАКИЕ КАК DOCX, XLSX, PPTX и т. Д.