Apache POI Word - Visão geral
Muitas vezes, um aplicativo de software é necessário para gerar documentos de referência no formato de arquivo do Microsoft Word. Às vezes, espera-se até que um aplicativo receba arquivos do Word como dados de entrada.
Qualquer programador Java que deseja produzir arquivos do MS-Office como saída deve usar uma API predefinida e somente leitura para fazer isso.
O que é Apache POI?
Apache POI é uma API popular que permite aos programadores criar, modificar e exibir arquivos do MS-Office usando programas Java. É uma biblioteca de código aberto desenvolvida e distribuída pela Apache Software Foundation para projetar ou modificar arquivos do MS-Office usando o programa Java. Ele contém classes e métodos para decodificar os dados de entrada do usuário ou um arquivo em documentos do MS-Office.
Componentes do Apache POI
O Apache POI contém classes e métodos para trabalhar em todos os documentos compostos OLE2 do MS-Office. A lista de componentes desta API é fornecida abaixo -
POIFS (Poor Obfuscation Implementation File System)- Este componente é o fator básico de todos os outros elementos POI. É usado para ler diferentes arquivos explicitamente.
HSSF (Horrible SpreadSheet Format) - É usado para ler e escrever no formato .xls de arquivos MS-Excel.
XSSF (XML SpreadSheet Format) - É usado para o formato de arquivo .xlsx do MS-Excel.
HPSF (Horrible Property Set Format) - É usado para extrair conjuntos de propriedades dos arquivos do MS-Office.
HWPF (Horrible Word Processor Format) - É usado para ler e escrever arquivos de extensão .doc do MS-Word.
XWPF (XML Word Processor Format) - É usado para ler e escrever .docx arquivos de extensão do MS-Word.
HSLF (Horrible Slide Layout Format) - É usado para ler, criar e editar apresentações do PowerPoint.
HDGF (Horrible DiaGram Format) - Contém classes e métodos para arquivos binários do MS-Visio.
HPBF (Horrible PuBlisher Format) - É usado para ler e gravar arquivos MS-Publisher.
Este tutorial o orienta durante o processo de trabalho em arquivos MS-Word usando Java. Portanto, a discussão está confinada aos componentes HWPF e XWPF.
Note- VERSÕES ANTIGAS DE FORMATOS DE ARQUIVOS BINÁRIOS DE SUPORTE DE POI, COMO DOC, XLS, PPT, ETC. A VERSÃO 3.5 EM SEGUIDA, POI APOIA FORMATOS DE ARQUIVOS OOXML DE MS-OFFICE, COMO DOCX, XLSX, PPTX, ETC.