Apache POI Word - Visão geral

Muitas vezes, um aplicativo de software é necessário para gerar documentos de referência no formato de arquivo do Microsoft Word. Às vezes, espera-se até que um aplicativo receba arquivos do Word como dados de entrada.

Qualquer programador Java que deseja produzir arquivos do MS-Office como saída deve usar uma API predefinida e somente leitura para fazer isso.

O que é Apache POI?

Apache POI é uma API popular que permite aos programadores criar, modificar e exibir arquivos do MS-Office usando programas Java. É uma biblioteca de código aberto desenvolvida e distribuída pela Apache Software Foundation para projetar ou modificar arquivos do MS-Office usando o programa Java. Ele contém classes e métodos para decodificar os dados de entrada do usuário ou um arquivo em documentos do MS-Office.

Componentes do Apache POI

O Apache POI contém classes e métodos para trabalhar em todos os documentos compostos OLE2 do MS-Office. A lista de componentes desta API é fornecida abaixo -

  • POIFS (Poor Obfuscation Implementation File System)- Este componente é o fator básico de todos os outros elementos POI. É usado para ler diferentes arquivos explicitamente.

  • HSSF (Horrible SpreadSheet Format) - É usado para ler e escrever no formato .xls de arquivos MS-Excel.

  • XSSF (XML SpreadSheet Format) - É usado para o formato de arquivo .xlsx do MS-Excel.

  • HPSF (Horrible Property Set Format) - É usado para extrair conjuntos de propriedades dos arquivos do MS-Office.

  • HWPF (Horrible Word Processor Format) - É usado para ler e escrever arquivos de extensão .doc do MS-Word.

  • XWPF (XML Word Processor Format) - É usado para ler e escrever .docx arquivos de extensão do MS-Word.

  • HSLF (Horrible Slide Layout Format) - É usado para ler, criar e editar apresentações do PowerPoint.

  • HDGF (Horrible DiaGram Format) - Contém classes e métodos para arquivos binários do MS-Visio.

  • HPBF (Horrible PuBlisher Format) - É usado para ler e gravar arquivos MS-Publisher.

Este tutorial o orienta durante o processo de trabalho em arquivos MS-Word usando Java. Portanto, a discussão está confinada aos componentes HWPF e XWPF.

Note- VERSÕES ANTIGAS DE FORMATOS DE ARQUIVOS BINÁRIOS DE SUPORTE DE POI, COMO DOC, XLS, PPT, ETC. A VERSÃO 3.5 EM SEGUIDA, POI APOIA FORMATOS DE ARQUIVOS OOXML DE MS-OFFICE, COMO DOCX, XLSX, PPTX, ETC.