Apache POI Word - Présentation
Plusieurs fois, une application logicielle est nécessaire pour générer des documents de référence au format de fichier Microsoft Word. Parfois, une application est même censée recevoir des fichiers Word en tant que données d'entrée.
Tout programmeur Java qui souhaite produire des fichiers MS-Office en tant que sortie doit utiliser une API prédéfinie et en lecture seule pour ce faire.
Qu'est-ce que Apache POI?
Apache POI est une API populaire qui permet aux programmeurs de créer, modifier et afficher des fichiers MS-Office à l'aide de programmes Java. Il s'agit d'une bibliothèque open source développée et distribuée par Apache Software Foundation pour concevoir ou modifier des fichiers MS-Office à l'aide du programme Java. Il contient des classes et des méthodes pour décoder les données d'entrée utilisateur ou un fichier en documents MS-Office.
Composants d'Apache POI
Apache POI contient des classes et des méthodes pour travailler sur tous les documents composés OLE2 de MS-Office. La liste des composants de cette API est donnée ci-dessous -
POIFS (Poor Obfuscation Implementation File System)- Ce composant est le facteur de base de tous les autres éléments POI. Il est utilisé pour lire explicitement différents fichiers.
HSSF (Horrible SpreadSheet Format) - Il est utilisé pour lire et écrire au format .xls des fichiers MS-Excel.
XSSF (XML SpreadSheet Format) - Il est utilisé pour le format de fichier .xlsx de MS-Excel.
HPSF (Horrible Property Set Format) - Il est utilisé pour extraire les jeux de propriétés des fichiers MS-Office.
HWPF (Horrible Word Processor Format) - Il est utilisé pour lire et écrire des fichiers d'extension .doc de MS-Word.
XWPF (XML Word Processor Format) - Il est utilisé pour lire et écrire .docx fichiers d'extension de MS-Word.
HSLF (Horrible Slide Layout Format) - Il est utilisé pour lire, créer et modifier des présentations PowerPoint.
HDGF (Horrible DiaGram Format) - Il contient des classes et des méthodes pour les fichiers binaires MS-Visio.
HPBF (Horrible PuBlisher Format) - Il est utilisé pour lire et écrire des fichiers MS-Publisher.
Ce didacticiel vous guide tout au long du processus de travail sur des fichiers MS-Word à l'aide de Java. Par conséquent, la discussion se limite aux composants HWPF et XWPF.
Note- ANCIENNES VERSIONS DE FORMATS DE FICHIER BINAIRE DE SUPPORT POI TELS QUE DOC, XLS, PPT, ETC. VERSION 3.5 À PARTIR DE, POI PREND EN CHARGE LES FORMATS DE FICHIER OOXML DE MS-OFFICE TELS QUE DOCX, XLSX, PPTX, ETC.