PDFBox - Thuộc tính tài liệu
Giống như các tệp khác, tài liệu PDF cũng có các thuộc tính tài liệu. Các thuộc tính này là các cặp khóa-giá trị. Mỗi thuộc tính cung cấp thông tin cụ thể về tài liệu.
Sau đây là các thuộc tính của tài liệu PDF -
Không. | Kê khai tài sản |
---|---|
1 | File Thuộc tính này giữ tên của tệp. |
2 | Title Sử dụng thuộc tính này, bạn có thể đặt tiêu đề cho tài liệu. |
3 | Author Sử dụng thuộc tính này, bạn có thể đặt tên tác giả cho tài liệu. |
4 | Subject Sử dụng thuộc tính này, bạn có thể chỉ định chủ đề của tài liệu PDF. |
5 | Keywords Sử dụng thuộc tính này, bạn có thể liệt kê các từ khóa mà chúng tôi có thể tìm kiếm tài liệu. |
6 | Created Sử dụng thuộc tính này, bạn có thể đặt ngày được tạo cho tài liệu. |
7 | Modified Sử dụng thuộc tính này, bạn có thể đặt ngày sửa đổi cho tài liệu. |
số 8 | Application Sử dụng thuộc tính này, bạn có thể đặt Ứng dụng của tài liệu. |
Sau đây là ảnh chụp màn hình bảng thuộc tính tài liệu của tài liệu PDF.
Đặt thuộc tính tài liệu
PDFBox cung cấp cho bạn một lớp có tên PDDocumentInformation. Lớp này có một tập hợp các phương thức setter và getter.
Các phương thức setter của lớp này được sử dụng để đặt các giá trị cho các thuộc tính khác nhau của một tài liệu và các phương thức getter được sử dụng để truy xuất các giá trị này.
Sau đây là các phương thức setter của PDDocumentInformation lớp học.
Không. | Phương pháp & Mô tả |
---|---|
1 | setAuthor(String author) Phương pháp này được sử dụng để đặt giá trị cho thuộc tính của tài liệu PDF có tên Author. |
2 | setTitle(String title) Phương pháp này được sử dụng để đặt giá trị cho thuộc tính của tài liệu PDF có tên Title. |
3 | setCreator(String creator) Phương pháp này được sử dụng để đặt giá trị cho thuộc tính của tài liệu PDF có tên Creator. |
4 | setSubject(String subject) Phương pháp này được sử dụng để đặt giá trị cho thuộc tính của tài liệu PDF có tên Subject. |
5 | setCreationDate(Calendar date) Phương pháp này được sử dụng để đặt giá trị cho thuộc tính của tài liệu PDF có tên CreationDate. |
6 | setModificationDate(Calendar date) Phương pháp này được sử dụng để đặt giá trị cho thuộc tính của tài liệu PDF có tên ModificationDate. |
7 | setKeywords(String keywords list) Phương pháp này được sử dụng để đặt giá trị cho thuộc tính của tài liệu PDF có tên Keywords. |
Thí dụ
PDFBox cung cấp một lớp được gọi là PDDocumentInformationvà lớp này cung cấp nhiều phương thức khác nhau. Các phương thức này có thể đặt các thuộc tính khác nhau cho tài liệu và truy xuất chúng.
Ví dụ này trình bày cách thêm các thuộc tính như Author, Title, Date, and Subjectsang tài liệu PDF. Ở đây, chúng tôi sẽ tạo một tài liệu PDF có têndoc_attributes.pdf, thêm các thuộc tính khác nhau vào nó và lưu nó trong đường dẫn C:/PdfBox_Examples/. Lưu mã này trong một tệp có tênAddingAttributes.java.
import java.io.IOException;
import java.util.Calendar;
import java.util.GregorianCalendar;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDDocumentInformation;
import org.apache.pdfbox.pdmodel.PDPage;
public class AddingDocumentAttributes {
public static void main(String args[]) throws IOException {
//Creating PDF document object
PDDocument document = new PDDocument();
//Creating a blank page
PDPage blankPage = new PDPage();
//Adding the blank page to the document
document.addPage( blankPage );
//Creating the PDDocumentInformation object
PDDocumentInformation pdd = document.getDocumentInformation();
//Setting the author of the document
pdd.setAuthor("Tutorialspoint");
// Setting the title of the document
pdd.setTitle("Sample document");
//Setting the creator of the document
pdd.setCreator("PDF Examples");
//Setting the subject of the document
pdd.setSubject("Example document");
//Setting the created date of the document
Calendar date = new GregorianCalendar();
date.set(2015, 11, 5);
pdd.setCreationDate(date);
//Setting the modified date of the document
date.set(2016, 6, 5);
pdd.setModificationDate(date);
//Setting keywords for the document
pdd.setKeywords("sample, first example, my pdf");
//Saving the document
document.save("C:/PdfBox_Examples/doc_attributes.pdf");
System.out.println("Properties added successfully ");
//Closing the document
document.close();
}
}
Biên dịch và thực thi tệp Java đã lưu từ dấu nhắc lệnh bằng các lệnh sau.
javac AddingAttributes.java
java AddingAttributes
Khi thực thi, chương trình trên thêm tất cả các thuộc tính được chỉ định vào tài liệu hiển thị thông báo sau.
Properties added successfully
Bây giờ, nếu bạn truy cập vào đường dẫn đã cho, bạn có thể tìm thấy tệp PDF được tạo trong đó. Nhấp chuột phải vào tài liệu và chọn tùy chọn thuộc tính tài liệu như hình dưới đây.
Thao tác này sẽ cung cấp cho bạn cửa sổ thuộc tính tài liệu và tại đây bạn có thể quan sát tất cả các thuộc tính của tài liệu đã được đặt thành các giá trị được chỉ định.
Truy xuất thuộc tính tài liệu
Bạn có thể truy xuất các thuộc tính của tài liệu bằng cách sử dụng getter các phương pháp được cung cấp bởi PDDocumentInformation lớp học.
Sau đây là các phương thức getter của PDDocumentInformation lớp học.
Không. | Phương pháp & Mô tả |
---|---|
1 | getAuthor() Phương pháp này được sử dụng để truy xuất giá trị cho thuộc tính của tài liệu PDF có tên Author. |
2 | getTitle() Phương pháp này được sử dụng để truy xuất giá trị cho thuộc tính của tài liệu PDF có tên Title. |
3 | getCreator() Phương pháp này được sử dụng để truy xuất giá trị cho thuộc tính của tài liệu PDF có tên Creator. |
4 | getSubject() Phương pháp này được sử dụng để truy xuất giá trị cho thuộc tính của tài liệu PDF có tên Subject. |
5 | getCreationDate() Phương pháp này được sử dụng để truy xuất giá trị cho thuộc tính của tài liệu PDF có tên CreationDate. |
6 | getModificationDate() Phương pháp này được sử dụng để truy xuất giá trị cho thuộc tính của tài liệu PDF có tên ModificationDate. |
7 | getKeywords() Phương pháp này được sử dụng để truy xuất giá trị cho thuộc tính của tài liệu PDF có tên Keywords. |
Thí dụ
Ví dụ này trình bày cách truy xuất các thuộc tính của tài liệu PDF hiện có. Ở đây, chúng tôi sẽ tạo một chương trình Java và tải tài liệu PDF có têndoc_attributes.pdf, được lưu trong đường dẫn C:/PdfBox_Examples/và truy xuất các thuộc tính của nó. Lưu mã này trong một tệp có tênRetrivingDocumentAttributes.java.
import java.io.File;
import java.io.IOException;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDDocumentInformation;
public class RetrivingDocumentAttributes {
public static void main(String args[]) throws IOException {
//Loading an existing document
File file = new File("C:/PdfBox_Examples/doc_attributes.pdf")
PDDocument document = PDDocument.load(file);
//Getting the PDDocumentInformation object
PDDocumentInformation pdd = document.getDocumentInformation();
//Retrieving the info of a PDF document
System.out.println("Author of the document is :"+ pdd.getAuthor());
System.out.println("Title of the document is :"+ pdd.getTitle());
System.out.println("Subject of the document is :"+ pdd.getSubject());
System.out.println("Creator of the document is :"+ pdd.getCreator());
System.out.println("Creation date of the document is :"+ pdd.getCreationDate());
System.out.println("Modification date of the document is :"+
pdd.getModificationDate());
System.out.println("Keywords of the document are :"+ pdd.getKeywords());
//Closing the document
document.close();
}
}
Biên dịch và thực thi tệp Java đã lưu từ dấu nhắc lệnh bằng các lệnh sau.
javac RetrivingDocumentAttributes.java
java RetrivingDocumentAttributes
Khi thực hiện, chương trình trên lấy tất cả các thuộc tính của tài liệu và hiển thị chúng như hình dưới đây.
Author of the document is :Tutorialspoint
Title of the document is :Sample document
Subject of the document is :Example document
Creator of the document is :PDF Examples
Creation date of the document is :11/5/2015
Modification date of the document is :6/5/2016
Keywords of the document are :sample, first example, my pdf