readPDFFormData

Считайте данные из форм PDF

Описание

пример

data = readPDFFormData(filename) считывает данные из формы PDF в struct.

data = readPDFFormData(filename,'Password',password) задает пароль для открытия формы PDF.

Примеры

свернуть все

Считайте данные из полей формы в weatherReportForm1.pdf использование readPDFFormData. Функция возвращает struct, содержащий данные из полей формы PDF.

filename = "weatherReportForm1.pdf";
data = readPDFFormData(filename)
data = struct with fields:
         event_type: "Thunderstorm Wind"
    event_narrative: "Large tree down between Plantersville and Nettleton."

Считайте данные из полей формы в нескольких файлах с помощью datastore файла.

Создайте datastore файла для форм прогнозов погоды. Формы называют "weatherReportFormN.pdf", где N количество формы.. Задайте имя файла с помощью подстановочного знака "*", чтобы найти все имена файлов этой структуры. Чтобы задать чтение функционируют, чтобы быть readPDFFormData, введите эту функцию к fileDatastore использование указателя на функцию.

fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = 
  FileDatastore with properties:

                       Files: {
                              ' .../tpfa52f3d2/textanalytics-ex39762425/weatherReportForm1.pdf';
                              ' .../tpfa52f3d2/textanalytics-ex39762425/weatherReportForm2.pdf';
                              ' .../tpfa52f3d2/textanalytics-ex39762425/weatherReportForm3.pdf'
                               ... and 1 more
                              }
                 UniformRead: 0
                    ReadMode: 'file'
                   BlockSize: Inf
                  PreviewFcn: @readPDFFormData
                     ReadFcn: @readPDFFormData
    AlternateFileSystemRoots: {}

Цикл по файлам в datastore и считал каждую форму PDF.

data = [];
while hasdata(fds)
    textData = read(fds);
    data = [data; textData];
end
data
data=4×2 struct
    event_type
    event_narrative

Входные параметры

свернуть все

Имя файла, заданного как скаляр строки или вектор символов.

readPDFFormData поддержки файлы AcroForm PDF (интерактивные формы) только.

Типы данных: string | char

Пароль, чтобы открыть файл PDF, заданный как вектор символов или скаляр строки.

Пример: 'skroWhtaM'

Типы данных: string | char

Выходные аргументы

свернуть все

Выведите struct. Поля data соответствуйте именам полей формы в PDF. Если имена полей формы не являются допустимыми именами полей struct, то функция автоматически редактирует их, чтобы создать допустимые имена.

Введенный в R2018a