readPDFFormData

Считайте данные из форм PDF

Описание

пример

data = readPDFFormData(filename) считывает данные из формы PDF в struct.

data = readPDFFormData(filename,'Password',password) задает пароль для открытия формы PDF.

Примеры

свернуть все

Считайте данные из полей формы в weatherReportForm1.pdf использование readPDFFormData. Функция возвращает struct, содержащий данные из полей формы PDF.

filename = "weatherReportForm1.pdf";
data = readPDFFormData(filename)
data = struct with fields:
         event_type: "Thunderstorm Wind"
    event_narrative: "Large tree down between Plantersville and Nettleton."

Считайте данные из полей формы в нескольких файлах с помощью datastore файла.

Создайте datastore файла для форм прогнозов погоды. Формы называют "weatherReportFormN.pdf", где N количество формы.. Задайте имя файла с помощью подстановочного знака "*", чтобы найти все имена файлов этой структуры. Чтобы задать чтение функционируют, чтобы быть readPDFFormData, введите эту функцию к fileDatastore использование указателя на функцию.

fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = 
  FileDatastore with properties:

                       Files: {
                              ' .../tp2ec57292/textanalytics-ex39762425/weatherReportForm1.pdf';
                              ' .../tp2ec57292/textanalytics-ex39762425/weatherReportForm2.pdf';
                              ' .../tp2ec57292/textanalytics-ex39762425/weatherReportForm3.pdf'
                               ... and 1 more
                              }
                     Folders: {
                              ' .../mlx_to_docbook6/tp2ec57292/textanalytics-ex39762425'
                              }
                 UniformRead: 0
                    ReadMode: 'file'
                   BlockSize: Inf
                  PreviewFcn: @readPDFFormData
      SupportedOutputFormats: ["txt"    "csv"    "xlsx"    "xls"    ...    ]
                     ReadFcn: @readPDFFormData
    AlternateFileSystemRoots: {}

Цикл по файлам в datastore и считал каждую форму PDF.

data = [];
while hasdata(fds)
    textData = read(fds);
    data = [data; textData];
end
data
data=4×1 struct array with fields:
    event_type
    event_narrative

Входные параметры

свернуть все

Имя файла в виде строкового скаляра или вектора символов.

readPDFFormData файлы AcroForm PDF поддержек (интерактивные формы) только.

Типы данных: string | char

Пароль, чтобы открыть файл PDF в виде вектора символов или строкового скаляра.

Пример: 'skroWhtaM'

Типы данных: string | char

Выходные аргументы

свернуть все

Выведите struct. Поля data соответствуйте именам полей формы в PDF. Если имена полей формы не являются допустимыми именами полей struct, то функция автоматически редактирует их, чтобы создать допустимые имена.

Введенный в R2018a
Для просмотра документации необходимо авторизоваться на сайте