exponenta event banner

readPDFFormData

Чтение данных из PDF-форм

Описание

пример

data = readPDFFormData(filename) считывает данные из PDF-формы в структуру.

data = readPDFFormData(filename,'Password',password) задает пароль для открытия PDF-формы.

Примеры

свернуть все

Считывание данных из полей формы в weatherReportForm1.pdf использование readPDFFormData. Функция возвращает структуру, содержащую данные из полей PDF-формы.

filename = "weatherReportForm1.pdf";
data = readPDFFormData(filename)
data = struct with fields:
         event_type: "Thunderstorm Wind"
    event_narrative: "Large tree down between Plantersville and Nettleton."

Считывание данных из полей формы в нескольких файлах с помощью хранилища данных файла.

Создайте хранилище данных файла для форм отчетов о погоде. Формы названы "weatherReportFormN.pdf", где N - номер формы.. Укажите имя файла с помощью подстановочного символа «*» для поиска всех имен файлов этой структуры. Чтобы указать функцию чтения, которая должна быть readPDFFormData, введите эту функцию в fileDatastore с помощью дескриптора функции.

fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = 
  FileDatastore with properties:

                       Files: {
                              ' .../tpc01b319a/textanalytics-ex39762425/weatherReportForm1.pdf';
                              ' .../tpc01b319a/textanalytics-ex39762425/weatherReportForm2.pdf';
                              ' .../tpc01b319a/textanalytics-ex39762425/weatherReportForm3.pdf'
                               ... and 1 more
                              }
                     Folders: {
                              ' .../mlx_to_docbook6/tpc01b319a/textanalytics-ex39762425'
                              }
                 UniformRead: 0
                    ReadMode: 'file'
                   BlockSize: Inf
                  PreviewFcn: @readPDFFormData
      SupportedOutputFormats: [1x16 string]
                     ReadFcn: @readPDFFormData
    AlternateFileSystemRoots: {}

Закольцовывайте файлы в хранилище данных и прочитайте каждую PDF-форму.

data = [];
while hasdata(fds)
    textData = read(fds);
    data = [data; textData];
end
data
data=4×1 struct array with fields:
    event_type
    event_narrative

Входные аргументы

свернуть все

Имя файла, указанное как строковый скалярный или символьный вектор.

readPDFFormData поддерживает только PDF-файлы AcroForm (интерактивные формы).

Типы данных: string | char

Пароль для открытия PDF-файла, заданный как вектор символов или скаляр строки.

Пример: 'skroWhtaM'

Типы данных: string | char

Выходные аргументы

свернуть все

Структура вывода. Поля data соответствуют именам полей формы в PDF. Если имена полей формы недопустимы, то функция автоматически редактирует их для создания допустимых имен.

Представлен в R2018a