readPDFFormData

Чтение данных из PDF

Описание

пример

data = readPDFFormData(filename) считывает данные из PDF в struct.

data = readPDFFormData(filename,'Password',password) задает пароль для открытия PDF.

Примеры

свернуть все

Считайте данные из полей формы в weatherReportForm1.pdf использование readPDFFormData. Функция возвращает struct, содержащую данные из PDF полей формы.

filename = "weatherReportForm1.pdf";
data = readPDFFormData(filename)
data = struct with fields:
         event_type: "Thunderstorm Wind"
    event_narrative: "Large tree down between Plantersville and Nettleton."

Считайте данные из полей формы в нескольких файлах с помощью file datastore.

Создайте файл datastore для форм отчетов о погоде. Формы называются "weatherReportFormN.pdf", где N - номер формы. Укажите имя файла с помощью подстановочного знака «*», чтобы найти все имена файлов этой структуры. Чтобы задать функцию read, которая будет readPDFFormData, введите эту функцию в fileDatastore использование указателя на функцию.

fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = 
  FileDatastore with properties:

                       Files: {
                              ' .../tpc01b319a/textanalytics-ex39762425/weatherReportForm1.pdf';
                              ' .../tpc01b319a/textanalytics-ex39762425/weatherReportForm2.pdf';
                              ' .../tpc01b319a/textanalytics-ex39762425/weatherReportForm3.pdf'
                               ... and 1 more
                              }
                     Folders: {
                              ' .../mlx_to_docbook6/tpc01b319a/textanalytics-ex39762425'
                              }
                 UniformRead: 0
                    ReadMode: 'file'
                   BlockSize: Inf
                  PreviewFcn: @readPDFFormData
      SupportedOutputFormats: [1x16 string]
                     ReadFcn: @readPDFFormData
    AlternateFileSystemRoots: {}

Закольцовывайте файлы в datastore и считывайте каждый PDF.

data = [];
while hasdata(fds)
    textData = read(fds);
    data = [data; textData];
end
data
data=4×1 struct array with fields:
    event_type
    event_narrative

Входные параметры

свернуть все

Имя файла, заданное как строковый скаляр или вектор символов.

readPDFFormData поддерживает только файлы AcroForm PDF (интерактивные формы).

Типы данных: string | char

Пароль для открытия PDF файла, заданный как вектор символов или строковый скаляр.

Пример: 'skroWhtaM'

Типы данных: string | char

Выходные аргументы

свернуть все

Выходной struct. Поля data соответствуют именам полей формы в PDF. Если имена полей формы не являются допустимыми именами структурных полей, то функция автоматически редактирует их, чтобы создать допустимые имена.

Введенный в R2018a