Существует два типа lookaround утверждений для регулярных выражений: предвидение и lookbehind. В обоих случаях утверждение является условием, которому нужно удовлетворить, чтобы возвратить соответствие в выражение.
Предварительное утверждение имеет форму (?=test)
и может появиться где угодно в регулярном выражении. MATLAB® смотрит вперед текущего местоположения в тексте для условия испытания. Если MATLAB совпадает с условием испытания, он продолжает обрабатывать остальную часть выражения, чтобы найти соответствие.
Например, смотрите вперед в векторе символов, задающем путь, чтобы найти имя папки, которая содержит программный файл (в этом случае, fileread.m
).
chr = which('fileread')
chr = 'matlabroot\toolbox\matlab\iofun\fileread.m'
regexp(chr,'\w+(?=\\\w+\.[mp])','match')
ans = 1×1 cell array {'iofun'}
Выражение соответствия, \w+
, поиски одного или нескольких алфавитно-цифровых символов или символов подчеркивания. Каждый раз regexp
находит термин, который совпадает с этим условием, это смотрит вперед для обратной косой черты (заданный с двумя обратными косыми чертами, \\
), сопровождаемый именем файла (\w+
) с .m
или .p
расширение (\.[mp]
). regexp
функция возвращает соответствие, которое удовлетворяет предварительному условию, которое является именем папки iofun
.
Предварительные утверждения не используют символов в тексте. В результате можно использовать их, чтобы найти перекрывающиеся последовательности символов.
Например, используйте предвидение, чтобы найти каждую последовательность шести непробельных символов в векторе символов путем соответствия с начальными символами, которые предшествуют пяти дополнительным символам:
chr = 'Locate several 6-char. phrases'; startIndex = regexpi(chr,'\S(?=\S{5})')
startIndex = 1 8 9 16 17 24 25
Начальные значения индекса соответствуют этим фразам:
Locate severa everal 6-char -char. phrase hrases
Без предварительного оператора MATLAB анализирует вектор символов слева направо, используя вектор, когда это идет. Если соответствующие символы найдены, regexp
записывает местоположение и продолжает анализировать вектор символов от местоположения нового соответствия. Нет никакого наложения символов в этом процессе.
chr = 'Locate several 6-char. phrases'; startIndex = regexpi(chr,'\S{6}')
startIndex = 1 8 16 24
Начальные значения индекса соответствуют этим фразам:
Locate severa 6-char phrase
Другой способ использовать предварительную операцию состоит в том, чтобы выполнить логический AND
между двумя условиями. Этот пример первоначально пытается определить местоположение всех строчных согласных в символьном массиве, состоящем из первых 50 символов справки для normest
функция:
helptext = help('normest');
chr = helptext(1:50)
chr = ' NORMEST Estimate the matrix 2-norm. NORMEST(S'
Просто ища негласные ([^aeiou]
) не дает ожидаемый ответ, когда выход включает прописные буквы, пробелы и пунктуацию:
c = regexp(chr,'[^aeiou]','match')
c = 1×43 cell array Columns 1 through 14 {' '} {'N'} {'O'} {'R'} {'M'} {'E'} {'S'} {'T'} {' '} {'E'} {'s'} {'t'} {'m'} {'t'} Columns 15 through 28 {' '} {'t'} {'h'} {' '} {'m'} {'t'} {'r'} {'x'} {' '} {'2'} {'-'} {'n'} {'r'} {'m'} Columns 29 through 42 {'.'} {'↵'} {' '} {' '} {' '} {' '} {'N'} {'O'} {'R'} {'M'} {'E'} {'S'} {'T'} {'('} Column 43 {'S'}
Попробуйте это снова, с помощью предварительного оператора, чтобы создать следующий AND
условие:
(lowercase letter) AND (not a vowel)
На этот раз результат правилен:
c = regexp(chr,'(?=[a-z])[^aeiou]','match')
c = 1×13 cell array {'s'} {'t'} {'m'} {'t'} {'t'} {'h'} {'m'} {'t'} {'r'} {'x'} {'n'} {'r'} {'m'}
Обратите внимание на то, что при использовании предварительного оператора, чтобы выполнить AND
, необходимо поместить выражение соответствия expr
после проверяемого выражения test
:
(?=test)expr or (?!test)expr