regexpi

Совпадайте с (нечувствительным к регистру) регулярным выражением

Описание

пример

startIndex = regexpi(str,expression) возвращает начальное значение индекса каждой подстроки str это совпадает с символьными шаблонами, заданными регулярным выражением без отношения к регистру. Если нет никаких соответствий, startIndex пустой массив.

[startIndex,endIndex] = regexpi(str,expression) возвращает запуск и конечные индексы всех соответствий.

out = regexpi(str,expression,outkey) возвращает выходной параметр, заданный outkey. Например, если outkey 'match', затем regexpi возвращает подстроки, которые совпадают с выражением, а не их начальными значениями индекса.

[out1,...,outN] = regexpi(str,expression,outkey1,...,outkeyN) возвращает выходные параметры, заданные несколькими выходными ключевыми словами, в заданном порядке. Например, если вы задаете 'match'Лексемы, затем regexpi возвращает подстроки, которые совпадают с целым выражением и лексемами, которые совпадают с частями выражения.

пример

___ = regexpi(___,option1,...,optionM) изменяет поиск с помощью заданных флагов опции. Например, задайте 'matchcase' выполнять чувствительное к регистру соответствие. Можно включать любые из входных параметров и запросить любые из выходных параметров от предыдущих синтаксисов.

___ = regexpi(___,'forceCellOutput') возвращает каждый выходной аргумент как скалярную ячейку. Ячейки содержат числовые массивы или подстроки, которые описаны как выходные параметры предыдущих синтаксисов. Можно включать любые из входных параметров и запросить любые из выходных параметров от предыдущих синтаксисов.

Примеры

свернуть все

Найдите слова, которые запускаются с c, закончите t, и содержите один или несколько гласных между ними.

str = 'bat cat can car COAT court cut ct CAT-scan';
expression = 'c[aeiou]+t';
startIndex = regexpi(str,expression)
startIndex = 1×4

     5    17    28    35

Значения в startIndex укажите на индекс первого символа каждого слова, которое совпадает с регулярным выражением.

Регулярное выражение 'c[aeiou]+t' задает этот шаблон:

  • c должен быть первый символ.

  • c должен сопровождаться одним из символов в скобках, [aeiou].

  • Шаблон на кронштейнах должен произойти один или несколько раз, как обозначено + оператор.

  • t должен быть последний знак, без символов между шаблоном на кронштейнах и t.

Совпадайте с регистром всего или часть выражения.

По умолчанию, regexpi выполняет нечувствительное к регистру соответствие.

str = 'A character vector with UPPERCASE and lowercase text.';
expression = '\w*case';
matchStr = regexpi(str,expression,'match')
matchStr = 1x2 cell
    {'UPPERCASE'}    {'lowercase'}

Используйте regexp функция с тем же синтаксисом как regexpi выполнять чувствительное к регистру соответствие.

matchWithRegexp = regexp(str,expression,'match')
matchWithRegexp = 1x1 cell array
    {'lowercase'}

Отключить чувствительное к регистру соответствие для regexp, используйте 'ignorecase' опция.

matchWithIgnorecase = regexp(str,expression,'match','ignorecase')
matchWithIgnorecase = 1x2 cell
    {'UPPERCASE'}    {'lowercase'}

Для нескольких выражений включите и отключите нечувствительное к регистру соответствие для выбранных выражений с помощью (?i) и (?-i) поисковые флаги.

expression = {'(?-i)\w*case';...
              '(?i)\w*case'};
matchStr = regexp(str,expression,'match');
celldisp(matchStr)
 
matchStr{1}{1} =
 
lowercase
 
 
matchStr{2}{1} =
 
UPPERCASE
 
 
matchStr{2}{2} =
 
lowercase
 

Входные параметры

свернуть все

Введите текст в виде вектора символов, массива ячеек из символьных векторов или массива строк. Каждый вектор символов в массиве ячеек или каждая строка в массиве строк, может иметь любую длину и содержать любые символы.

Если str и expression строковые массивы или массивы ячеек, у них должны быть те же размерности.

Типы данных: string | char | cell

Регулярное выражение в виде вектора символов, массива ячеек из символьных векторов или массива строк. Каждое выражение может содержать символы, метасимволы, операторы, лексемы и флаги, которые задают шаблоны, чтобы соответствовать в str.

Следующие таблицы описывают элементы регулярных выражений.

Метасимволы

Метасимволы представляют буквы, обозначают буквами области значений, цифры и пробелы. Используйте их, чтобы создать обобщенный шаблон символов.

Метасимвол

Описание

Пример

.

Любой отдельный символ, включая пробел

'..ain' последовательности соответствий пяти последовательных символов тот конец с 'ain'.

[c1c2c3]

Любой символ содержится в квадратных скобках. Следующие символы обработаны буквально: $ | . * + ? и - если не используемый, чтобы указать на область значений.

'[rp.]ain' соответствия 'rain' или 'pain' или '.ain'.

[^c1c2c3]

Любой символ, не содержавший в квадратных скобках. Следующие символы обработаны буквально: $ | . * + ? и - если не используемый, чтобы указать на область значений.

'[^*rp]ain' соответствия все последовательности с четырьмя буквами тот конец в 'ain', кроме 'rain' и 'pain' и '*ain'. Например, это совпадает с 'gain', 'lain', или 'vain'.

[c1-c2]

Любой символ в области значений c1 через c2

'[A-G]' совпадает с отдельным символом в области значений A через G.

\w

Любой алфавитный, числовой, или символ подчеркивания. Для английских наборов символов, \w эквивалентно [a-zA-Z_0-9]

'\w*' идентифицирует слово.

\W

Любой символ, который не является алфавитным, числовым, или подчеркивание. Для английских наборов символов, \W эквивалентно [^a-zA-Z_0-9]

'\W*' идентифицирует термин, который не является словом.

\s

Любой пробельный символ; эквивалентный [ \f\n\r\t\v]

'\w*n\s' распознает слова, которые заканчивают буквой n, сопровождаемый пробельным символом.

\S

Любой непробельный символ; эквивалентный [^ \f\n\r\t\v]

'\d\S' совпадает с числовой цифрой, сопровождаемой любым непробельным символом.

\d

Любая числовая цифра; эквивалентный [0-9]

'\d*' соответствия любое количество последовательных цифр.

\D

Любой символ нецифры; эквивалентный [^0-9]

'\w*\D\>' распознает слова, которые не заканчиваются числовой цифрой.

\oN или \o{N}

Символ восьмеричного значения N

'\o{40}' совпадает с пробелом, заданным восьмеричным 40.

\xN или \x{N}

Символ шестнадцатеричного значения N

'\x2C' совпадает с символом запятой, заданным шестнадцатеричным 2C.

Символьное представление

Оператор

Описание

\a

Предупреждение (звуковой сигнал)

\b

Клавиша Backspace

\f

Перевод формата

\n

Новая строка

\r

Возврат каретки

\t

Горизонтальная табуляция

\v

Вертикальная табуляция

'char'

Любой символ с особым значением в регулярных выражениях, с которыми вы хотите совпадать буквально (например, используйте \\ совпадать с одной обратной косой чертой)

Кванторы

Кванторы задают число раз, шаблон должен произойти в совпавшем тексте.

Квантор

Совпадает с выражением, когда оно происходит...

Пример

expr*

0 или больше раз последовательно.

'\w*' распознает слово любой длины.

expr?

0 раз или в 1 раз.

'\w*(\.m)?' распознает слова, которые опционально заканчиваются дополнительным .m.

expr+

1 или более раз последовательно.

'<img src="\w+\.gif">' совпадает с <img> HTML-тэг, когда имя файла содержит один или несколько символов.

expr{m,n}

По крайней мере, m времена, но не больше, чем n времена последовательно.

{0,1} эквивалентно ?.

'\S{4,8}' соответствия между четырьмя и восемью непробельными символами.

expr{m,}

По крайней мере, m времена последовательно.

{0,} и {1,} эквивалентны * и +, соответственно.

'<a href="\w{1,}\.html">' совпадает с <a> HTML-тэг, когда имя файла содержит один или несколько символов.

expr{n}

Точно n времена последовательно.

Эквивалентный {n,n}.

'\d{4}' соответствия четыре последовательных цифры.

Кванторы могут появиться в трех режимах, описанных в следующей таблице. q представляет любой из кванторов в предыдущей таблице.

Режим

Описание

Пример

exprq

Жадное выражение: совпадайте с как можно большим количеством символов.

Учитывая текст '<tr><td><p>text</p></td>', выражение '</?t.*>' соответствия все символы между <tr и /td>:

'<tr><td><p>text</p></td>'

exprq?

Ленивое выражение: совпадайте с таким же небольшим количеством символов по мере необходимости.

Учитывая text'<tr><td><p>text</p></td>', выражение '</?t.*?>' заканчивает каждый матч при первом вхождении закрывающей угловой скобки (>):

'<tr>'   '<td>'   '</td>'

exprq +

Притяжательное выражение: соответствуйте как можно больше, но не повторно сканируйте фрагменты текста.

Учитывая text'<tr><td><p>text</p></td>', выражение '</?t.*+>' не возвращает соответствий, потому что закрывающая угловая скобка получена с помощью .*, и не повторно сканируется.

Группировка операторов

Группирующиеся операторы позволяют вам получать лексемы, применять один оператор к нескольким элементам или отключать отслеживание в обратном порядке в определенной группе.

Группировка оператора

Описание

Пример

(expr)

Элементы группы выражения и лексем получения.

'Joh?n\s(\w*)' получает лексему, которая содержит фамилию любого человека с именем John или Jon.

(?:expr)

Группа, но не получают лексемы.

'(?:[aeiou][^aeiou]){2}' соответствия два последовательных шаблона гласного, сопровождаемого негласным, такие как 'anon'.

Без группировки, '[aeiou][^aeiou]{2}'совпадает с гласным, сопровождаемым двумя негласными.

(?>expr)

Сгруппируйтесь атомарно. Не отслеживайте в обратном порядке в группе, чтобы завершить соответствие и не получить лексемы.

'A(?>.*)Z' не совпадает с 'AtoZ', несмотря на то, что 'A(?:.*)Z' делает. Используя атомарную группу, Z получен с помощью .* и не повторно сканируется.

(expr1|expr2)

Совпадайте с выражением expr1 или выражение expr2.

Если существует соответствие с expr1, затем expr2 проигнорирован.

Можно включать ?: или ?> после вводной круглой скобки, чтобы подавить лексемы или группу атомарно.

'(let|tel)\w+' распознает слова, которые запускаются с let или tel.

Привязки

Привязки в выражении совпадают с началом или концом входного текста или слова.

Привязка

Соответствует...

Пример

^expr

Начало входного текста.

'^M\w*' распознает слово начиная с M в начале текста.

expr$

Конец входного текста.

'\w*m$' слова соответствий, заканчивающиеся m в конце текста.

\<expr

Начало слова.

'\<n\w*' распознает любые слова начиная с n.

expr\>

Конец слова.

'\w*e\>' соответствия любые слова, заканчивающиеся e.

Утверждения Lookaround

Утверждения Lookaround ищут шаблоны, которые сразу предшествуют или следуют за намеченным соответствием, но не являются частью соответствия.

Указатель остается в текущем местоположении и символах, которые соответствуют test выражение не получено или отброшено. Поэтому предварительные утверждения могут совпадать с перекрывающимися группами символов.

Утверждение Lookaround

Описание

Пример

expr(?=test)

Предусмотрите для символов то соответствие test.

'\w*(?=ing)' условия соответствий, которые сопровождаются ing, такой как 'Fly' и 'fall' во входном тексте 'Flying, not falling.'

expr(?!test)

Смотрите вперед для символов, которые не совпадают с test.

'i(?!ng)' экземпляры соответствий буквы i это не сопровождается ng.

(?<=test)expr

Оглянитесь для символов то соответствие test.

'(?<=re)\w*' условия соответствий, которые следуют за 're', такой как 'new'Использование, и 'cycle' во входном тексте 'renew, reuse, recycle'

(?<!test)expr

Оглянитесь для символов, которые не совпадают с test.

'(?<!\d)(\d)(?!\d)' совпадает с одноразрядными числами (цифры, которые не предшествуют или следуют за другими цифрами).

Если вы задаете предварительное утверждение, прежде чем выражение, операция будет эквивалентна логическому AND.

Операция

Описание

Пример

(?=test)expr

Совпадайте с обоими test и expr.

'(?=[a-z])[^aeiou]' согласные соответствий.

(?!test)expr

Совпадайте с expr и не совпадайте с test.

'(?![aeiou])[a-z]' согласные соответствий.

Логические и условные операторы

Логические и условные операторы позволяют вам тестировать состояние данного условия, и затем использовать результат, чтобы определить который шаблон, если таковые имеются, соответствовать затем. Эти операторы поддерживают логический OR, и if или if/else условия.

Условиями могут быть лексемы, lookaround операторы или динамические выражения формы (?@cmd). Динамические выражения должны возвратить логическое или числовое значение.

Условный оператор

Описание

Пример

expr1|expr2

Совпадайте с выражением expr1 или выражение expr2.

Если существует соответствие с expr1, затем expr2 проигнорирован.

'(let|tel)\w+' распознает слова, которые запускаются с let или tel.

(?(cond)expr)

Если условие cond true, затем совпадайте с expr.

'(?(?@ispc)[A-Z]:\\)' совпадает с именем дисковода, таким как C:\, когда работается система Windows®.

(?(cond)expr1|expr2)

Если условие cond true, затем совпадайте с expr1. В противном случае совпадайте с expr2.

'Mr(s?)\..*?(?(1)her|his) \w*' текст соответствий, который включает her когда текст начинается с Mrs, или это включает his когда текст начинается с Mr.

Маркерные операторы

Лексемы являются фрагментами совпадающего текста, который вы задаете путем включения части регулярного выражения в круглых скобках. Можно обратиться к лексеме ее последовательностью в тексте (порядковая лексема) или присвоить имена к лексемам для более легкого обслуживания кода и читаемого выхода.

Порядковый маркерный оператор

Описание

Пример

(expr)

Получите в лексеме символы, которые совпадают с заключенным в нихом выражение.

'Joh?n\s(\w*)' получает лексему, которая содержит фамилию любого человека с именем John или Jon.

\N

Совпадайте с Nлексема th.

'<(\w+).*>.*</\1>' лексемы получений для HTML-тэгов, таких как 'title' из текста '<title>Some text</title>'.

(?(N)expr1|expr2)

Если Nлексема th найдена, затем совпадайте с expr1. В противном случае совпадайте с expr2.

'Mr(s?)\..*?(?(1)her|his) \w*' текст соответствий, который включает her когда текст начинается с Mrs, или это включает his когда текст начинается с Mr.

Названный маркерный оператор

Описание

Пример

(?<name>expr)

Получите в именованной лексеме символы, которые совпадают с заключенным в нихом выражение.

'(?<month>\d+)-(?<day>\d+)-(?<yr>\d+)' создает названные лексемы в течение месяца, дня и года на входной дате формы mm-dd-yy.

\k<name>

Совпадайте с лексемой, упомянутой name.

'<(?<tag>\w+).*>.*</\k<tag>>' лексемы получений для HTML-тэгов, таких как 'title' из текста '<title>Some text</title>'.

(?(name)expr1|expr2)

Если именованная лексема найдена, то совпадайте с expr1. В противном случае совпадайте с expr2.

'Mr(?<sex>s?)\..*?(?(sex)her|his) \w*' текст соответствий, который включает her когда текст начинается с Mrs, или это включает his когда текст начинается с Mr.

Примечание

Если выражение вложило круглые скобки, MATLAB® получает лексемы, которые соответствуют наиболее удаленному набору круглых скобок. Например, учитывая поисковый шаблон '(and(y|rew))', MATLAB создает лексему для 'andrew' но не для 'y' или 'rew'.

Динамические регулярные выражения

Динамические выражения позволяют вам выполнять команду MATLAB или регулярное выражение, чтобы определить текст, чтобы соответствовать.

Круглые скобки, которые заключают динамические выражения, не создают группу фиксации.

Оператор

Описание

Пример

(??expr)

Проанализируйте expr и включайте получившийся термин в выражении соответствия.

Когда проанализировано, expr должен соответствовать полному, действительному регулярному выражению. Динамические выражения, которые используют символ ESC обратной косой черты (\) потребуйте двух обратных косых черт: один для начального парсинга expr, и один для полного соответствия.

'^(\d+)((??\\w{$1}))' определяет сколько символов, чтобы соответствовать путем чтения цифры в начале соответствия. Динамическое выражение заключено во второй набор круглых скобок так, чтобы получившееся соответствие было получено в лексеме. Например, соответствие с '5XXXXX' лексемы получений для '5' и 'XXXXX'.

(??@cmd)

Выполните команду MATLAB, представленную cmd, и включайте выходной параметр, возвращенный командой в выражении соответствия.

'(.{2,}).?(??@fliplr($1))' находит палиндромы, которые являются по крайней мере четырьмя символами долго, такими как 'abba'.

(?@cmd)

Выполните команду MATLAB, представленную cmd, но отбросьте любой выходной параметр, который возвращает команда. (Полезный для диагностирования регулярных выражений.)

'\w*?(\w)(?@disp($1))\1\w*' распознает слова, которые включают двойные буквы (такие как pp), и отображает промежуточные результаты.

В рамках динамических выражений используйте следующие операторы, чтобы задать текст замены.

Заменяющий оператор

Описание

$& или $0

Фрагмент входного текста, который является в настоящее время соответствием

$`

Фрагмент входного текста, который предшествует текущему соответствию

$'

Фрагмент входного текста, который следует за текущим соответствием (используют $'' представлять $')

$N

Nлексема th

$<name>

Названная лексема

${cmd}

Выведите возвратился, когда MATLAB выполняет команду, cmd

Комментарии

'characters'

Описание

Пример

(?#comment)

Вставьте комментарий в регулярное выражение. Текст комментария проигнорирован при соответствии с входом.

'(?# Initial digit)\<\d\w+' включает комментарий и распознает слова, которые начинаются с номера.

Поисковые флаги

Поисковые флаги изменяют поведение для соответствия с выражениями. Альтернатива использованию поискового флага в рамках выражения должна передать option входной параметр.

Флаг

Описание

(?-i)

Совпадайте с регистром (значение по умолчанию для regexp и regexprep).

(?i)

Не совпадайте с регистром (значение по умолчанию для regexpi).

(?s)

Точка соответствия (.) в шаблоне с любым символом (значение по умолчанию).

(?-s)

Точка соответствия в шаблоне с любым символом, который не является символом новой строки.

(?-m)

Совпадайте с ^ и $ метасимволы вначале и конец текста (значение по умолчанию).

(?m)

Совпадайте с ^ и $ метасимволы вначале и конец линии.

(?-x)

Включайте пробелы и комментарии при соответствии (значение по умолчанию).

(?x)

Проигнорируйте пробелы и комментарии при соответствии. Использование и '\#' совпадать с пробелом и # 'characters'.

Выражение, которое изменяет флаг, может появиться любой после круглых скобок, такой как

(?i)\w*

или в круглых скобках и разделенный от флага с двоеточием (:), такой как

(?i:\w*)

Последний синтаксис позволяет вам изменять поведение для части большего выражения.

Типы данных: char | cell | string

Ключевое слово, которое указывает который выходные параметры возвратиться в виде одного из следующих векторов символов.

Выведите ключевое слово

Возвращается

'start' (значение по умолчанию)

Начальные значения индекса всех соответствий, startIndex

'end'

Конечные индексы всех соответствий, endIndex

'tokenExtents'

Запуск и конечные индексы всех лексем

'match'

Текст каждой подстроки, которая совпадает с шаблоном в expression

'tokens'

Текст каждой полученной лексемы в str

'names'

Имя и текст каждой именованной лексемы

'split'

Текст несоответствия с подстроками str

Типы данных: char | string

Параметр поиска в виде вектора символов. Опции появляются в пары: одна опция, которая соответствует поведению по умолчанию и одной опции, которая позволяет вам заменять значение по умолчанию. Задайте только одну опцию от пары. Опции могут появиться в любом порядке.

Значение по умолчанию

Переопределение

Описание

'all'

'once'

Совпадайте с выражением максимально много раз (значение по умолчанию), или только однажды.

'nowarnings'

'warnings'

Отключите предупреждения (значение по умолчанию) или отобразите их.

'ignorecase'

'matchcase'

Проигнорируйте регистр (значение по умолчанию) или случай соответствия.

'noemptymatch'

'emptymatch'

Проигнорируйте нулевые соответствия длины (значение по умолчанию) или включайте их.

'dotall'

'dotexceptnewline'

Точка соответствия с любым символом (значение по умолчанию) или все кроме новой строки (\n).

'stringanchors'

'lineanchors'

Примените ^ и $ метасимволы к началу и концу вектора символов (значение по умолчанию), или к началу и концу линии. Символ новой строки (\n) задает конец линии. Начало линии задано как первый символ или любой символ, который сразу следует за символом новой строки.

'literalspacing'

'freespacing'

Включайте пробелы и комментарии при соответствии (значение по умолчанию), или проигнорируйте их. С freespacingИспользование и '\#' совпадать с пробелом и # 'characters'.

Типы данных: char

Выходные аргументы

свернуть все

Начальные значения индекса каждого соответствия, возвращенного как вектор-строка или массив ячеек, можно следующим образом:

  • Если str и expression оба векторы символов или строковые скаляры, выход является вектором-строкой (или, при отсутствии соответствий, пустого массива).

  • Если любой str или expression массив ячеек из символьных векторов, или массив строк и другой являются вектором символов или строковым скаляром, выход является массивом ячеек векторов-строк. Выходной массив ячеек имеет те же размерности как входной массив.

  • Если str и expression оба массивы ячеек или строковые массивы, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

Конечный индекс каждого соответствия, возвращенного как вектор-строка или массив ячеек, можно следующим образом:

  • Если str и expression оба векторы символов или строковые скаляры, выход является вектором-строкой (или, при отсутствии соответствий, пустого массива).

  • Если любой str или expression массив ячеек из символьных векторов, или массив строк и другой являются вектором символов или строковым скаляром, выход является массивом ячеек векторов-строк. Выходной массив ячеек имеет те же размерности как входной массив.

  • Если str и expression оба массивы ячеек или строковые массивы, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

Информация о соответствиях, возвращенных как числовое, ячейка, строка или массив структур. Информация в выходе зависит от значения, которое вы задаете для outkey, можно следующим образом.

Выведите ключевое слово

Выведите описание

Выведите тип и размерности

'start'

Начальные значения индекса соответствий

Для обоих 'start' и 'end':

  • Если str и expression оба векторы символов или строковые скаляры, выход является вектором-строкой (или, при отсутствии соответствий, пустого массива).

  • Если любой str или expression массив ячеек из символьных векторов, или массив строк и другой являются вектором символов или строковым скаляром, выход является массивом ячеек векторов-строк. Выходной массив ячеек имеет те же размерности как входной массив.

  • Если str и expression оба массивы ячеек или строковые массивы, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

'end'

Конечные индексы соответствий

'tokenExtents'

Запуск и конечные индексы всех лексем

По умолчанию, при возврате всех соответствий:

  • Если str и expression оба векторы символов или строковые скаляры, выход является 1 n массив ячеек, где n количество соответствий. Каждая ячейка содержит m- 2 числовых массива индексов, где m количество лексем в соответствии.

  • Если любой str или expression массив ячеек из символьных векторов или массив строк, выход является массивом ячеек с теми же размерностями как входной массив. Каждая ячейка содержит 1 n массив ячеек, где каждая внутренняя ячейка содержит m- 2 числовых массива.

  • Если str и expression оба массивы ячеек или строковые массивы, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

Когда вы задаете 'once' опция, чтобы возвратить только одно соответствие, выходом является любой m- 2 числовых массива или массив ячеек с теми же размерностями как str и/или expression.

Если лексема ожидается в конкретном индексе N, но не найден, затем MATLAB возвращает степени для той лексемы [N,N-1].

'match'

Текст каждой подстроки, которая совпадает с шаблоном в expression

По умолчанию, при возврате всех соответствий:

  • Если str и expression оба векторы символов или строковые скаляры, выход является 1 n массив, где n количество соответствий.

    Если str вектор символов, затем выход является массивом ячеек из символьных векторов. Если str строковый скаляр, затем выход является массивом строк.

  • Если любой str или expression массив ячеек из символьных векторов, или массив строк и другой являются вектором символов или строковым скаляром, затем выход является массивом ячеек с теми же размерностями в качестве аргумента, который является массивом.

    Если str вектор символов или массив ячеек из символьных векторов, затем выход является массивом ячеек из символьных векторов. Если str массив строк, затем выход является массивом ячеек, в котором каждая ячейка содержит массив строк.

  • Если str и expression оба массивы ячеек или строковые массивы, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

    Если str массив ячеек из символьных векторов, затем так выход. Если str массив строк, затем выход является массивом ячеек, в котором каждая ячейка содержит массив строк.

Когда вы задаете 'once' опция, чтобы возвратить только одно соответствие, выход является или вектором символов, массивом строк или массивом ячеек с теми же размерностями как str и expression.

'tokens'

Текст каждой полученной лексемы в str

По умолчанию, при возврате всех соответствий:

  • Если str и expression оба векторы символов или строковые скаляры, выход является 1 n массив ячеек, где n количество соответствий. Каждая ячейка содержит 1 m массив ячеек соответствий, где m количество лексем в соответствии.

    Если str вектор символов, затем выход является массивом ячеек из символьных векторов. Если str массив строк, затем выход является массивом ячеек, в котором каждая ячейка содержит массив строк.

  • Если любой str или expression массив ячеек из символьных векторов, или массив строк и другой являются вектором символов или строковым скаляром, затем выход является массивом ячеек с теми же размерностями в качестве аргумента, который является массивом. Каждая ячейка содержит 1 n массив ячеек, где каждая внутренняя ячейка содержит 1 m массив.

    Если str вектор символов или массив ячеек из символьных векторов, затем каждая внутренняя ячейка содержит 1 m cellArray. Если str массив строк, затем каждая внутренняя ячейка содержит 1 m массив строк.

  • Если str и expression оба массивы ячеек или строковые массивы, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

    Если str массив ячеек из символьных векторов, затем так выход. Если str массив строк, затем выход является массивом ячеек, в котором самые внутренние ячейки содержат строковые массивы.

Когда вы задаете 'once' опция, чтобы возвратить только одно соответствие, выход является 1 m массив строк, массив ячеек из символьных векторов или массив ячеек, который имеет те же размерности как str и/или expression.

Если лексема ожидается в конкретном индексе, но не найдена, то MATLAB возвращает пустое значение для лексемы, '' для векторов символов или "" для строк.

'names'

Имя и текст каждой именованной лексемы

Для всех соответствий:

  • Если str и expression оба векторы символов или строковые скаляры, выход является 1 n массив структур, где n количество соответствий. Имена полей структуры соответствуют маркерным именам.

  • Если str или expression массив ячеек из символьных векторов, или массив строк и другой являются вектором символов или строковым скаляром. затем выход является массивом ячеек с теми же размерностями в качестве аргумента, который является массивом. Каждая ячейка содержит 1 n массив структур.

  • Если str и expression оба массивы ячеек или строковые массивы, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

'split'

Текст несоответствия с подстроками str

Для всех соответствий:

  • Если str и expression оба векторы символов или строковые скаляры, выход является 1 n массив, где n количество несовпадений.

    Если str вектор символов, затем выход является массивом ячеек из символьных векторов. Если str строковый скаляр, затем выход является массивом строк.

  • Если любой str или expression массив ячеек из символьных векторов, или массив строк и другой являются вектором символов или строковым скаляром, затем выход является массивом ячеек с теми же размерностями как входной массив. Каждая ячейка содержит 1 n массив ячеек из символьных векторов.

    Если str вектор символов или массив ячеек из символьных векторов, затем выход является массивом ячеек из символьных векторов. Если str массив строк, затем выход является массивом ячеек, в котором каждая ячейка содержит массив строк.

  • Если str и expression оба массивы ячеек, у них должны быть те же размерности. Выход является массивом ячеек с теми же размерностями.

    Если str массив ячеек из символьных векторов, затем так выход. Если str массив строк, затем выход является массивом ячеек, в котором каждая ячейка содержит массив строк.

Больше о

свернуть все

Лексемы

Лексемы являются фрагментами совпадающего текста, которые соответствуют фрагментам регулярного выражения. Чтобы создать лексемы, заключите часть регулярного выражения в круглых скобках.

Например, это выражение находит дату формы dd-mmm-yyyy, включая лексемы в течение дня, месяца и года.

str = 'Here is a date: 01-Apr-2020';
expression = '(\d+)-(\w+)-(\d+)';

mydate = regexp(str,expression,'tokens');
mydate{:}
ans = 
    '01'    'April'    '2020'

Можно сопоставить имена с лексемами так, чтобы они более легко идентифицировались:

str = 'Here is a date: 01-Apr-2020';
expression = '(?<day>\d+)-(?<month>\w+)-(?<year>\d+)';

mydate = regexp(str,expression,'names')
mydate = 
      day: '01'
    month: 'Apr'
     year: '2020'

Для получения дополнительной информации смотрите Лексемы в Регулярных выражениях.

Представлено до R2006a